Smart Speaker „Hallo Magenta“ der Deutschen Telekom (DT)

Durch meine Teilnahme beim Hackathon „Remote Rhapsody“ hatte ich ausführlich Gelegenheit, mich intensiv mit dem Smart Speaker „Hallo Magenta“ der Deutschen Telekom zu beschäftigen.

Durch die Brille eines Alexa-Entwicklers gesehen sind mir die folgenden Punkte aufgefallen:

  • Für Custom Skills ist kein „Invocation Name“ erforderlich, da im Hintergrund mit einem einheitlichen großen Sprachmodell gearbeitet wird. Das Trainieren dieses Modells dauert lange und es drohen Seiteneffekte, wenn ein neuer Skill dazu kommt. Deshalb bin ich etwas skeptisch, inwiefern dieser Ansatz gut skalieren kann, wenn mehr und mehr Skills dazu kommen. Für den Anwender ist es aber natürlich eine tolle Sache, wenn er sich den Namen eines Skills nicht mehr merken muss und er einfach danach fragen kann, was ihn interessiert.

  • Es gibt vordefinierte Domänenmodelle zum Beispiel für Wetter-Skills. Mehrere Custom Skills können so ein und dasselbe Domänenmodell implementieren und der Benutzer hat dann die Wahl, welchen Skill er zum Beispiel zum Thema „Wetter“ einsetzen möchte.

    Das macht es möglich, so etwas zu fragen wie „Magenta, wie wird das Wetter in München?“ statt „Magenta, frage Big Sky wie wird das Wetter in München?“.

  • Ein eingebauter DECT Chip macht es möglich, das Gerät mit einem Telefon-Router zu verknüpfen. Bei mir hat es mit einer FritzBox erfolgreich funktioniert. Damit ist es mir möglich, per Sprachbefehl ein Telefongespräch anzustoßen oder einen Anruf auf meiner Festnetznummer entgegenzunehmen.

  • Eine API für Telefonie macht es möglich, native Anrufe auch von einem Skill aus anzustoßen. Ein möglicher Anwendungsfall ist zum Beispiel ein Help Desk Skill, der den Benutzer nach seiner Situation fragt und dann einen Anruf zu einer passenden Hotline auslöst.

  • Alexa ist in die Geräte „eingebaut“. Abhängig vom Wake-Word werden die Requests zu unterschiedlichen Endpunkten weiter geleitet.
    Ein Level

  • Für die Implementierung von Custom Skills ist ein Python SDK verfügbar (es soll auch ein JAVA API existieren, das habe ich aber nicht testen können). Das SDK nimmt einem die Arbeit mit der JSON-Kommunikation zwischen Gerät und Skill ab. Ein SDK für Node.JS ist (noch?) nicht verfügbar.

  • Um einen Custom Skill zum Laufen zu bringen, muss manuell mit unterschiedlichen Artefakten (Code und JSON)hantiert werden. Eine einheitliche Oberfläche, wie wir sie im Zusammenhang mit Alexa Hosted Skills kennen, existiert für Magenta derzeit nicht

  • Eine Integration in Visual Studio Code existiert nicht.

  • Der Skill kann irgendwo gehostet werden, so lange er nur über eine öffentliche URL erreichbar ist.

  • Besser als bei Alexa: Die Companion App unterstützt „Cards“, bei denen URLs angeklickt werden können.

  • Zum Testen existiert ein Command Line Tool, mit dem ein „Chat“ mit dem eigenen Skill ermöglicht wird.


Smart Speaker „Hallo Magenta“ der Deutschen Telekom (DT)
https://boerncke.de/blog/smart-speaker-hallo-magenta-der-deutschen-telekom-dt/
Beitragsautor
Dr. Frank Börncke
Urheberrechtshinweis