Erste Begegnung mit Alexa+ und Emerson Sklar

Alexa+ in Deutschland

Vor wenigen Tagen hatte ich die besondere Gelegenheit, mich in München persönlich mit Emerson Sklar, dem Chief Evangelist für Alexa bei Amazon, auszutauschen. Wir kennen uns online schon länger, aber sein Besuch in München machte eine persönliche Begegnung möglich. Er hatte einen echten Echo Show 21 im Gepäck, so dass wir nicht nur diskutieren, sondern auch konkret ausprobieren konnten, was uns mit der nächsten Evolutionsstufe von Alexa bevorsteht.

Dieses Gespräch war weit mehr als ein kurzer Austausch über neue Features. Es war ein tiefer technischer Einblick in die strategische Neuausrichtung von Alexa, insbesondere im Hinblick auf generative KI, Interaktionsdesign und Entwicklerfreundlichkeit.

Programmiermodelle

Die größte Veränderung aus der Entwicklerperspektive: Alexa+ ersetzt das bekannte Intent-Modell durch ein deklaratives Skill-Modell. Statt „Sample Utterances“ und „Custom Intents“ definieren Entwickler künftig Master Prompts, die den Zweck eines Skills beschreiben - ergänzt durch repräsentative Dialogbeispiele und optionale API-Deklarationen.

Prototypen sind damit schnell gebaut - wie man dann am Feinschliff arbeiten kann, das wird man sehen müssen.

Emerson stellte noch zwei alternative Entwicklungsmodelle vor:

  1. Nova Act: KI-gestützte Webinteraktionen

Nova Act präsentiert sich als eine Art Assistenzmodell, das Webinteraktionen wie das Ausfüllen von Formularen, das Klicken auf Schaltflächen oder das Navigieren durch Seiteninhalte eigenständig durchführen kann.

Das Ziel: Alexa soll in der Lage sein, Services zu nutzen, für die es keine native API gibt. Das öffnet völlig neue Anwendungsfelder - etwa für kleine Anbieter oder Legacy-Systeme.

  1. Agent-Based Execution Model

Bei diesem Modell geht es noch einen Schritt weiter: Alexa+ kann autonome Agenten einsetzen, die komplexe Aufgaben mehrstufig und selbstständig abarbeiten können - mit interner Planung, Zwischenschritten, Bedingungsprüfungen und ggf. Rückfragen an den Nutzer.

Für uns Entwickler bedeuten diese neuen Ansätze vor allem Abschied nehmen von dem Programmiermodell, das wir seit Jahren kennen und eine völlig neue Denkweise beim Skill-Design.

Klassische Skills werden wir nicht migrieren können, alle angekündigten Programmiermodelle unterscheiden sich grundsätzlich von dem, was wir früher verwendet haben.

Migration bedeutet de facto Neuentwicklung.

Wichtig: klassische Skills wird man aber weiter über ihren Invocation Name aufrufen können.

Lokalisierung: Mehr als nur Sprache übersetzen

Wann werden wir Alexa+ in Deutschland sehen? Emerson hielt sich hier bedeckt, machte aber deutlich, dass wir mit einer ähnlichen Reihenfolge rechnen können wie bei der internationalen Einführung von Alexa.

Er machte dabei klar, dass Alexa+ nicht einfach nur übersetzt wird - die Systeme müssen stets auch kulturell angepasst werden. Beispiel: Ein Skill, der in den USA gut funktioniert, braucht in Deutschland nicht nur eine andere Sprache, sondern auch andere Erwartungen an Tonalität, Direktheit und Struktur. Aus diesem Grund macht eine Einführung für die Locale GB auch kaum weniger Arbeit als für FR.

Nutzerprofile, Personalisierung & Kontinuität

Wir werden Alexa+ in der Verwendung als wesentlich „kontextbewusster“ erleben. Emerson bestätigte, dass Skills künftig mit Nutzerprofilen arbeiten können - also zwischen verschiedenen Familienmitgliedern, Vorlieben oder Gerätekontexten unterscheiden.

Beispiel: Wenn ich als Nutzer regelmäßig vegetarische Rezepte aufrufe, wird Alexa sich das merken und mir im passenden Kontext gezielt solche Inhalte vorschlagen.

Konversationen können auch auf einem anderen Gerät fortgesetzt werden. Der Nutzer muss nicht immer wieder von vorne beginnen.

Diese kontinuierliche Personalisierung macht Skills relevanter und nützlicher im Alltag.

Alexa.com wird zur zentralen Verwaltungsoberfläche

Mit dem Start von Alexa+ wird alexa.com zur zentralen Plattform für die Verwaltung aller Alexa-bezogenen Inhalte ausgebaut - einschließlich Interaktionen, Personalisierung, verknüpfter Dienste und möglicherweise auch Skill-Konfigurationen.

Amazon hat bereits bestätigt, dass sowohl alexa.com als auch die aktualisierte Alexa-App eine Schlüsselrolle im neuen Ökosystem spielen werden. Nutzer können dort Sprachinteraktionen einsehen, Einstellungen anpassen, Profile verwalten und auf per Sprache gestartete Dienste oder Dokumente zugreifen. Ein Beispiel: Eine per Sprache begonnene Lebensmittelbestellung auf einem Echo-Gerät kann später am Desktop weiterbearbeitet werden.

Diese Zentralisierung ist ein logischer Schritt. Sie reduziert Reibungsverluste, verbessert die Geräte-übergreifende Bedienbarkeit und schafft Transparenz - ein häufig geäußerter Wunsch von Nutzern und Entwicklern. Aus meiner Sicht wird Alexa damit nicht nur als Sprachassistent, sondern als plattformübergreifender, multimodaler Alltagsbegleiter weiterentwickelt.

Zertifizierung & Qualitätssicherung

Ein wichtiges Thema für viele Entwickler ist Zertifizierung:

Laut Emerson wird Amazon das Review-Verfahren verschärfen - aus Kundensicht im positiven Sinne. Alexa+ soll nur solche Skills hervorheben, die klaren Mehrwert bieten, stabil funktionieren und vertrauenswürdig sind. Wir wissen alle, dass viele unsinnige Skills den Ruf von Alexa eher beschädigen, als dass sie das Angebot nutzbringend erweitern.

Das Ziel ist natürlich Vertrauen. Alexa+ soll verlässlicher und professioneller wirken - sowohl für Endnutzer als auch für Unternehmen.

Problem für Entwickler: es kann in Zukunft noch häufiger passieren, dass wir viel Arbeit in einen Skill investieren und dieser dann abgelehnt wird. Aktuell ist keine Möglichkeit vorgesehen, dass wir uns ein Konzept oder eine Idee vorher absegnen lassen können, bevor wir mit der Entwicklung starten.

Visuelle Elemente in Dialoge integrieren

Ein Thema, das mir als Entwickler besonders am Herzen liegt, ist der Umgang mit der Alexa Presentation Language (APL) im Kontext von Alexa+. In der Vergangenheit war APL ein mächtiges Werkzeug, um visuelle Erlebnisse auf Echo Show-Geräten individuell zu gestalten - von dynamischen Layouts bis hin zu Animationen und Touch-Interaktionen. Viele meiner Skills setzen APL aktiv ein.

Mit dem Aufkommen von Alexa+ wird sich die Rolle von APL aber verändern. Emerson machte deutlich: In der initialen Phase liegt der Fokus ganz klar auf Sprachinteraktionen. Das bedeutet konkret: APL wird zum Launch von Alexa+ nicht vollumfänglich unterstützt, die Diskussion zu diesem Thema scheint auch Amazon-intern noch nicht abgeschlossen zu sein.

Aktuell ist APL nach wie vor das zentrale Element für Skills mit starker UI-Komponente - etwa in den Bereichen E-Commerce, Bildung, Kochrezepte oder Multimedia. Ohne kontrollierbare visuelle Ausgabe besteht die Gefahr, dass Skills beliebig wirken oder gar an Interaktivität verlieren.

Ich hoffe, dass Amazon hier nachliefert - idealerweise mit einer hybriden Lösung, die vielleicht:

  • promptbasiertes High-Level-Layout ermöglicht („erstelle eine horizontale Galerie mit zehn Bildern“)
  • aber auch optionalen Low-Level-Zugriff auf Komponenten bietet
  • und APL-Inhalte besser mit semantischem Sprachkontext verknüpft

Ein klarer Fahrplan zur Zukunft von APL unter Alexa+ wäre wünschenswert. Vielleicht werden wir aber auch erleben, dass APL durch HTML-Derivate abgelöst wird.

Monetarisierung: Skills mit echten Geschäftsmodellen

Da In-Skill Purchasing (ISP) in Alexa+ (zumindest aktuell) keine zentrale Rolle spielt, funktioniert Monetarisierung künftig erst einmal über Konto-Verknüpfungen mit externen Services.

Fazit: Der nächste Schritt für Voice Developer

In dem Gespräch mit Emerson ist deutlich geworden: Alexa+ ist kein inkrementelles Update - es ist ein Paradigmenwechsel:

  • KI statt starrer Regeln
  • Prompts statt Intents
  • Personalisierung statt Standarddialoge

Für Entwickler eröffnen sich neue Chancen - vorausgesetzt, man ist bereit, sich auf Prompt Engineering, API-Modularisierung und UX-zentrierte Konversationen einzulassen. Meine Erwartung ist, dass die Entwicklung von Skills in Zukunft aus technischer Perspektive mehr Spaß machen wird.

Nutzer- und Entwickleraktivierung bleibt entscheidend

Aber werden die neuen Skills auch ihre Nutzer finden? Skill discoverability war schon immer ein Problem. Wird das besser werden? Alexa+ kostet Geld oder benötigt ein Amazon-Prime-Abo. Zusätzlich setzen all die neuen Fähigkeiten von Alexa+ ein explizites Opt-in durch den Nutzer voraus.

Die Realität gerade im deutschen Markt erlebe ich zusätzlich so:

  • Viele Nutzer sind zurückhaltend, wenn es um das Teilen persönlicher Daten oder das Aktivieren neuer KI-Funktionen geht.
  • Datenschutzbedenken - gerade im deutschsprachigen Raum - wirken stark hemmend auf die Akzeptanz.
  • Wenn Alexa+ nur dann sein volles Potenzial entfaltet, wenn Nutzer einer erweiterten Datennutzung zustimmen, entsteht ein Zielgruppenfilter, der die Reichweite vieler Skills begrenzen könnte.
  • Sind genug Anwender dazu bereit, zusätzlich monatlich Geld auszugeben für eine Alexa+ -Erfahrung?

Solange nicht klar ist, wie breit Alexa+ unter diesen Bedingungen überhaupt seine Nutzerbasis finden wird, bleibt die wirtschaftliche Tragfähigkeit vieler Use Cases ungewiss.

Und die Entwicklergemeinschaft? Als Alexa vor einigen Jahren in Deutschland startete, investierte Amazon massiv in die Community: Entwickler erhielten kostenlose Geräte, es gab Meetups mit warmem Buffet und regelmäßig stattfindende Hackathons. Einige der damals verteilten Geräte liegen bei mir noch originalverpackt im Regal.

Ob Amazon für Alexa+ ähnliche Maßnahmen plant, ist derzeit unklar. Eine gezielte Ansprache bestehender Nutzer und Entwickler wäre jedoch essenziell, um die neuen Möglichkeiten sichtbar zu machen - insbesondere für Besitzer älterer Echo-Geräte.

Ohne aktive Kommunikation und gezielte Unterstützung besteht die Gefahr, dass viele Nutzer von den erweiterten Fähigkeiten von Alexa+ nichts mitbekommen. Auch für Entwickler ist der Einstieg nur dann sinnvoll, wenn eine ausreichend große und interessierte Zielgruppe absehbar ist. Ohne diese Sichtbarkeit wird es schwer, Investitionen in neue Skills zu rechtfertigen.

Hinweis: Dieser Beitrag reflektiert meine persönlichen Eindrücke aus dem Gespräch mit Emerson Sklar und meiner Interpretation seiner Äußerungen. Es handelt sich nicht um offizielle Aussagen von Amazon.



Erste Begegnung mit Alexa+ und Emerson Sklar
https://boerncke.de/blog/erste-begegnung-mit-alexa-und-emerson-sklar/
Beitragsautor
Dr. Frank Börncke
Urheberrechtshinweis