Reconstruire Alexa : comment Amazon mélange modèles, agents et navigateur pour une IA plus intelligente

Inscrivez-vous à nos newsletters quotidiennes et hebdomadaires pour recevoir les dernières mises à jour et du contenu exclusif sur la couverture de l'IA de pointe. En savoir plus
Amazon mise sur l'interopérabilité des agents et le mélange de modèles pour rendre son nouvel assistant vocal Alexa plus efficace, en réorganisant son assistant vocal phare avec des capacités d'agent et des tâches d'utilisation du navigateur.
Cette nouvelle Alexa a été rebaptisée Alexa+, et Amazon souligne que cette version « en fait plus ». Par exemple, elle peut désormais informer de manière proactive les utilisateurs si un nouveau livre de leur auteur préféré est disponible ou si leur artiste préféré est en ville, et même leur proposer d’acheter un billet. Alexa+ raisonne à travers des instructions et fait appel à des « experts » dans différentes bases de connaissances pour répondre aux questions des utilisateurs et effectuer des tâches telles que « Où se trouve la pizzeria la plus proche du bureau ? Mes collègues l’apprécieront-ils ? Faites une réservation si vous pensez qu’ils l’apprécieront. »
En d’autres termes, Alexa+ combine des agents d’IA, des capacités d’utilisation d’ordinateurs et des connaissances qu’il apprend de l’écosystème Amazon plus large pour être ce qu’Amazon espère être un assistant vocal domestique plus performant et plus intelligent.
Alexa+ fonctionne actuellement sur les modèles Nova d'Amazon et les modèles d' Anthropic . Cependant, Daniel Rausch, vice-président d'Amazon pour Alexa et Echo, a déclaré à VentureBeat que l'appareil restera « indépendant du modèle » et que l'entreprise pourrait introduire d'autres modèles (au moins des modèles disponibles sur Amazon Bedrock ) pour trouver celui qui convient le mieux à l'accomplissement des tâches.
« Il s’agit de choisir les bonnes intégrations pour réaliser une tâche, de déterminer le type d’instructions approprié, ce qu’il faut pour réellement réaliser la tâche, puis d’orchestrer le tout », a déclaré Rausch. « Ce qu’il faut comprendre, c’est qu’Alexa continuera d’évoluer avec les meilleurs modèles disponibles sur Bedrock. »
Le mélange de modèles ou le routage de modèles permettent aux entreprises et aux autres utilisateurs de choisir le modèle d'IA approprié à exploiter requête par requête. Les développeurs se tournent de plus en plus vers le mélange de modèles pour réduire les coûts. Après tout, il n'est pas nécessaire de répondre à chaque question par un modèle de raisonnement ; certains modèles exécutent mieux certaines tâches.
AWS , l'unité cloud et IA d'Amazon, est depuis longtemps un partisan du mélange de modèles. Récemment, elle a annoncé une fonctionnalité sur Bedrock appelée Intelligent Prompt Routing , qui oriente les invites vers le meilleur modèle et la meilleure taille de modèle pour résoudre la requête.
Et cela pourrait fonctionner. « Je peux vous dire que je ne peux pas dire pour une réponse donnée d'Alexa sur une tâche donnée quel modèle elle utilise », a déclaré Rausch.
Selon Rausch, Alexa+ permet de réunir les agents de trois manières différentes. La première est l'API traditionnelle ; la deuxième consiste à déployer des agents capables de naviguer sur des sites Web et des applications comme Computer Use d'Anthropic ; la troisième consiste à connecter des agents à d'autres agents.
« Mais au cœur de tout cela, orchestrant tous ces différents types d’expériences, se trouvent ces LLM de base, très performants et à la pointe de la technologie », a déclaré Rausch.
Il a ajouté que si une application tierce possède déjà son propre agent, cet agent peut toujours parler aux agents travaillant à l'intérieur d'Alexa+ même si l'agent externe a été construit à l'aide d'un modèle différent.
Rausch a souligné que l'équipe Alexa utilisait les outils et la technologie de Bedrock, notamment les nouveaux outils d'orchestration multi-agents .
Mike Krieger, directeur des produits d'Anthropic, a déclaré à VentureBeat que même les versions antérieures de Claude ne pourront pas accomplir ce que Alexa+ souhaite.
« La démonstration nous donne une idée très intéressante de la question "Pourquoi maintenant ?", car les modèles se sont bien sûr améliorés », a déclaré Krieger. « Mais si vous essayez de faire cela avec Sonnet 3.0 ou nos modèles de niveau 3.0, je pense que vous aurez du mal à utiliser plusieurs outils différents en même temps. »
Bien que ni Rausch ni Krieger n'aient voulu confirmer quel modèle Anthropic spécifique Amazon a utilisé pour construire Alexa+, il convient de souligner qu'Anthropic a publié Claude 3.7 Sonnet lundi, et qu'il est disponible sur Bedrock.
De nombreux utilisateurs ont eu leur premier contact avec l’IA grâce à des assistants vocaux comme Alexa, Google Home ou même Siri d’Apple. Ces derniers permettent aux utilisateurs d’externaliser certaines tâches, comme allumer les lumières. Je ne possède pas d’appareil Alexa ou Google Home, mais j’ai découvert à quel point il pouvait être pratique d’en avoir un lors d’un séjour à l’hôtel récemment. Je pouvais dire à Alexa d’arrêter l’alarme, d’allumer les lumières et d’ouvrir un rideau tout en étant encore sous les couvertures.
Mais alors qu’Alexa, les appareils Google Home et Siri sont devenus omniprésents dans la vie des gens, ils ont commencé à montrer leur âge lorsque l’IA générative est devenue populaire. Soudain, les gens voulaient des réponses plus en temps réel de la part des assistants IA et exigeaient des résolutions de tâches plus intelligentes, comme l’ajout de plusieurs réunions à des calendriers sans avoir besoin de beaucoup d’aide.
Amazon a admis que l'essor de l'IA de nouvelle génération, en particulier des agents, a permis à Alexa d'atteindre enfin son potentiel.
« Jusqu'à présent, nous étions limités par la technologie dans ce que pouvait être Alexa », a déclaré Panos Panay, vice-président senior des appareils et services d'Amazon, lors d'une démonstration.
Rausch a déclaré que l’espoir est qu’Alexa+ continue de s’améliorer, d’ajouter de nouveaux modèles et, espérons-le, de mettre davantage de personnes à l’aise avec ce que la technologie peut faire.
Si vous souhaitez impressionner votre patron, VB Daily a tout ce qu'il vous faut. Nous vous donnons un aperçu de ce que font les entreprises avec l'IA générative, des changements réglementaires aux déploiements pratiques, afin que vous puissiez partager vos idées pour un retour sur investissement maximal.
Lisez notre politique de confidentialité
Merci de vous être abonné. Découvrez d'autres newsletters VB ici .
Une erreur s'est produite.

venturebeat