Les agents IA d'Anthropic

Le buzz des agents IA d'Anthropic

Les agents IA d’Anthropic font le dernier buzz en date. Le petit monde de l’intelligence artificielle (IA) s’agite autour de ces « agents » développés par Anthropic, un des principaux concurrents d’OpenAI. Avec le lancement de ces nouveaux modèles capables d’automatiser des tâches variées, notamment via une nouvelle fonctionnalité de “pilotage de PC”, ces innovations captivent autant qu’elles interrogent. Dans un marché en effervescence où la compétition entre les grands acteurs pousse chaque innovation sous les projecteurs, il est essentiel de prendre du recul, de mesurer les avancées, mais aussi d’analyser les coûts et les limites de ces outils.

Descriptions et fonctionnalités : que proposent ces agents ?

Ces modèles Claude 3.5 Haiku et Sonnet répondent chacun à des usages spécifiques. Claude 3.5 Haiku, surnommé le « mini modèle », vise l’optimisation des coûts tout en assurant de hautes performances, notamment en termes de rapidité et d’efficacité énergétique. Ce modèle est intéressant car combiner petite taille et grande efficacité c’est là un aspect stratégique dans le développement de l’IA où l’efficience devient primordiale.

Mais la hype actuelle c’est le modèle Claude 3.5 Sonnet. Il marque un tournant avec sa capacité expérimentale à interagir directement avec le système d’un ordinateur. Grâce à des commandes simples, il peut simuler les actions d’un utilisateur humain, du contrôle de la souris et du clavier jusqu’à l’analyse du contenu affiché à l’écran. Si cette fonctionnalité est pour l’instant réservée aux développeurs, elle ouvre la voie à une automatisation potentielle des tâches répétitives ou spécifiques, une avancée qui pourrait transformer des secteurs entiers, notamment le développement et les tests logiciels.

Un contexte de compétition effrénée

Restons pragmatiques : la course à l’innovation dans l’IA n’est pas qu’une quête de performances ! Elle est aussi – et surtout – un combat pour la notoriété et le financement. Les grands acteurs du secteur, comme Anthropic ou OpenAI, sont engagés dans une triple compétition : ils doivent produire des technologies toujours plus avancées, capter l’attention des entreprises et du public, et attirer des financements pour poursuivre leurs développements. Les lancements de nouveaux modèles, souvent couplés à des levées de fonds, en sont l’illustration. Ces annonces, à grand renfort de communication, visent ainsi autant à marquer une avancée technologique qu’à capter l’attention des investisseurs.

Dans ce contexte, il est prudent de rester sinon sceptique du moins rationnel face aux effets d’annonce. L’engouement suscité par les nouvelles fonctionnalités peut être trompeur. Comme dans tout secteur technologique en plein essor, l’excitation générée par le buzz peut parfois masquer des limites réelles, notamment en matière de performances et de coûts.

Pour évaluer les capacités réelles des agents d’IA comme ceux d’Anthropic, il peut être utile de les comparer à des outils plus anciens. Depuis des années, les macros Excel permettent déjà l’automatisation de tâches répétitives. Ceux qui ont expérimenté savent que l’on peut voir son écran se mettre à jour, les cellules changer de valeur de manière automatique. Certes avec une macro on est proche d’un simple automate et avec l’IA on peut laisser une marge de manœuvre à la machine. Mais l’effet visuel pas mal commenté on connait déjà ! Alors oui ! Les agents Claude d’Anthropic sont bien plus sophistiqués et disposent d’une certaine capacité d’adaptation en fonction du contexte. Mais l’essence même de leur fonctionnement reste proche de l’automatisation. La notion de prise de contrôle des machines est ici largement exagérée. Les agents Claude peuvent interpréter des commandes de manière plus flexible, ils ne possèdent aucune intelligence véritable ni volonté autonome. En les testant, les utilisateurs constatent rapidement les limites de ces agents en termes de compréhension contextuelle et de précision.

Typiquement, il est désormais possible, via l’API développeurs de Claude, de demander à l’IA de remplir automatiquement un formulaire à partir d’informations présentes dans des documents Excel, le CRM de l’entreprise ou Internet. L’IA est encore limitée dans ses actions PC et certaines choses évidentes comme le scrolling d’une page Web ou l’utilisation du Zoom lui posent encore des difficultés. Mais le modèle va rapidement s’améliorer.

Loïc Duval, article sur www.informatiquenews.fr

Des coûts de fonctionnement élevés

Si ces technologies suscitent un vif intérêt, il est crucial d’en évaluer le coût. Selon l’analyste Peter Gostev, l’utilisation des agents d’Anthropic s’élèverait à environ 20 dollars de l’heure, une somme conséquente qui freine immédiatement toute idée d’adoption à grande échelle. Ce montant, supérieur au salaire minimum dans de nombreux pays, interroge sur la viabilité économique de ces outils dans leur état actuel. Pour être adoptés dans un cadre professionnel de manière plus généralisée, des optimisations importantes sont nécessaires afin de réduire les coûts de fonctionnement. L’équilibre entre coût et efficacité reste donc un point d’attention majeur pour les entreprises envisageant l’intégration de ces agents.

Les agents d’Anthropic, incarnés par les modèles Claude 3.5 Haiku et Sonnet, représentent indéniablement une avancée technologique. Cependant, leurs performances et leurs coûts actuels limitent leur adoption. Est-ce que la piste de ces LLM très gourmants qui ont besoin d’un nombre affolant de copie d’écran pour agir sont la solution ? Je ne le pense pas, ce qu’il faut c’est sans doute un petit modèle, compact pas énergivore qui puisse – car spécialisé – nous aider dans certaines de nos tâches, mais pas toutes nos tâches.

Mais nous avons une marge de progression telle que ces technologies vont parvenir à réduire leurs coûts de fonctionnement tout en augmentant leur efficacité. Et cela va transformer notre rapport aux outils numériques. Pour l’heure, l’optimisme doit être tempéré par une analyse réaliste de leurs capacités et des contraintes qu’elles imposent.

Les réponses aux questions posées dans ce questionnaire sont nécessaires et seront utilisées uniquement pour répondre à votre demande de contact. Les informations recueillies sont destinées exclusivement à la société Absilis (propriétaire du site iaenaction.fr), responsable du traitement de ces données. Conformément au Règlement Général sur la Protection des Données (RGPD), vous disposez des droits d’accès, de rectification, et de suppression des informations qui vous concernent. Vous avez également le droit de retirer votre consentement au traitement de vos données à tout moment, ce qui inclut le droit de demander que nous cessions de vous contacter si vous avez opté pour cette possibilité. Pour exercer ces droits ou pour toute question sur le traitement de vos données, vous pouvez contacter Absilis par email à contact @ absilis.fr. Nous nous engageons à garantir la sécurité et la confidentialité de vos données personnelles. Aucune information n’est publiée, échangée, transférée, cédée ou vendue à des tiers sans votre autorisation explicite. Seule l’hypothèse du rachat d’Absilis et de ses droits autoriserait la transmission de ces informations à l’éventuel acquéreur qui serait également tenu de la même obligation de conservation et de modification des données. Nous vous remercions pour votre confiance.