Anthropic dévoile Claude 2.1 avec une fenêtre contextuelle de 200 000 et plus

Posted on


Anthropic, la startup de sécurité de l’IA fondée par Dario Amodei et Daniela Amodei, a publié une mise à jour majeure de son assistant d’IA conversationnel Claude. Baptisée Claude 2.1, cette nouvelle version est dotée d’une suite d’améliorations qui poussent Claude encore plus loin au-delà des capacités des chatbots comme ChatGPT.

Une fenêtre contextuelle massive de 200 000 améliore la précision

La fonctionnalité principale de Claude 2.1 est la fenêtre contextuelle améliorée, désormais étendue à 200 000 jetons. Cela permet à Claude de référencer et de « mémoriser » jusqu’à 200 000 mots ou 500 pages de conversations antérieures lors de la formulation de réponses.

En disposant de beaucoup plus d’histoire et de contexte conversationnel, Claude peut réduire considérablement les cas de confusion, de contradiction et d’hallucination. Anthropic affirme que Claude 2.1 présente une baisse de 2 fois des taux d’hallucinations globaux par rapport à la version précédente.

En savoir plus : Comment utiliser le chatbot IA Claude 2

La taille même de cette fenêtre contextuelle de 200 000 dépasse de loin celle de tout autre chatbot à ce jour. Et cela se voit dans la précision et la clarté améliorées des réponses de Claude. Lorsque les utilisateurs posent des questions plus complexes en plusieurs parties, Claude peut faire référence en profondeur à des déclarations antérieures au lieu de perdre la trace du contexte.

30 % d’erreurs en moins et des taux d’erreur 3 à 4 fois inférieurs

En plus de la fenêtre contextuelle renforcée, Anthropic a concentré le travail d’ingénierie de Claude 2.1 sur la minimisation directe des erreurs factuelles, des réponses incorrectes et des conclusions erronées.

Des tests internes montrent que Claude 2.1 commet 30 % d’erreurs factuelles en moins par rapport à la version 2.0. De plus, les taux de réponses incorrectes sont globalement 3 à 4 fois inférieurs.

Ces gains de précision démontrent que Anthropic se concentre au-delà de la simple échelle, mais qu’elle améliore en réalité la fiabilité et la véracité fondamentales des systèmes d’IA. Alors que les chatbots comme ChatGPT semblent halluciner avec une fréquence relative, Claude s’en tient fermement à la réalité.

L’intégration d’un nouvel outil permet d’accéder aux calculatrices, aux API et bien plus encore

Claude 2.1 introduit une fonctionnalité bêta appelée Tool Use, qui permet à l’assistant d’intégrer des outils externes, des sources de données et des API privées dans ses réponses.

Par exemple, Claude peut désormais utiliser les calculatrices pour résoudre directement les problèmes mathématiques posés par les utilisateurs, au lieu de simplement décrire la solution théorique. Il peut consommer des résultats sportifs, des bulletins météorologiques et d’autres données en temps réel via des appels API au lieu d’essayer de deviner ou d’inventer des réponses.

Claude peut même extraire des données de bases de données privées pour lesquelles il dispose d’autorisations d’accès spéciales afin de fournir des réponses précises et factuelles. Et il peut également effectuer des actions de base au sein des systèmes logiciels via des déclencheurs API.

Cette intégration d’outils aide Claude à s’ancrer dans la réalité, en lui donnant accès aux mêmes ressources d’assistance qu’un expert humain utiliserait pour répondre aux questions.

Mises à niveau de l’expérience du développeur – Workbench et invites système

Alors que les utilisateurs finaux apprécieront la précision et les capacités accrues de Claude, Claude 2.1 inaugure également des mises à niveau spécifiquement axées sur l’expérience des développeurs.

Il s’agit notamment d’un nouveau produit Workbench permettant d’itérer plus rapidement les invites Claude pendant les cycles de formation et de développement. Workbench permet aux ingénieurs d’Anthropic de tester et d’affiner les compétences de Claude plus simplement et plus rapidement.

De plus, les développeurs peuvent désormais fournir à Claude des invites système personnalisées avec des instructions claires pour aider à guider son comportement dans des situations spécifiques. Au lieu de s’appuyer uniquement sur une formation via des exemples de conversations, les ingénieurs peuvent donner à Claude des règles descendantes directes sur la façon de se comporter à l’aide des invites du système.

Le prix reste conforme à Claude 2.0

Jusqu’à présent, Anthropic n’a travaillé qu’avec des partenaires sélectionnés pour tester Claude, facturant 0,60 $ par invite et 1,80 $ pour chaque achèvement.

Avec Claude 2.1, ils augmentent le prix à 1,60 $ par invite et à 4,80 $ par achèvement pour tenir compte du travail d’ingénierie important requis pour prendre en charge une fenêtre de contexte aussi vaste.

Cependant, Anthropic souligne que la tarification de Claude restera pour l’instant cohérente avec la version 2.0. Les coûts accrus indiqués ci-dessus représentent des niveaux de prix potentiels futurs, car la prise en charge des capacités étendues de Claude à grande échelle nécessite une immense puissance de calcul.

Cependant, pour les partenaires impliqués dans les premiers projets pilotes, Anthropic s’en tient au modèle de tarification précédent lorsqu’ils recueillent les commentaires des utilisateurs sur Claude 2.1.

Conclusion

Avec des fonctionnalités telles que la fenêtre contextuelle révolutionnaire de 200 000 jetons, Claude 2.1 représente la pointe de l’IA conversationnelle. Anthropic continue de repousser les limites de l’exactitude, de la véracité et de la compréhension que les chatbots issus d’écuries moins soigneusement conçues ne peuvent que rêver d’atteindre sous leurs formes actuelles.

Claude 2.1 constitue une réalisation impressionnante pour l’équipe d’Anthropic, démontrant son approche rigoureuse du développement étape par étape de systèmes d’IA sûrs et fiables. S’ils parviennent à perfectionner et à produire des fonctionnalités telles que la fenêtre contextuelle massive, Claude pourrait établir une nouvelle barre pour l’ensemble de l’industrie. Pour l’instant cependant, les entreprises doivent postuler à des partenariats pilotes à accès anticipé si elles veulent avoir un aperçu de l’avenir des interfaces de chatbot.

🌟 Vous avez des questions brûlantes sur Claude 2.1 ? Besoin d’un peu d’aide supplémentaire avec les outils d’IA ou autre chose ?

💡 N’hésitez pas à envoyer un e-mail à Govind, notre expert chez OpenAIMaster. Déposez vos questions à support@openaimaster.com et Govind se fera un plaisir de vous aider !

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *