OpenAI a annoncé la sortie de GPT-5.5, son dernier modèle phare, améliorant les capacités d'agent, la précision du codage et l'utilisation autonome de l'ordinateur. Ce modèle avancé est désormais accessible aux utilisateurs de ChatGPT Plus, Pro, Business et Enterprise via ChatGPT et Codex. Les abonnés aux plans de niveau supérieur verront également GPT-5.5 Pro être déployé prochainement.

La mise à jour

GPT-5.5 démontre des améliorations significatives dans des domaines clés, y compris les fonctionnalités d'agent et le codage. Le modèle vise à fournir une assistance plus sophistiquée pour les tâches complexes, en faisant un outil puissant pour les professionnels et les développeurs. Sa disponibilité dans les produits populaires d'OpenAI marque une avancée majeure dans l'accessibilité de l'IA.

Ce qui fonctionne

Dans les tests de performance, GPT-5.5 a obtenu un score de 84,9 % sur GDPval pour le travail intellectuel dans 44 professions et 78,7 % sur OSWorld-Verified pour l'utilisation autonome de l'ordinateur. Il a également obtenu un score impressionnant de 98,0 % sur Tau2-bench Telecom pour les flux de travail complexes du service client sans aucun ajustement d'invite. De plus, GPT-5.5 surpasse les versions précédentes et les concurrents comme Opus d'Anthropic et Gemini Pro de Google dans les tâches de programmation nécessitant de la planification, l'utilisation d'outils et le développement itératif. Cela en fait un outil très performant pour les Agents & Assistants IA. Pour les développeurs, GPT-5.5 intégré à Codex promet des résultats plus précis en un seul passage, une meilleure préservation du contexte et une gestion améliorée des scénarios de débogage ambigus.

Ce qui ne fonctionne pas

Bien que les benchmarks montrent des avancées significatives, l'étendue complète des capacités et des limitations de GPT-5.5 dans des environnements réels et non structurés nécessitera des tests supplémentaires. La structure tarifaire, avec 5 $ par million de jetons d'entrée et 30 $ par million de jetons de sortie, pourrait également être une considération pour les projets plus petits ou les utilisateurs individuels. Cependant, la fenêtre de contexte d'un million de jetons offre une capacité substantielle pour les tâches complexes, et des réductions sont disponibles via le traitement par lots (Batch) et flexible (Flex), ce qui pourrait atténuer les coûts pour une utilisation intensive.

Verdict

GPT-5.5 d'OpenAI représente un bond substantiel dans la technologie de l'IA, en particulier pour le codage et les opérations autonomes. Ses solides performances à travers divers benchmarks et ses fonctionnalités améliorées dans Codex en font une mise à niveau convaincante pour les utilisateurs existants et une nouvelle option puissante pour ceux qui recherchent une assistance IA avancée. Cette version consolide la position d'OpenAI dans le domaine des Outils d'écriture IA et au-delà.