Depuis sa création, ChatGPT n’a cessé d’évoluer. En août 2025, plusieurs innovations majeures redéfinissent l’expérience utilisateur, les capacités multimodales, l’accessibilité, la sécurité et même le bien‑être émotionnel. Voici un panorama détaillé des progrès les plus récents.
1. GPT-5 : le modèle le plus avancé à ce jour
Le 7 août 2025, OpenAI a lancé GPT‑5, sa version la plus avancée à ce jour ; le PDG Sam Altman la décrit comme un pas « significatif » vers l’intelligence artificielle générale (AGI). Altman affirme que GPT‑5 ressemble désormais à un expert universitaire (niveau doctorat).
Multimodalité (texte, voix, image, vidéo)
GPT‑5 renforce considérablement les capacités multimodales. Il peut comprendre et générer du texte, des images, de l’audio et même de la vidéo en temps réel. Contrairement aux systèmes précédents reposant sur des plugins, GPT‑5 intègre ces fonctions de manière fluide dans un seul modèle.
Fenêtres de contexte étendues et routage intelligent
GPT‑5 offre une fenêtre de contexte massive — jusqu’à 400 000 tokens via l’API, et 256 000 dans ChatGPT — permettant de traiter des documents volumineux tout en maintenant la cohérence. Il dispose également d’un système de routage automatique qui ajuste la complexité et le style des réponses selon la requête.
Personnalisation et « Personnalités »
Un des points marquants est l’introduction de personnalités personnalisables, permettant d’adapter le style et le ton de l’IA selon les préférences de l’utilisateur.
Réduction des hallucinations
GPT‑5 améliore la fiabilité des réponses : son taux d’hallucinations est de 1,4 %, inférieur aux 1,8 % de GPT‑4 ou 1,49 % de GPT‑4o, mais légèrement supérieur au GPT‑4.5 Preview (1,2 %). OpenAI indique avoir fait des progrès significatifs pour diminuer les hallucinations, mieux suivre les instructions, et réduire le ton excessivement flatteur (sycophancy).
Modes de fonctionnement : Auto, Fast, Thinking
Trois modes de réponse sont désormais disponibles : Auto (mode par défaut), Fast et Thinking, offrant une flexibilité selon les besoins : rapidité ou raisonnement approfondi.
Mode vocal avancé
Tom’s Guide souligne que GPT‑5 introduit un mode vocal très naturel, adapté à l’état émotionnel de l’utilisateur, accessible à tous, pas seulement aux abonnés Plus. Ce mode ajuste le ton, le rythme et peut maintenir la continuité des conversations entre les sessions.
Analyse multimodale avancée
Le récent Tom’s Guide note que GPT‑5 améliore la compréhension visuelle (graphiques, images) et renforce la mémoire multimodale, rendant l’outil plus efficace pour un usage professionnel ou éducatif.
Usage et adoption
Avec GPT‑5, plus de 5 millions d’utilisateurs payants (Team, Enterprise, Education) utilisent déjà ChatGPT via l’API dans divers secteurs (Amgen, Figma, Morgan Stanley…). De plus, l’outil est intégré à Microsoft Copilot et reste accessible aux utilisateurs gratuits avec certaines limites.
2. Agents autonomes : Deep Research et ChatGPT Agent
Mode Deep Research
Depuis février 2025, ChatGPT intègre un agent nommé Deep Research qui peut parcourir le web, analyser des documents, et produire un rapport sourcé en 5 à 30 minutes. Ce service, basé sur le modèle o3, obtient 26,6 % au benchmark « Humanity’s Last Exam », bien au-dessus de GPT‑4o. En avril, une version “lightweight” est accessible aux utilisateurs gratuits mais les avantages du ChatGPT payant ne sont clairement pas à négliger.
ChatGPT Agent
Dévoilé en juillet 2025, ChatGPT Agent est un agent intelligent capable d’agir de manière proactive sur votre ordinateur, en utilisant divers outils intégrés (navigateur visuel, navigateur texte, générateur d’image, etc.) ; il réalise des tâches complexes de bout en bout, sous supervision utilisateur.
Operator (déprécié)
Avant ChatGPT Agent, OpenAI avait lancé Operator (février 2025) — un agent capable de naviguer sur le web, remplir des formulaires et effectuer des commandes simples. Il est maintenant progressivement remplacé par ChatGPT Agent.
3. Bien-être utilisateur : rappels et détection émotionnelle
OpenAI introduit des fonctionnalités visant à réduire la fatigue numérique et soutenir la santé mentale. Notamment, des rappels incitent les utilisateurs à faire une pause lors de sessions longues. De plus, le système détecte les signes de détresse émotionnelle et, au lieu de fournir des conseils, aide l’utilisateur à réfléchir par lui-même en présentant des pour et contre. OpenAI collabore avec des experts en santé pour affiner ces capacités.
4. Modèles open-source et infrastructure
Modèles open-source GPT-OSS
Début août 2025, OpenAI libère GPT-OSS, une série de modèles open-source (117B et 21B paramètres) sous licence Apache 2.0, proches en performance de o4-mini et o3-mini.
Diversification de l’infrastructure
OpenAI réalise des avancées matérielles : l’acquisition de io, une start-up d’IA fondée par Jony Ive, marque son entrée dans la conception hardware. En juin 2025, OpenAI commence à utiliser les TPU de Google Cloud pour soutenir ChatGPT — un pas vers une infrastructure diversifiée.
5. Bilan et perspectives
Taux d’adoption et enjeux financiers
Plus de 700 millions d’utilisateurs utilisent ChatGPT chaque semaine (tous modes confondus), et OpenAI projette un revenu récurrent annuel (ARR) de 20 milliards $ d’ici fin 2025, avec une valorisation estimée entre 300 et 500 milliards dollars.
Réactions et critiques
Malgré ces avancées, certains experts estiment que GPT‑5 n’est pas une percée révolutionnaire, mais plutôt une évolution incrémentale avec des améliorations pragmatiques. Le lancement controversé de GPT‑5 (suppression initiale de GPT‑4o, bugs, lenteurs) a soulevé quelques critiques : OpenAI a réintroduit l’accès à GPT‑4o suite aux retours négatifs.
Vision de Sam Altman
Lors d’un dîner de presse à San Francisco, le PDG Sam Altman a déclaré que ChatGPT pourrait bientôt surpasser le nombre total de conversations tenues quotidiennement par les humains. Il a également reconnu la bulle spéculative autour de l’IA, tout en soutenant que la technologie sous-jacente reste révolutionnaire.
Conclusion
En août 2025, ChatGPT a franchi une nouvelle étape grâce à GPT-5, un modèle plus fiable, multimodal, doté de personnalisation avancée, avec un contexte étendu et des modes variés. Les fonctionnalités comme Deep Research, ChatGPT Agent, et les mesures pour le bien-être mental renforcent encore son attrait. Le lancement de modèles open-source et l’évolution de l’infrastructure témoignent de sa maturité industrielle. Cependant, les critiques sur l’innovation réelle et les défis techniques subsistent.
