Google's Gemini 3 Deep Think grande mise à jour : des capacités de raisonnement surpassant Opus 4.6, GPT-5.2, pour devenir « l'IA la plus orientée recherche »

動區BlockTempo
BTC-4,39%

Google publie une mise à jour majeure de Gemini 3 Deep Think, qui dépasse largement Claude Opus 4.6 (68,8 %) et GPT-5.2 (52,9 %) avec un score de 84,6 % lors du test ARC-AGI-2, tout en atteignant le niveau de « maître légendaire » sur Codeforces.
(Précédemment : L’émergence du mode d’apprentissage de ChatGPT : crépuscule du tutorat ou l’aube de l’ère dorée de l’éducation ?)
(Contexte supplémentaire : Google lance officiellement « Gemini 3 » ! Quelles sont ses principales innovations pour dominer le classement mondial des IA les plus intelligentes ?)

Table des matières

  • Non seulement pour passer des examens, mais aussi pour repérer les erreurs humaines
  • Les mutations du marché des parts de marché
  • Les répercussions sur l’industrie de la cryptographie
  • La science ne fait que commencer à décider du sort

Ce 13, Google a annoncé une mise à niveau majeure de Gemini 3 Deep Think. Lors du test ARC-AGI-2 (un test de raisonnement conçu pour empêcher l’IA de tricher, qui ne mesure pas la connaissance mais la capacité à déduire des règles à partir d’exemples), Deep Think a obtenu 84,6 %.

Pour comparaison, Claude Opus 4.6 (mode Thinking Max) a obtenu 68,8 %, GPT-5.2 (mode Thinking xhigh) 52,9 %, tandis que la moyenne humaine tourne autour de 60 %.

Plus impressionnant encore, sur la version originale ARC-AGI-1, Deep Think a atteint 96 %, plafonnant ainsi ce qui était considéré comme l’un des tests les plus difficiles pour l’IA.

Actuellement, Deep Think est accessible aux abonnés de Google AI Ultra via API en accès anticipé pour les entreprises.

Non seulement pour passer des examens, mais aussi pour repérer les erreurs humaines

Au-delà des scores, Google a mentionné un détail dans son annonce : lors de la révision d’un article mathématique évalué par des pairs humains, Deep Think a réussi à repérer une faille logique que tous les relecteurs avaient jusque-là manquée. La vérification a été confirmée par des mathématiciens de l’Université Rutgers.

Ce cas illustre que ce n’est pas seulement la performance sur des tests standardisés qui compte, mais la capacité à agir dans des contextes scientifiques réels et ouverts. La revue par les pairs est un mécanisme clé de contrôle qualité dans la recherche académique. Si l’IA peut fournir une assistance fiable dans ce processus, son impact sur l’accélération de la science sera bien supérieur à ce que les simples scores peuvent indiquer.

Deep Think a également atteint le niveau de médaille d’or lors de l’Olympiade internationale de physique et de chimie 2025, avec un score Elo de 3 455 sur Codeforces, correspondant au rang de « maître légendaire », une performance rare chez les programmeurs humains.

Sur l’« Examen ultime de l’humanité » — un test conçu par des experts de divers domaines pour être difficile pour l’IA — Deep Think a obtenu 48,4 % sans outils, établissant un nouveau record.

Les mutations du marché des parts de marché

La compétition technologique entre les trois géants de l’IA modifie la carte du marché. La part de marché de ChatGPT est passée de son sommet à environ 87 % à environ 68 %, tandis que Gemini a grimpé de moins de 5 % à plus de 18 %, et Claude d’Anthropic continue de grignoter le marché des entreprises.

L’atout unique de Google dans cette course est sa capacité de distribution. Gemini est intégré dans Android, Chrome, Google Workspace et le moteur de recherche, ce qui permet à Google, même si ses modèles sont à égalité avec la concurrence en termes de capacités, de capter des utilisateurs via ses canaux.

Mais cette force de distribution peut aussi se retourner. Si l’expérience Gemini est décevante, Google pourrait perdre la confiance des utilisateurs plus rapidement que ses concurrents, car ceux-ci sont « passifs » et « choisissent » l’outil, contrairement aux utilisateurs d’OpenAI qui paient activement et ont une tolérance plus grande.

Les répercussions sur l’industrie de la cryptographie

Chaque mise à niveau dans la course à l’armement de l’IA augmente la demande en infrastructure de calcul. Le coût pour entraîner un modèle de pointe est passé de plusieurs centaines de millions de dollars en 2024 à plusieurs milliards en 2026. Deux tendances en découlent.

Premièrement, la transformation des mineurs de Bitcoin. Lorsque la rentabilité minière se réduit (JPMorgan estime cette semaine que le coût de production d’un BTC est tombé à 77 000 dollars, alors que le prix tourne autour de 66 000 dollars), les mineurs disposant d’une infrastructure de calcul à grande échelle se tournent rapidement vers les services de calcul IA.

Ce ne sont pas des « sorties » mais des « reconversions » : ils passent de l’extraction de Bitcoin à la fourniture de puissance de calcul pour l’IA via des contrats.

Deuxièmement, la narration autour des tokens IA. À chaque grande mise à jour de Google, OpenAI ou Anthropic, les tokens liés à l’IA (comme les protocoles de calcul décentralisé) connaissent souvent une spéculation à court terme.

Mais leur fondamentaux restent faibles : la décentralisation du calcul, en termes de latence et de débit, est encore loin des besoins pour l’entraînement d’IA à l’échelle des entreprises. La narration peut aller vite, mais l’infrastructure ne suit pas.

La science ne fait que commencer à décider du sort

La mise à jour de Deep Think repositionne Google en tête de la course à l’IA, du moins dans le domaine du raisonnement et de la science. Mais en analysant le ton de l’annonce, on perçoit une subtile évolution : Google ne met plus en avant « l’IA la plus intelligente », mais insiste sur « l’IA née pour la science ».

Alors que les benchmarks pour l’IA générale deviennent de plus en plus saturés et que la différenciation devient difficile, « mon IA peut vous aider à faire de la recherche scientifique » devient une proposition de valeur plus convaincante que « mon IA obtient les meilleurs scores ». Si Deep Think peut réellement soutenir la revue par les pairs, accélérer la découverte de médicaments ou trouver des solutions inédites en simulation physique, cela aura plus de sens que n’importe quel classement.

Le problème, c’est que la transition entre « obtenir de bons scores sur des benchmarks » et « aider de manière fiable la science réelle » est probablement plus longue que ce que Google laisse entendre, car les benchmarks ont des réponses standardisées, alors que la science n’en a pas.

Voir l'original
Avertissement : Les informations contenues dans cette page peuvent provenir de tiers et ne représentent pas les points de vue ou les opinions de Gate. Le contenu de cette page est fourni à titre de référence uniquement et ne constitue pas un conseil financier, d'investissement ou juridique. Gate ne garantit pas l'exactitude ou l'exhaustivité des informations et n'est pas responsable des pertes résultant de l'utilisation de ces informations. Les investissements en actifs virtuels comportent des risques élevés et sont soumis à une forte volatilité des prix. Vous pouvez perdre la totalité du capital investi. Veuillez comprendre pleinement les risques pertinents et prendre des décisions prudentes en fonction de votre propre situation financière et de votre tolérance au risque. Pour plus de détails, veuillez consulter l'avertissement.

Articles similaires

Trump s'exprime : l'Iran doit se rendre « sans condition » pour arrêter la guerre ! La crise au Moyen-Orient fait grimper le pétrole et le dollar, le Bitcoin chute à 68 000 dollars

Le président américain Trump a fermement exigé que l'Iran « se rende sans condition » et a exclu toute négociation, ce qui a intensifié les hostilités au Moyen-Orient, provoquant des conflits touchant plusieurs pays et causant de nombreuses pertes humaines. Les marchés mondiaux ont ainsi été secoués, les prix du pétrole ont atteint leur plus haut niveau en près de deux ans, la crainte d'inflation s'est intensifiée, le dollar a fortement augmenté, et le sentiment des investisseurs est au plus bas.

動區BlockTempoIl y a 10m

La Banque centrale chinoise a porté ses réserves d'or à 74,22 millions d'onces à la fin février, augmentant ainsi ses avoirs pendant 16 mois consécutifs.

Gate News消息,7 mars, la Banque centrale chinoise a publié les dernières données montrant qu'à la fin février, les réserves d'or s'élevaient à 74,22 millions d'onces (environ 2308,5 tonnes), en hausse de 30 000 onces (environ 0,93 tonne) par rapport au mois précédent. À la fin janvier, les réserves d'or étaient de 74,19 millions d'onces (environ 2307,567 tonnes). Il s'agit du 16e mois consécutif où la Banque centrale chinoise augmente ses réserves d'or.

GateNewsIl y a 44m

Hier, le flux net total quotidien des ETF au comptant XRP aux États-Unis a été de 16 619 100 dollars.

Le 6 mars, le flux net sortant de l'ETF XRP au comptant s'élève à 16 619 100 dollars, dont 10 601 400 dollars pour l'ETF XRP 21Shares, et 3 648 400 dollars pour l'ETF XRP Bitwise. La valeur nette totale des actifs de l'ETF XRP au comptant s'élève actuellement à 983 millions de dollars, avec un flux net entrant cumulé historique de 1,236 milliard de dollars.

GateNewsIl y a 48m

Hier, le flux net de SOL au comptant ETF aux États-Unis a été de 8 225 500 dollars, Fidelity FSOL a enregistré une sortie de près de 5 millions de dollars

Le 6 mars, le flux net quotidien sortant de l'ETF SOL au comptant aux États-Unis s'élève à 8,225,500 USD, dont l'Invesco Galaxy Solana ETF a enregistré un flux net entrant de 426,900 USD, tandis que le Fidelity Solana Fund ETF a enregistré un flux net sortant de 4,997,400 USD. La valeur totale des actifs sous gestion s'élève à 807 millions de dollars, avec un flux net cumulé historique de 958 millions de dollars.

GateNewsIl y a 50m

Les actions tokenisées dépassent 1 milliard de dollars, le marché financier blockchain accélère

Les actions tokenisées ont dépassé une valorisation de $1 milliards sur la blockchain, marquant une étape importante dans la fusion des marchés boursiers traditionnels avec la technologie blockchain. Cette croissance reflète la demande croissante des investisseurs pour un trading 24/7 et un accès mondial aux actions populaires. Les actions tokenisées représentent des versions numériques des actions cotées, permettant aux investisseurs d'accéder aux fluctuations de prix sans posséder d'actifs traditionnels. Les analystes considèrent cette étape comme indicative du fait que la tokenisation devient une composante essentielle des nouvelles infrastructures financières, bien que les questions juridiques et réglementaires restent cruciales pour le développement du marché.

TapChiBitcoinIl y a 1h

BTC a atteint un sommet de 74 000 dollars avant de redescendre en dessous de 69 000 dollars, la capitalisation totale du marché a évaporé environ 110 milliards de dollars

Cette semaine, l'industrie de la cryptographie a été favorable à Wall Street, mais le prix du Bitcoin est passé de 74 000 dollars à 69 000 dollars, avec une capitalisation boursière évaporée d'environ 110 milliards de dollars. La force du dollar et les facteurs macroéconomiques exercent une pression sur les actifs risqués. Les détenteurs à court terme ont réalisé des bénéfices, ce qui a intensifié la pression de vente, mais le ETF Bitcoin au comptant américain a enregistré un flux net entrant, ce qui indique une amélioration de la situation des fonds.

GateNewsIl y a 1h
Commentaire
0/400
Aucun commentaire