L’équipe s’est exprimée après la sortie de Gemini3 : Trois points d’innovation majeurs et la loi d’échelle est toujours valable

Auteur : Wuji, rédacteur spécial de Tencent Technology

Le 19 novembre, heure de Pékin, après que Google a publié la série de modèles Gemini 3, le podcast technologique « Hard Fork » appartenant au New York Times a publié un programme spécial dans lequel les animateurs Kevin Roose et Casey Newton ont mené une interview exclusive avec Demis Hassabis, PDG de Google DeepMind, et Josh Woodward, chef d’équipe de Google Gemini.

Cette interview se concentre sur le dernier modèle d’IA phare de Google, Gemini 3 (en fait la version Pro de la série Gemini 3.0).Il s’agit de la première version marquante de Google largement considérée par l’industrie pour retrouver son leadership technologique et produit après l’échec de Bard et la phase de rattrapage de Gemini 1.x et 2.x.

Les deux dirigeants ont développé les avancées de Gemini 3 en matière de raisonnement en plusieurs étapes, de génération de code (en particulier de codage frontal et de « codage atmosphérique ») et de génération dynamique d’interfaces interactives. Ils ont souligné que Google a rapidement étendu les modèles les plus performants à des milliards de produits utilisateur tels que la recherche, Gmail et Workspace, remodelant ainsi les barrières concurrentielles.

Points clés de l’entretien :

  • Gemini 3 s’inscrit pleinement dans la trajectoire de développement attendue,L’intelligence artificielle générale (AGI) a encore besoin de 5 à 10 ans et de 1 à 2 avancées majeures en recherche;

  • Les avantages complets de Google en termes d’efficacité, de coût et de distribution lui permettent de s’imposer dans n’importe quel environnement de marché ;

  • La bulle de l’IA existe en partie, mais Google a la double garantie d’une monétisation à court terme et d’une nouvelle piste à long terme au niveau du billion..

Ce qui suit est une version condensée de l’entretien

Rhodes: Kathy, nous ajoutons temporairement un épisode spécial aujourd’hui, le thème est la sortie de Gemini 3.

newton: Oui, Kévin. Ce modèle est attendu depuis longtemps dans les cercles de l’IA de la Silicon Valley, et nous pouvons enfin expérimenter le véritable produit fini de nos mains.

Rhodes: Il y a deux raisons principales pour lesquelles nous avons rompu le rythme habituel des sorties du vendredi et enregistré ce numéro spécifiquement.Tout d’abord, nous avons eu une opportunité d’entretien exclusive avec deux principaux leaders de l’IA chez Google (le PDG de DeepMind Hassabis et le vice-président de l’équipe Gemini Woodward).

Deuxièmement, la sortie de Gemini 3 a suscité une forte attention dans l’industrie.Nous avons entendu des sources internes de plusieurs laboratoires affirmer que ce modèle avait réalisé des avancées dans certains domaines clés et pourrait constituer une menace importante pour les concurrents.Google a été considéré comme un chasseur au cours des deux dernières années, et maintenant la question est : sont-ils revenus en tête ?

newton: Avant d’entrer officiellement dans l’interview, nous présenterons brièvement les informations connues. Google a tenu une réunion d’information à huis clos avant la publication.Les nouvelles fonctionnalités les plus remarquables de Gemini 3 incluent : des capacités de codage et de « codage d’ambiance » grandement améliorées ; et une nouvelle fonction de génération d’interface interactive.

Il ne se contente plus de produire du texte, mais génère directement des interfaces interactives personnalisées pour les utilisateurs.Par exemple, lorsqu’un utilisateur pose des questions sur la vie de Van Gogh, le modèle génère instantanément une page d’apprentissage complète contenant des images, des chronologies et des éléments interactifs ;un autre exemple est la génération d’un calculateur hypothécaire pour les propriétés valant plus d’un million de dollars. Ces fonctionnalités marquent le passage de « répondre aux questions » à « créer des expériences ».

Rhodes: Gemini 3 surpasse considérablement Gemini 2.5 Pro dans tous les benchmarks publics.Par exemple, sur un ensemble de problèmes interdisciplinaires de niveau doctoral appelé « Le dernier examen de l’humanité », le premier n’a obtenu que 21,6 %, tandis que le second s’est directement amélioré à 37,5 %.La position générale de Google est que toute tâche que vous pouvez effectuer sur ChatGPT, Claude ou d’autres versions plus anciennes de Gemini peut être mieux réalisée sur Gemini 3.

newton: Ils ont également montré une première démonstration de Gemini Agent : le modèle peut accéder en profondeur à la boîte aux lettres de l’utilisateur, comprendre le contenu de tous les e-mails, classer automatiquement, formuler des réponses et même aider les utilisateurs à vider complètement leur boîte de réception.

De plus, Gemini 3 sera disponible dans l’application Gemini et le mode Google Search AI à partir de cette semaine ; Les étudiants américains bénéficieront d’un accès gratuit à la version premium pendant un an.Le mot-clé sur lequel Google insiste à plusieurs reprises est « Apprendre n’importe quoi », ce qui positionne Gemini comme l’outil éducatif personnalisé ultime.

Rhodes: Demis, Josh, bienvenue à Hard Fork. Il y a deux ans, Sundar Pichai comparait la Bard à « une Honda Civic modifiée » courant sur une piste contre des rivales plus puissantes. Alors, quel genre de voiture est Gemini 3 ?

Hassabis: J’aurais aimé qu’elle soit beaucoup plus rapide que la Honda Civic.Je n’ai pas l’habitude d’utiliser l’analogie avec la voiture, peut-être plutôt comme un coureur de dragsters professionnel (Drag Racer). Il n’est pas conçu pour la conduite quotidienne ou les courses sur circuit, c’est une pure puissance concentrée sur un objectif spécifique.Il représente la combinaison parfaite de nos meilleurs résultats de recherche et d’une puissance de calcul à grande échelle.L’objectif est de faire preuve d’une puissance explosive instantanée inégalée dans cette compétition à la pointe du renseignement.

Rhodes: C’est intéressant.Par rapport à tous les modèles d’IA précédents, quelles nouvelles choses Gemini 3 peut-il faire à un niveau spécifique ? Veuillez nous donner quelques exemples quantitatifs et pratiques.

Woodward: Il y a trois points qui ressortent le plus.Premièrement, dans le raisonnement en plusieurs étapes, il peut penser à plusieurs étapes en même temps, et nous avons élevé sa fiabilité à un tout autre niveau.Les modèles de la génération précédente « perdaient souvent le fil de leurs pensées » ou hallucinaient lorsqu’ils atteignaient les 5e et 6e étapes d’une dérivation logique complexe, tandis que Gemini 3 peut effectuer de manière fiable 10 à 15 étapes de tâches de raisonnement cohérentes, telles que la planification fiscale complexe, la planification globale et la réservation de voyages transfrontaliers, ou le débogage complet d’un énorme système avec des millions de lignes de code.

Deuxièmement, il générera pour la première fois une nouvelle interface interactive à grande échelle.Ce dont les utilisateurs ont besoin, ce ne sont plus de simples réponses textuelles, mais des composants logiciels personnalisés.Par exemple, si vous lui demandez : « Aidez-moi à concevoir un tableau de bord capable de suivre tous mes portefeuilles d’investissement », il générera une interface de tableau de bord interactive et opérationnelle en temps réel, au lieu d’un tas de texte décrivant comment créer un tableau de bord.

Troisièmement, nous investissons massivement dans les capacités de codage, en particulier dans le front-end et le « codage ambiant », ce qui signifie qu’il peut générer un code d’interface utilisateur entièrement fonctionnel et magnifiquement conçu, basé sur des invites en langage naturel.Les nouveaux produits à venir tels que Google Antigravity le démontreront également pleinement, avec des modèles capables de modifier dynamiquement la présentation et les fonctionnalités de l’interface utilisateur en fonction du contexte.

newton: Beaucoup de gens pensent que pour les utilisateurs ordinaires, le cas d’utilisation du « chat » a été fondamentalement résolu.Ils ne pouvaient même pas penser à de nouvelles questions qui rendraient les réponses de Gemini 3 qualitativement différentes de celles de son prédécesseur. Que pensez-vous de cette perception ?

Woodward: Je comprends ce point de vue.En apparence, le taux d’exactitude des questions et réponses de base est déjà très élevé.Mais la vraie différence réside dans la fiabilité, l’intégration et la présentation des informations. Les réponses de Gemini 3 seront plus concises, plus expressives et les informations présentées de manière plus compréhensible.C’est un changement que la plupart des gens percevront immédiatement.

Plus important encore, le modèle commence à être profondément intégré aux sources de données d’autres utilisateurs, par exemple en établissant des liens avec d’autres produits de l’écosystème Google, transcendant véritablement le simple modèle de questions et réponses et devenant le « gestionnaire numérique » de l’utilisateur.Il comprend le contexte de l’ensemble de votre e-mail afin que lors de la rédaction d’une réponse, il réponde non seulement à la question, mais adapte également le ton et le contenu en fonction de votre style passé et de votre relation avec le destinataire.

Hassabis: Je suis tout à fait d’accord.Sa fiabilité, son style et sa personnalité ont été affinés pour le rendre plus simple et plus pertinent. Dans des scénarios tels que le « codage de l’atmosphère », le seuil de l’aspect pratique a été franchi.Il s’agit d’une transformation d’« assistant intelligent » en « collègue intelligent ».Personnellement, je prévois de l’utiliser pour me remettre à la programmation de jeux pendant les vacances de Noël, et il peut désormais non seulement écrire du code fonctionnel, mais également fournir des conseils architecturaux dès les premières étapes de la conception.

Rhodes: Demis, lorsque nous vous avons interviewé en mai de cette année, vous avez jugé qu’AGI prendrait encore 5 à 10 ans et pourrait nécessiter plusieurs avancées majeures.Gemini 3 change-t-il cette chronologie ?

Hassabis: Pas du tout. Cela correspond parfaitement à la trajectoire que nous avons tracée au cours des deux dernières années.En fait, depuis le lancement de la série Gemini, nos progrès ont été les plus rapides de l’industrie.Gemini 3 est époustouflant, mais toujours attendu.

Avant de parvenir à une véritable intelligence artificielle générale, nous devons encore réaliser une ou deux avancées clés en matière de cohérence, de profondeur de raisonnement, de mécanisme de mémoire et de modélisation du monde physique (comme les projets SIMA et Genie que nous avançons).Ce que nous faisons maintenant, c’est la « pensée Système 1 » (rapide, intuitive), mais pour atteindre l’AGI, nous devons débloquer la « pensée Système 2 » (lente, réfléchie, analytique).

De plus, les modèles doivent disposer de mécanismes de mémoire sélective à long terme capables de rappeler et d’appliquer des interactions spécifiques d’il y a des semaines ou des mois, plutôt que d’être limités à une fenêtre contextuelle limitée.Le jugement de 5 à 10 ans reste donc inchangé.

newton: Concernant la relation entre la personnalité du modèle et les utilisateurs, l’industrie discute avec passion des « compagnons IA ».Quel type de relation souhaitez-vous que les utilisateurs entretiennent avec Gemini 3 ?

Woodward: Il s’agit d’une question très sensible mais importante.Nous le positionnons comme un « super outil » plutôt que comme un compagnon émotionnel.Sa valeur fondamentale est d’aider les utilisateurs à accomplir efficacement leurs tâches quotidiennes et à améliorer leur productivité.Nous accordons davantage d’attention à un nouvel indicateur en interne : combien de tâches avons-nous accomplies pour vous aujourd’hui ?Ceci est plus proche de la valeur fondamentale de la recherche Google originale : l’efficacité. Nous pensons que pousser les modèles vers la position de compagnons émotionnels constitue à la fois un risque pour la sécurité et un écart par rapport à la mission principale de Google en tant que fournisseur d’informations et d’outils.

Rhodes:Vous avez abandonné l’opportunité de croissance virale de « Erotic Companion ». Est-ce une erreur stratégique majeure ?

Woodward: Pas de commentaire.Notre équipe de sécurité a des normes et des directives strictes à cet effet.

Rhodes: Les concurrents ont été visiblement nerveux ces dernières semaines.Pensez-vous que Google mène actuellement la course à l’IA ?

Hassabis: L’environnement actuel est le plus compétitif de l’histoire. La seule chose qui compte vraiment, c’est le rythme des progrès, et nous en sommes très satisfaits.Nous n’avons jamais perdu notre leadership en recherche ;désormais, seuls les lancements de produits ont finalement rattrapé notre retard.Les concurrents sont excellents en recherche, mais ils ne peuvent pas reproduire nos avantages en matière de répartition à grande échelle et d’intégration verticale.

Nous injectons Gemini dans des milliards de produits utilisateur tels que Maps, YouTube, Android, la recherche et Workspace. Ce réseau de distribution et cette boucle de rétroaction des données des terminaux constituent un fossé insurmontable.De plus, notre avantage full-stack sur les puces TPU personnalisées rend notre coût de formation et notre efficacité bien supérieurs à ceux de nos concurrents qui s’appuient sur des ressources GPU externes.

newton: Que pensez-vous du débat entre loi d’échelle et rendements décroissants ? Certaines personnes pensent que plus le modèle est grand, plus le bénéfice marginal de l’amélioration des performances est faible.

Hassabis: C’est un débat en cours.Nous sommes très satisfaits de l’amélioration de Gemini 3 par rapport à la version 2.5, qui est tout à fait conforme aux attentes.Les rendements ne sont pas aussi exponentiels qu’ils l’étaient au début, mais les améliorations supplémentaires en matière d’utilité et de fiabilité qu’ils apportent sont encore bien supérieures à nos coûts marginaux et valent toujours la totalité de notre investissement.Jusqu’à ce que les 1 à 2 percées de recherche nécessaires pour atteindre l’AGI soient réalisées, continuer à stimuler les performances grâce au modèle de base à plus grande échelle reste la stratégie la plus efficace à l’heure actuelle.Nous pensons que la loi de l’échelle reste toujours d’actualité.

Rhodes: Sommes-nous dans une bulle d’IA ?

Hassabis: C’est une question trop binaire.Il existe en effet une bulle dans certains domaines (comme les tours de table d’un milliard de dollars sans produits réels, juste des sociétés conceptuelles) où les valorisations sont disproportionnées par rapport aux revenus réels.Mais Google propose à la fois une monétisation à court terme (recherche, Workspace, cloud TPU) et de nouvelles pistes à long terme de plusieurs milliards (robotique, jeux, découverte de médicaments, science des matériaux, etc.).

Par exemple, des modèles spécialisés comme notre AlphaFold créent une réelle valeur dans la découverte de médicaments, un marché de plusieurs milliards de dollars qui n’a rien à voir avec les valorisations de l’IA des consommateurs.Qu’il y ait ou non des bulles à court terme, nous gagnerons : saisissons les opportunités lorsque des booms se produisent et soyons plus résilients grâce à des avantages complets et à un flux de trésorerie important pendant les contractions.

newton: S’il s’agissait d’une fête de Thanksgiving et que quelqu’un voulait changer de sujet politique, quelle fonctionnalité lui suggéreriez-vous d’utiliser Gemini 3 pour se montrer et épater la foule ?

Woodward: Je ne sais pas si ça peut sauver Thanksgiving, mais ça peut faire rire. Sortez votre téléphone et prenez un selfie, puis laissez Gemini 3 éditer les photos comme un fou.

Notre modèle d’image en Gémeaux reste le plus fort au monde.Vous pouvez transformer instantanément une photo de famille en n’importe quelle scène comique, style ou décor d’époque. Cela fera certainement rire tout le public.Plus tard, lorsque vous montrerez comment cela peut vous aider à rédiger une lettre de démission bien rédigée ou à générer un calculateur de recettes de vacances personnalisé, ils exploreront naturellement d’autres nouvelles fonctionnalités.

  • Related Posts

    Vitalik parle de l’avenir de la blockchain : La vulgarisation de ZK et FHE apportera une véritable révolution

    La Semaine internationale de la blockchain de Shanghai 2025 et le 11e Sommet mondial de la blockchain se sont tenus à Shanghai.Vitalik Buterin, co-fondateur d’Ethereum, a prononcé un discours par…

    Et si les ordinateurs quantiques avaient piraté Bitcoin ?

    Auteur : Yohan Yun, Source : Cointelegraph, Compilateur : Shaw Bitcoin Vision Si un ordinateur quantique capable de briser le cryptage moderne était mis en ligne aujourd’hui, Bitcoin serait probablement…

    Laisser un commentaire

    Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *

    You Missed

    La nouvelle méthode de récolte du cercle monétaire à Polymarket

    • By jakiro
    • novembre 19, 2025
    • 3 views
    La nouvelle méthode de récolte du cercle monétaire à Polymarket

    L’avocat privé de CZ détaille la controverse sur la grâce de Trump : répondre aux accusations d’accord politique

    • By jakiro
    • novembre 19, 2025
    • 3 views
    L’avocat privé de CZ détaille la controverse sur la grâce de Trump : répondre aux accusations d’accord politique

    L’équipe s’est exprimée après la sortie de Gemini3 : Trois points d’innovation majeurs et la loi d’échelle est toujours valable

    • By jakiro
    • novembre 19, 2025
    • 5 views
    L’équipe s’est exprimée après la sortie de Gemini3 : Trois points d’innovation majeurs et la loi d’échelle est toujours valable

    Nouveau jeu de couverture de change avec manque de liquidité : une nouvelle façon pour les investisseurs particuliers de réaliser de nouveaux bénéfices ?

    • By jakiro
    • novembre 19, 2025
    • 3 views
    Nouveau jeu de couverture de change avec manque de liquidité : une nouvelle façon pour les investisseurs particuliers de réaliser de nouveaux bénéfices ?

    Pourquoi BTC a restitué tous ses gains, les altcoins sont sous l’eau : la vérité émerge

    • By jakiro
    • novembre 18, 2025
    • 3 views
    Pourquoi BTC a restitué tous ses gains, les altcoins sont sous l’eau : la vérité émerge

    Le BTC pourrait d’abord tomber à 85 000, puis la frénésie d’impression monétaire commencerait à monter en flèche jusqu’à 200 000 dollars américains.

    • By jakiro
    • novembre 18, 2025
    • 3 views
    Le BTC pourrait d’abord tomber à 85 000, puis la frénésie d’impression monétaire commencerait à monter en flèche jusqu’à 200 000 dollars américains.
    Home
    News
    School
    Search