2024-09-12
한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina
rapport sur le cœur de la machine
editeur : jiaqi
avec la plus grande activité de recherche au monde, google a toujours été unique dans la silicon valley. les énormes revenus publicitaires générés par la recherche permettent aux deux fondateurs sergey brin et larry page de prendre du recul et de profiter de la vie en paix.
le 15 septembre 1997, sergey brin et larry page ont enregistré un site web appelé « google ».
ce n’est que fin 2022 que chatgpt est devenu populaire dans le monde entier, et google, le leader originel de la vague de l’ia, a semblé se rendre compte que son statut avait basculé. depuis un an, nous semblons nous être habitués à ce que ce géant technologique apparaisse comme un « rattrapage ».
depuis l'année dernière, les médias ont révélé que sergey brin était revenu en première ligne et écrivait lui-même du code. l'ancien pdg eric schmidt a même directement attaqué le système désorganisé consistant à "ne travailler qu'un jour par semaine" lors d'une conférence à l'université de stanford : "si nous perdons face à openai, nous perdrons face aux startups si nous continuons".
schmidt s'exprime à stanford
dans le même temps, à mesure que google grandit, certains symptômes des « maladies des grandes entreprises » sont devenus de plus en plus évidents. de nombreux « essais » de démission de google montrent que la racine des problèmes de google n'est pas la « technologie » mais la « culture ». par exemple, les employés manquent de sens de la mission et l'entreprise a mis en place des systèmes et des processus fastidieux pour éviter les risques.
le fondateur d'appsheet, praveen seshadri, a annoncé son départ de google. son blog a déclaré que l'entreprise s'était égarée et que les employés étaient piégés dans le système.
quel est le problème avec google ? "ce qui freine réellement la productivité des employés de google au quotidien, c'est le manque de personnel, les changements de priorités, les licenciements fréquents, la stagnation des salaires et le manque de suivi des projets par la direction", a déclaré le syndicat des travailleurs d'alphabet.
bien que google rattrape son retard dans la « contre-attaque chatgpt », c'est quelque peu différent du style d'attente avec impatience la sortie de gpt-5 dans la zone de commentaires openai. lorsque gemini est dévoilé, il se « renversera » toujours par inadvertance. depuis lors, gemini a reçu de nombreuses critiques pour avoir généré des portraits à caractère raciste, suggérant que tout le monde mange une pierre par jour et utilise de la colle pour coller du fromage sur la pizza.
le mois dernier, google a publié une version améliorée de gemini et a également lancé gemini live, un assistant vocal basé sur gpt-4o. cependant, lors de la démonstration, gemini live a encore mal tourné.
lors de l'événement made by google organisé en août, les deux premiers essais des fonctions de prise de photos et de reconnaissance d'images de gemini live ont échoué, et ce n'est qu'au troisième changement de téléphone que j'ai réussi.
pourquoi devrions-nous revenir à la pointe de la technologie alors que nous jouissons déjà de la liberté financière ? comment google perçoit-il les gémeaux, qui se sont souvent « renversés » ? quel est le problème avec google face à la concurrence des géants de la technologie ? quel rôle jouera-t-il dans cette compétition ? lors du sommet all-in tenu hier, sergueï brin, qui n'était plus apparu devant les médias depuis longtemps, a exprimé son point de vue dans une interview.
les principaux points de brin sont :
il a décidé de revenir à l’avant-garde de la technologie parce que les progrès dans le domaine de l’ia étaient très excitants et qu’en tant qu’informaticien, il ne voulait pas rater cette vague.
la technologie de l’ia n’est pas seulement une extension de la recherche, elle touchera un plus large éventail de changements.
par rapport aux « modèles experts » spécialisés dans un certain domaine, brin est plus optimiste quant aux modèles généraux. google a remporté avec succès le modèle de la médaille d'argent de l'omi, car google a commencé à intégrer certaines connaissances et capacités dans des modèles de preuve formels. modèle de langage universel.
il existe actuellement une demande constante de puissance de calcul, mais il est difficile d'envisager une augmentation de la demande « de 100 mégawatts à 1 gigawatt, 10 gigawatts, voire 100 gigawatts ».
dans le domaine des applications de l'intelligence artificielle, brin estime que la biologie a relativement bien mis en œuvre l'application de la technologie de l'ia, tandis que le domaine de la robotique en est encore à un stade où les gens trouvent cela magique après avoir regardé des démonstrations et n'a pas encore atteint un niveau qui puisse être atteint. utilisé dans la vie quotidienne.
même si l’ia commet parfois de grosses erreurs, elle devrait être publiée en temps opportun. l’ia n’est pas une technologie que vous gardez près de votre poitrine et que vous cachez jusqu’à ce qu’elle soit parfaite. ce qui est encore plus effrayant que le fait que l’ia soit « stupide », c’est que google était trop timide à l’époque pour déployer transformer, et tous les auteurs de l’article ont démissionné.
la concurrence entre les géants de la technologie dans le domaine de l’ia est en fait une bonne chose, mais brin continuera à prêter une attention particulière aux classements des grands modèles.
voici le texte intégral de l’entretien :
brin : au départ, je pensais que j'étais juste ici pour participer à un podcast, mais je ne m'attendais pas à ce qu'il y ait autant de téléspectateurs. félicitations pour votre carrière réussie, cela m'a fait me sentir un peu timide.
modérateur : merci d'avoir pris le temps de discuter avec moi. aujourd’hui, l’ia est sur le point de changer le monde. en 1998, vous et larry page avez fondé google. j'ai entendu dire que vous aviez récemment participé à des recherches sur l'ia chez google. les grands modèles de langage et les outils d'ia conversationnelle constituent une menace pour la recherche google, un sujet de débat parmi de nombreux analystes et experts du secteur. alors, combien de temps passez-vous chez google chaque jour ? que fais-tu?
brin : pour être honnête, je vais au travail presque tous les jours, mais aujourd'hui j'ai raté une journée parce que je devais apparaître dans votre émission. en tant qu’informaticien, je n’ai jamais vu des progrès aussi passionnants dans le domaine de l’ia que ces dernières années. les progrès de l’ia sont vraiment choquants !
dans les années 1990, lorsque j’étais étudiant diplômé, l’ia était presque insignifiante dans le programme scolaire et n’était qu’une note de bas de page dans les manuels scolaires. ce dont parle le manuel, c'est que des personnes précédentes ont fait diverses expériences, mais l'ia ne fonctionne vraiment pas, et travailler sur l'ia est une « impasse ». c'est tout ce que vous devez savoir sur l'ia.
et puis, miraculeusement, ces personnes travaillant sur les réseaux neuronaux ont commencé à faire des progrès dans les méthodes d'ia qui avaient été abandonnées dans les années 1960 et 1970 - plus de calculs, plus de données, des algorithmes plus intelligents... ce qui s'est passé au cours des dix dernières années est tout simplement incroyable. les outils d'ia d'aujourd'hui peuvent démontrer de nouvelles capacités presque chaque mois, et ces capacités peuvent rapidement doubler. les capacités des ordinateurs sont vraiment étonnantes. j'ai donc décidé de revenir aux premières lignes de la technologie parce que je ne voulais pas passer à côté de tout ce que je pouvais expérimenter en tant qu'informaticien.
modérateur : pensez-vous que l’ia est une extension de la recherche, ou va-t-elle redéfinir la façon dont les gens récupèrent des informations ?
brin : je pense que l’ia touche tous les aspects de la vie quotidienne, et la recherche en fait partie. l’impact de l’ia est presque partout, y compris dans la programmation. j'ai maintenant une perspective différente sur la programmation de l'ia. écrire du code à partir de zéro est vraiment difficile, surtout comparé à la direction de la programmation d'ia, n'est-ce pas ?
hôte : qu'avez-vous programmé avec l'ia ?
brin : en fait, j'écris moi-même un peu de code, juste pour m'amuser. je laisse parfois l’ia écrire du code pour moi, et l’expérience est très intéressante. par exemple, je veux savoir dans quelle mesure le modèle d'ia de google joue au sudoku. j'ai donc demandé au modèle d'ia d'écrire lui-même beaucoup de code, ce qui peut générer automatiquement des puzzles de sudoku, puis de transmettre ces questions à l'ia pour la notation. l’ia est largement à la hauteur de la tâche d’écrire ces codes.
mais quand j’en parlais aux ingénieurs, il y avait beaucoup d’allers-retours, et je suis revenu une demi-heure plus tard et l’ia était terminée. ils ont été impressionnés et il était clair qu’ils n’utilisaient pas autant d’outils d’ia pour aider au codage que je le pensais.
sudoku
animateur : c'est tellement drôle. certains modèles sont doués pour résoudre les puzzles de sudoku, certains peuvent répondre à des informations factuelles sur mon monde et certains sont spécialisés dans la conception de maisons. parallèlement, de nombreux chercheurs travaillent au développement de modèles linguistiques généraux à grande échelle. selon vous, quel chemin prendra l’avenir ?
je ne sais pas d'où vient cette affirmation, disant qu'il y aura un « modèle divin ». c'est pourquoi les investisseurs investissent dans l'ia. une fois le « modèle divin » développé, vous pouvez « atteindre le monde en une seule étape ». ou encore, il existe de nombreux petits modèles basés sur une application spécifique, collaborant au sein d'un agent. comment pensez-vous que le développement et l’application des modèles évolueront à l’avenir ?
brin : il y a 10 ou 15 ans, différentes technologies d’ia étaient utilisées pour résoudre des problèmes complètement différents. par exemple, l’ia pour jouer aux échecs et la technologie de génération d’images sont très différentes, et elles sont chacune très différentes.
modérateur : tout comme google a récemment publié un modèle gnn, qui fonctionne mieux que tous les modèles de prédiction physique. je ne sais pas si vous le savez, mais cela a été envoyé par google.
brin : c'est génial, mais je ne sais pas (gênant).
modérateur : ce modèle est une architecture complètement différente.
brin : d’un point de vue historique, l’ia existe dans de nombreux systèmes différents. prenons l'exemple de la récente olympiade mathématique internationale (omi). le modèle de google a remporté la médaille d'argent, à seulement un point de la médaille d'or (pour plus de détails, veuillez vous référer aux rapports précédents de machine heart : google ai a remporté la médaille d'argent de l'olympiade mathématique de l'omi, et son modèle de raisonnement mathématique alphaproof (avènement, l'apprentissage par renforcement est donc de retour).
en fait, nous avons utilisé trois modèles d’ia : un responsable de la preuve des théorèmes, un axé sur les problèmes géométriques et un modèle de langage général. cependant, il y a quelques mois à peine, nous avons commencé à essayer de tirer des leçons de nos travaux antérieurs et à intégrer certaines connaissances et capacités du modèle de preuve formelle dans un modèle de langage général.
c’est un travail en cours, mais je pense que la tendance sera à la construction d’un modèle plus unifié. je ne suis pas sûr qu'il s'agisse du soi-disant « modèle divin », mais nous nous dirigeons certainement vers une sorte d'architecture partagée, voire même un modèle partagé.
modérateur : si telle est l’orientation future, alors pour former et améliorer ce très grand modèle, d’énormes ressources informatiques seront inévitablement utilisées.
brin : la puissance de calcul est indispensable. j'ai lu des articles prédisant une augmentation de la demande de puissance de calcul, de 100 mégawatts à 1 gigawatt, 10 gigawatts ou même 100 gigawatts. j'ai des réserves à ce sujet. ces dernières années, l’innovation et l’optimisation des algorithmes ont apporté des améliorations de performances plus significatives que l’augmentation de la puissance de calcul du matériel.
modérateur : alors, les lourds investissements actuels dans la puissance de calcul sont-ils déraisonnables ? tout le monde parle des bénéfices, des bénéfices et de la capitalisation boursière de nvidia. il soutient la croissance du calcul à grande échelle et des infrastructures qui permettent de construire ces modèles massifs. cette tendance a-t-elle vraiment un sens ? cela a peut-être du sens, sinon pourquoi nvidia gagnerait-il autant ?
brin : permettez-moi de commencer par dire que je ne suis ni un économiste ni un analyste de marché et que mes opinions sont basées uniquement sur le point de vue d’un informaticien. pour nous, parce que nous sommes confrontés à une demande énorme, nous construisons des clusters informatiques le plus rapidement possible. par exemple, les clients de google cloud veulent juste beaucoup de ppu, de gpu, tout. nous avons dû refuser des clients parce que nous n’avions pas nous-mêmes suffisamment de cartes, et nous nous sommes appuyés sur ces ressources en interne pour former et déployer nos propres modèles. par conséquent, je pense qu’il est raisonnable que les grandes entreprises augmentent activement leur puissance de calcul. je pense simplement qu'il est difficile de déduire directement de la situation actuelle que la demande future en puissance de calcul passera de « 100 mégawatts à 1 gigawatt, 10 gigawatts, voire 100 gigawatts ».
animateur : mais les besoins commerciaux sont là.
brin : je comprends que les clients ont un large éventail de besoins. ils souhaitent effectuer des tâches d'inférence sur divers modèles d'ia et appliquer ces modèles à un flux infini de nouveaux scénarios. leurs besoins sont actuellement illimités.
modérateur : dans le domaine d'application de l'ia, qu'il s'agisse de robotique ou de biologie, quels aspects ont, selon vous, permis d'obtenir les résultats les plus significatifs ? y a-t-il un cas d'utilisation qui vous a fait penser : « wow, c'est tellement utile » ? quels domaines sont plus difficiles et la mise en œuvre des applications peut prendre plus de temps que prévu ?
brin : ma réponse est la biologie. alphafold existe depuis un certain temps. il existe depuis un moment et lorsque je parle à des biologistes, presque tout le monde l'utilise. la dernière version d'alphafold, alphafold 3, représente un nouveau type de technologie d'ia. comme je l’ai déjà mentionné, je pense que la tendance future est l’unification des modèles.
concernant les robots, je suis dans une "étape wow", du genre "wow, le robot peut effectivement faire le ménage !" mais il faut savoir que derrière cela se cache peut-être juste un modèle de langage général affiné, même s'il est magique, la plupart des dans la plupart des cas, ils ne sont pas encore prêts à être utilisés au quotidien.
animateur : voyez-vous l’avenir des robots ?
brin : peut-être... mais je n'ai pas vu de détail...
animateur : mais google n’a-t-il pas aussi une activité de robotique ? bien qu'il ait ensuite été démoli et vendu.
brin : google était dans le secteur des robots.
animateur : peut-être que ce n'est tout simplement pas le bon moment.
brin : franchement, c’était probablement parce que nous prenions trop d’avance sur nous-mêmes. boston dynamics propose tellement de produits phares, mais je ne me souviens même pas de ce que google a fabriqué. quoi qu'il en soit, nous avons eu cinq ou six produits qui étaient embarrassants, mais ils étaient cool et ont laissé une impression durable. rien qu’en voyant à quel point le modèle de langage universel actuel est performant et comment la technologie multimodale permet aux robots de comprendre les scènes, il était encore un peu idiot d’y penser à l’époque. à l’époque, sans ces technologies d’ia, nous étions comme debout sur un tapis roulant, incapables d’avancer.
le projet de google de développer des robots avait autrefois de bonnes cartes : le « père d'android » andy rubin, le célèbre fabricant de robots boston dynamics et le célèbre robot humanoïde atlas... cependant, en seulement cinq ans, au cours de l'année, il a été prévoyait de se dissoudre et de se réorganiser, puis de se dissoudre et de se réorganiser à nouveau. les hauts dirigeants ont démissionné les uns après les autres, les projets de vente ont été suspendus, et plusieurs grandes entreprises se sont vendues...
modérateur : vous investissez beaucoup de temps dans la recherche et le développement de technologies de base. avez-vous également consacré des efforts considérables au produit ? dans un monde futur où l’ia est omniprésente, comment la manière dont l’interaction homme-machine évoluera-t-elle et comment notre vie quotidienne changera-t-elle ?
brin : cela semble être un sujet de discussion avec des collègues du salon de thé.
animateur : cela vous dérangerait-il de le partager avec nous ?
brin : ne vous inquiétez pas, j'ai du mal à penser à quelque chose qui ne soit pas embarrassant.
animateur : c'est bien de raconter l'histoire de « vous avez un ami ».
brin : il est vraiment difficile de dire ce qui se passera dans le futur. la technologie de l'ia est la base de la réalisation d'applications. par exemple, quelqu’un a sorti une démo explosive, particulièrement étonnante, mais il faut du temps pour passer de la démonstration à la mise en œuvre réelle en production. je ne sais pas si vous avez essayé le modèle astra, avec lequel vous pouvez lire une vidéo en direct et qui peut savoir ce qui se passe dans votre environnement.
animateur : vous pouvez l'utiliser, n'est-ce pas ?
brin : j'y aurai certainement accès. parfois, je peux être l’une des dernières personnes à y avoir accès. nous avons atteint un stade où, après avoir fait l'expérience de l'ia, les gens peuvent se dire : « oh mon dieu, c'est incroyable. » et puis vous pensez : « eh bien, 90 % du temps, c'est « tout fonctionne correctement ». vous vous demandez peut-être : « s'il y a des erreurs ou des réponses lentes dans 10 % des cas, cette technologie est-elle vraiment assez bonne ? nous devons donc travailler dur pour améliorer ces détails afin de garantir qu'elle soit rapide et fiable, et plus encore. lorsque cela se produit réellement, c’est vraiment une réussite incroyable.
animateur : j'ai entendu une histoire et je devrais vous raconter quelque chose avant de monter sur scène. avant un événement de lancement, un groupe d'ingénieurs vous a montré comment l'ia peut être utilisée pour écrire du code, et ils ont déclaré : "nous ne l'avons pas encore déployée dans gemini parce que nous voulons nous assurer qu'elle ne se casse pas." hésitation chez google. a ce moment-là, vous avez dit : « non, puisqu'il peut écrire du code, il devrait être lancé. beaucoup de gens m'ont raconté cette histoire. parce qu'ils estiment : « il est extrêmement important d'entendre des remarques comme celle-ci de votre part, le fondateur, car cela montre que le conservatisme n'a pas complètement envahi google, et nous sommes impatients de voir google continuer à diriger l'innovation. cette description est-elle exacte ? as-tu vraiment dit ça ?
brin : je ne me souviens pas des détails précis. honnêtement, cela ressemble à quelque chose que je ferais.
modérateur : pour moi, cela devient un problème car google est si grand que s'il fait une erreur, cela lui coûtera cher.
brin : alors j’ai encore quelque chose à craindre. le point de départ du modèle de langage actuel remonte à l'article transformer il y a 6 ou 8 ans. mais les auteurs de ces articles ont tous démissionné de google. félicitations à eux ! à cette époque, nous étions trop timides pour déployer transformer.
brin : et quelle que soit la puissance de l’ia, ils commettent parfois des erreurs et disent des choses embarrassantes. mais en même temps, l’ia peut déjà nous aider dans des choses que nous n’avons jamais faites auparavant. par exemple, je programme avec mes enfants et je travaille sur des problèmes extrêmement complexes.
en consultant simplement l’ia, ils peuvent commencer à programmer directement et apprendre les différentes api et outils complexes dont l’apprentissage prend généralement un mois. cette capacité est presque magique. nous devons être prêts à commettre des erreurs et à prendre des risques. je crois que notre réponse dans ce domaine s'est améliorée. bien sûr, vous avez peut-être vu de nombreux moments « stupides » de l’ia, mais…
modérateur : c'est acceptable. après tout, vous disposez déjà de richesse et de liberté, assis sur une énorme quantité d’actions. je veux dire, tu es prêt à accepter l'embarras parce que c'est tellement important à ce stade.
brin : je ne fais pas ça à cause de mon stock, d'accord ? mais réfléchissez-y, puis-je vraiment accepter ces erreurs ? est-ce la magie que nous présentons au monde ? je pense que ce que nous devons transmettre, c'est : « regardez, cette chose est incroyable. » l’ia commettra parfois de grosses erreurs, mais je pense que nous devrions la publier en temps opportun et laisser les gens expérimenter et voir quelles nouvelles applications ils peuvent trouver. l’ia n’est pas une technologie que vous gardez près de votre poitrine et que vous cachez jusqu’à ce qu’elle soit parfaite.
animateur : pensez-vous que l’ia aura un impact si profond sur le monde et créera tellement de valeur qu’il ne s’agira plus d’une simple compétition entre google, meta et amazon ? tout le monde considère cela comme une guerre commerciale, mais est-ce possible ? le gâteau créé par l’ia est si grand et les domaines que vous explorez sont si vastes. cela va bien au-delà de celui qui a construit le modèle le plus performant et de qui est la performance llm. le meilleur. comment voyez-vous les larges perspectives offertes par l’ia et quel rôle google y jouera-t-il ?
brin : je pense que la concurrence est très utile d'une certaine manière parce que tous les grands acteurs de la technologie sont en compétition, et d'ailleurs, dans certains classements il y a quelques semaines, google était numéro un, et la dernière fois que j'ai vérifié, nous battions toujours le top model. seulement......
modérateur : il existe plusieurs mauvais indicateurs. vous vous souciez donc des évaluations des modèles !
brin : je n'ai pas dit que je m'en fichais. google était vraiment à la traîne lorsque chatgpt est sorti, et maintenant nous avons parcouru un long chemin. je suis très satisfait de tous les progrès réalisés par google en ce moment. nous garderons donc certainement un œil sur le classement des modèles. je pense que c'est une bonne chose qu'il existe autant d'entreprises d'ia, qu'il s'agisse d'openai, d'anthropic ou de mistral. cela signifie que le domaine de l'ia est en pleine expansion et plein de vitalité.
en réponse à votre question, je pense que l’ia a une valeur énorme pour l’humanité. si vous repensez à mes années d'université, il n'y avait pas internet tel que nous le connaissons aujourd'hui, et obtenir des informations de base et communiquer avec les gens demandait énormément d'efforts. avant la popularité des téléphones mobiles, nous avions réalisé d'énormes améliorations en matière de capacités dans le monde entier, et la technologie d'ia d'aujourd'hui constitue sans aucun doute une autre avancée majeure en matière de capacités. désormais, presque tout le monde a accès à l’ia d’une manière ou d’une autre. je pense que c'est très excitant, c'est génial.