2024-08-19
한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina
Tao Le est originaire du temple Aofei
Qubits | Compte public QbitAI
Quand l’AGI sera-t-elle mise en œuvre ? GoogleEsprit profond Le PDG Hassabis a prédit dans la dernière interview :
dix ans.
siAGIJe ne serais pas surpris si cela apparaît au cours de la prochaine décennie.
Dans cette interview, Hassabis a parlé des tendances de développement de l'IA.
Il y a des sujets qui intéressent tout le monde, tels que :
L’IA est peut-être surfaite à court terme, mais son potentiel et son impact restent sous-estimés à long terme.
En tant que « super équipe » de Google, Google DeepMind doit trouver un équilibre entre les intérêts commerciaux et la recherche scientifique.
L'open source est important pour le progrès technologique, mais lorsque vous rencontrez une technologie susceptible d'être utilisée à mauvais escient, vous souhaiterez peut-être attendre un an avant de la rendre open source afin d'évaluer et de limiter les utilisations abusives.
Pour un contenu plus spécifique, veuillez consulter la version texte ci-dessous~
Q: Pour l'interview d'aujourd'hui, j'ai invité Hassabis, le co-fondateur de DeepMind et l'actuel PDG de Google DeepMind.
Hassabis: Merci, je suis très heureuse de pouvoir participer à votre entretien. Nous avons précédemment examiné comment les concepts et le langage peuvent être utilisés dans le monde réel, par exemple dans des environnements simulés ou en tant que robots possédant une intelligence réelle qui peut être nécessaire pour comprendre le monde qui nous entoure.
Cependant, il faut reconnaître que ces systèmes ne sont pas encore à ce niveau idéal, commettant de nombreuses erreurs et ne construisant pas vraiment un modèle complet du monde. Pourtant, ils ont fait des progrès bien au-delà de nos attentes grâce au seul apprentissage des langues.
Q: Oui, nous avons beaucoup discuté la dernière fois de la manière d'implémenter le langage dans le monde réel. Mais pouvez-vous expliquer brièvement ce que signifie « atterrissage » ? Juste au cas où les amis qui regardent notre interview pour la première fois ne comprendraient pas.
Hassabis:"atterrissage"Cette notion,Issu des systèmes d'IA classiques construits dans des établissements universitaires tels que le MIT dans les années 1980 et 1990.La plupart de ces systèmes sont d’énormes systèmes logiques, qui peuvent être imaginés comme des bases de données géantes contenant de nombreux mots interdépendants.
Le problème, cependant, est que même si vous pouvez trouver des déclarations telles que « Les chiens ont quatre pattes » dans la base de données, lorsque le système est confronté à la photo d'un vrai chien, il ne peut pas associer ces pixels aux symboles de la base de données. , c'est ce qu'on appelle le "problème d'atterrissage".
En d’autres termes, le système dispose de représentations symboliques ou abstraites mais ne peut comprendre la signification concrète de ces représentations dans le monde réel. Depuis lors, même si les gens ont essayé de résoudre ce problème, ils n’ont jamais réussi à atteindre la perfection.
Contrairement aux systèmes du passé, les systèmes d’IA d’aujourd’hui apprennent directement à partir des données et établissent dès le départ des connexions entre les données et le monde réel.
Il est intéressant de noter que même si ces systèmes apprennent initialement uniquement sur la base du langage, ils devraient théoriquement manquer de beaucoup d'informations nécessaires pour « décoller », car ils ne sont pas connectés à des simulateurs, des robots ou d'autres formes d'entrée du monde réel, mais seulement C’est apprendre dans l’espace du langage.
Étonnamment, ces systèmes sont encore capables de déduire certaines connaissances sur le monde réel.
Q: Cela peut être dû au fait que, lorsque les gens interagissent avec le système, ils indiquent au système quelles réponses sont correctes et lesquelles sont incorrectes. Grâce à ce retour d'information, le système peut recevoir une partie des informations « d'atterrissage », établissant ainsi progressivement une connexion avec le monde réel.
Hassabis: En effet, si le système des versions précédentes donnait des réponses incorrectes en raison d'un manque d'informations sur « l'atterrissage », comme par exemple en répondant incorrectement à une question comme « Comment un chien aboie-t-il ? », les retours des gens corrigeraient le problème.
Ce retour d'expérience est basé sur nos propres connaissances « mises en œuvre », donc, dans une certaine mesure,Le système absorbe et apprend les informations de ces commentaires.
Q: De plus, je souhaite également vous poser des questions sur le battage médiatique autour de l'IA. Pensez-vous que notre situation actuelle, la situation actuelle, est sous-médiatisée ou sur-médiatisée ?
Hassabis: Je pense que c’est plutôt ce dernier. Je veux dire,À court terme, le battage médiatique est allé trop loin.
Je pense que les gens disent que l’IA peut faire toutes sortes de choses, mais en réalité, elle n’est pas aussi puissante qu’on le prétend. Il y a beaucoup de startups et de sociétés de capital-risque qui courent après des idées irréalistes et peu matures.
Mais d’un autre côté, je pense que même aujourd’hui, cette question est encore sous-évaluée ou n’y reçoit pas suffisamment d’attention. Surtout alors que nous arrivons aux étapes AGI et post-AGI, j'ai toujours l'impression que les gens ne comprennent pas pleinement à quel point cela va être un grand changement et les responsabilités qui en découlent.
donc,Je pense qu’à court terme, c’est définitivement surfait, mais à long terme, c’est encore sous-évalué.
Q: D'accord, maintenant je veux poser une question plus importante dans cette interview, quelle est, selon vous, la différence entre Gemini et les grands modèles de langage publiés par d'autres laboratoires ?
Hassabis: Nous nous sommes fixés un objectif dès le début du projet Gemini, qui est de lui permettre de gérer plusieurs types de données en même temps. Nous espérons qu'il pourra non seulement comprendre du texte, mais aussi analyser des sons, des vidéos, des images, du code, etc., essentiellement toutes les formes d'informations.
Nous croyons fermement que ce n’est qu’en permettant aux systèmes de comprendre et de traiter diverses informations du monde réel qu’ils pourront véritablement comprendre le monde et construire un modèle mondial plus précis et plus complet.
Il s’agit en fait d’une extension du problème de « l’atterrissage » que nous avons mentionné ci-dessus, mais cette fois nous utilisons le langage comme base pour y parvenir.
Q: La « mise en œuvre » reste donc la clé de tout le projet ?
Hassabis: En effet, c’est crucial.
Nous avons également un objectif ultime, qui estCréez un assistant complet. Nous avons développé un outil appeléAstroPrototype de projet, Astro comprend non seulement votre contribution, mais détecte également le contexte de votre environnement.
Imaginez à quel point votre assistant personnel ou assistant numérique serait plus puissant s'il comprenait mieux le contexte de votre question ou la situation dans laquelle vous vous trouvez. C’est pourquoi nous croyons toujours fermement que ce type de système sera plus pratique.
Pour ce faire, nous avons intégré une fonctionnalité multimodale au système dès le début du projet. À l’époque, c’était le seul modèle doté de cette fonctionnalité, et maintenant, d’autres modèles tentent de rattraper leur retard.
Q:Project Astro est un nouvel agent d’IA polyvalent capable de traiter des données vidéo et audio.Je me souviens que lors de la conférence Google I/O, vous aviez montré un exemple de la façon dont Astro aide les utilisateurs à se rappeler où se trouvent leurs lunettes. Je m'intéresse aux origines de cette technologie. S'agit-il simplement d'une évolution avancée des anciennes Google Glass ?
Hassabis: Google a une longue histoire dans le développement d'appareils basés sur des lunettes, ayant été impliqué dès 2012 environ. Ils disposent donc d’un avantage significatif en tant que premier arrivé dans ce domaine. Il se peut que la technologie nécessaire manquait à l’assistant intelligent pour comprendre ce qu’il voyait. Mais maintenant,Avec cet assistant numérique à vos côtés, il peut comprendre le monde qui vous entoure, c'est très naturel.
Q: Je veux retracer les origines de Gemini car il provient de deux départements distincts au sein de l'organisation et cela a été fait par eux ?
Hassabis: En effet, l'année dernière nous avons mis Alphabet(société mère de Google)Les deux départements de recherche de l'originalEsprit profondetCerveau de Google, fusionné dans un nouveau département, nous l'appelons"Super département"。
De cette manière, tous les meilleurs talents de l'entreprise sont réunis en une seule équipe et nous combinons les meilleures connaissances de tous les domaines de recherche, notamment dans les modèles linguistiques.
Nous avons eu quelques projets antérieurs, tels que Trin Chilla et Gopher, qui ont tous participé au développement de premiers modèles de langage, tels que Palm et Lambda. Chacun de ces modèles a ses propres forces et faiblesses, et nous les avons intégrés dans le projet Gemini, qui est le premier projet très important après la fusion.
Par ailleurs, il y a un autre point particulièrement important, c'est que nousIntégrer toutes les ressources informatiques ensemble. De cette façon, nous pouvons mener des sessions de formation à grande échelle, qui rassemblent toute la puissance de calcul,Rendre Gemini plus puissant et efficace。
Ces deux équipes se sont toujours concentrées sur l’avant-garde de l’IA. Elles ont déjà beaucoup collaboré sur des recherches personnelles, mais elles ne sont peut-être pas si proches sur le plan stratégique. Maintenant, l'équipe combinée, je la décrirais comme celle de Google"Salle des machines"。
Je pense que les méthodes de travail des deux équipes sont en fait assez similaires, sans grande différence. Ensuite, nous continuerons à renforcer nos atouts en matière de recherche fondamentale, par exemple en réfléchissant au prochainTransformateurÀ quoi ressemblera l’architecture, nous voulons tous le découvrir nous-mêmes.
En parlant de cela, le précédent Transformer a été créé par Google Brain et nous l'avons combiné avec l'apprentissage par renforcement profond, mais je pense que davantage d'innovation est nécessaire. Je crois que, tout comme ces 10 dernières années, que ce soit Brain ou DeepMind, nous continuerons à contribuer.
Q: Vous venez de dire que Google DeepMind est désormais la « salle des machines » de Google. C'est un grand changement. Je veux savoir si Google mise beaucoup sur vous actuellement ?
Hassabis: Je pense que oui. Je pense que Google a toujours été clair sur l’importance de l’IA. Pichai a déclaré lorsqu'il est devenu PDG :Google est une entreprise « AI-first »。
Nous avons discuté de ce sujet lors de sa première prise de fonction. Il considérait le potentiel de l’IA comme le prochain changement de paradigme majeur après l’Internet mobile, et son impact était encore plus profond que celui-ci.
Mais je pense qu'au cours des deux dernières années, nous avons commencé à vraiment comprendre ce que cela signifie, non seulement du point de vue de la recherche, mais aussi du point de vue du produit et de tout le reste. C'est donc une période très excitante, mais je pense que c'est le bon choix pour nous de rassembler tous les talents et de tout mettre en œuvre.
Q: D'un autre point de vue, pour DeepMind, qui devient désormais la « salle des machines » de Google, cela signifie-t-il qu'il faut trouver plus d'équilibre entre la prise en compte des intérêts commerciaux et la recherche scientifique pure ?
Hassabis: En effet, nous devons désormais prendre davantage en compte les intérêts économiques, ce qui fait désormais partie de nos responsabilités. Cependant, certains points doivent encore être clarifiés. Nous continuerons à faire progresser nos travaux de recherche scientifique et nos investissements dans ce domaine continuent d'augmenter.
Je pense,C'est une chose unique que nous faisons chez Google DeepMind, même nos concurrents voient ces résultats comme des avantages généralisés de l’IA.
Q: D'accord, cela m'amène à ma prochaine question : l'open source. Lorsque la technologie tombe entre les mains du grand public, comme vous l’avez dit, des choses assez étonnantes peuvent se produire. Je sais que DeepMind a mené de nombreux projets de recherche en open source dans le passé, mais cela semble avoir changé maintenant. Pouvez-vous nous parler de votre point de vue sur l'open source ?
Hassabis:L’open source est nécessaire, et nous avons toujours été un fervent partisan de l’open source et de la science ouverte.Comme vous le savez, nous publions presque tous nos projets de recherche, y compris des projets comme Transformer etAlphaGoNous avons publié des projets comme celui-ci dans de grands magazines comme Nature et Science.
AlphaFold est également open source, tout cela est fait par nousChoisissez judicieusement. Vous avez raison, cette approche fonctionne parce que la technologie et la science peuvent progresser plus rapidement grâce au partage d’informations. Dans la plupart des cas,L’Open Source est universellement bénéfique, et c’est ainsi que fonctionne la science。
Il existe cependant des exceptions, notamment lorsqu'il s'agit de technologies à double usage, comme l'AGI et la puissante IA.
Le problème est que vous voulez pouvoir activer tous les cas d’utilisation inoffensifs, et vous voulez que les vrais scientifiques et technologues soient capables de s’appuyer sur ces idées et de les critiquer pour favoriser des progrès rapides dans la société. Mais en même temps, comment limiter les mauvais acteurs susceptibles d’abuser de ces systèmes, telle est la question.
Ce n'est pas grave maintenant, car je ne pense pas que ces systèmes soient assez puissants, mais dans deux ou trois ans, surtout lorsque vous commencerez à avoir des systèmes dotés d'un comportement agent, cela pourrait causer de graves dommages.
Nous avons nos propres modèles Gemini open source appelés Gemma, mais ce sont des modèles plus petits et non des modèles de pointe.
Leurs capacités restent très utiles aux développeurs car elles peuvent être exécutées sur des ordinateurs portables et parce qu’elles disposent d’un plus petit nombre de paramètres. Leurs capacités sont bien connues à ce stade, car il ne s’agit pas des derniers modèles de pointe.
Ce que nous finirons probablement par faire, c'est que nous aurons des modèles open source, mais ils auront environ un an de retard sur les derniers modèles de pointe afin que nous puissions vraiment évaluer les capacités de ces modèles lors de tests publics avec les utilisateurs.
Un problème avec l'open source est que si quelque chose ne va pas, vous ne pouvez pas vous en souvenir. Avec un modèle propriétaire, si des personnes malveillantes commencent à l’utiliser de manière inappropriée, vous pouvez l’arrêter, voire même arrêter l’ensemble du système dans des cas extrêmes. Mais une fois que vous avez ouvert quelque chose, vous ne pouvez pas le retirer. C'est une porte à sens unique.
Q: De nos jours, divers modèles d'IA sont développés par des chercheurs scientifiques, mais je veux savoir, si nous entrons dans l'étape où l'IA soutient toute la recherche scientifique, y aura-t-il encore de la place pour que les institutions de R&D existent ?
Hassabis: Je pense qu'il y a encore de la place. Nous sommes maintenant dans l'étape précédant l'émergence d'une AGI générale. Je pense que cela nécessite une coopération étroite entre la société, le monde universitaire, le gouvernement et les laboratoires industriels.
Je crois sincèrement que c’est la seule façon d’y parvenir. Si vous demandez ce qui se passe après l'AGI, c'est probablement ce que vous voulez vraiment savoir. L'AGI a toujours été quelque chose que j'aspire à construire car nous pouvons l'utiliser pour explorer certaines des questions les plus fondamentales sur la nature de la réalité, la physique, la conscience, etc.
Q: L'informaticien Stuart Russell m'a dit un jour qu'il craignait un peu qu'une fois que nous aurons atteint l'AGI, nous puissions tous ressembler aux aristocrates du passé, ne profitant que d'une vie insouciante et luxueuse, sans aucun objectif et sans réflexion.
Hassabis: Je pense que l'avenir va être très intéressant. Mais cela aborde également le problème de la « sous-évaluation » que j’ai mentionné plus tôt, qui fait la différence entre le battage médiatique à court terme et à long terme. Si vous voulez appeler cela du battage médiatique, il est certainement sous-évalué dans une certaine mesure.
Je pense que le changement dans le futur sera énorme. Je crois qu'un jour nous pourronsGuérir de nombreuses maladies, voire toutes les maladies, résoudre les problèmes énergétiques et climatiques.
Q: En parlant de ça, je me souviens que vous avez dit un jour que vous espériez qu'AGI puisse explorer les mystères de l'univers. Pensez-vous qu'il existe des possibilités que nous n'avons pas encore imaginées, comme des phénomènes comme les trous de ver ?
Hassabis:certainement,Je crois pleinement à cette possibilité. J'espère vraiment que les trous de ver deviendront une réalité. Il me semble que nous avons encore de nombreux malentendus sur la physique et la nature de la réalité.
De toute évidence, il existe d’innombrables mystères non résolus cachés dans l’unification de la mécanique quantique et de la gravité, des problèmes du modèle standard, de la théorie des cordes, etc. J'ai eu des discussions approfondies avec de nombreux amis de la communauté des physiciens, et ils pensent tous qu'il y a beaucoup de choses dans le cadre théorique existant qui ne s'emboîtent pas parfaitement.
Personnellement, je ne suis pas un grand fan des explications multivers, donc je pense que ce serait incroyable si nous pouvions proposer de nouvelles théories et les tester avec des équipements à grande échelle dans l'espace.
La raison pour laquelle je suis si fasciné par l’échelle de Planck du temps et de l’espace est qu’elle semble représenter la résolution ultime de la réalité, comme la plus petite unité dans laquelle tout peut être divisé.
Je pense donc que nous devrions mener une exploration expérimentale approfondie à ce niveau, surtout lorsque nous avonsAvec l’AGI et des ressources abondantes, nous pourrons peut-être concevoir ou construire de tels équipements expérimentaux.
Q: Vous avez dit un jour que DeepMind était un projet de 20 ans. Où en sommes-nous maintenant ? Progressez-vous toujours comme prévu ?
Hassabis: Oui, nous sommes toujours dans les délais, ce qui peut paraître incroyable car généralement, un projet vieux de 20 ans donne toujours l'impression qu'il faudra encore 20 ans pour le réaliser. Mais nous avons parcouru un long chemin.
Notre objectif est d’y parvenir d’ici 2030, je ne serais donc pas surpris si nous y parvenons au cours de la prochaine décennie.
Adresse vidéo : https://www.youtube.com/watch?v=pZybROKrj2Q *