nouvelles

Des jouets et outils aux « collègues » en passant par « l’IA Einstein », jusqu’où sommes-nous loin de l’intelligence artificielle générale ?

2024-07-16

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina


Aujourd’hui, l’intelligence artificielle générale (AGI) est devenue l’un des mots-clés sur lesquels se concentrent la communauté scientifique et l’industrie. Il y a quelques années à peine, beaucoup pensaient qu’il faudrait au moins 10 à 50 ans pour réaliser l’AGI. cela ne serait jamais possible. Aujourd’hui, ces derniers sont rares. Cependant, comparé à l'enthousiasme du public face à cette vague de changements technologiques, de nombreux chercheurs de première ligne et leaders de l'industrie dans le domaine de l'IA (intelligence artificielle) estiment qu'il reste encore un long chemin à parcourir avant que l'IA actuelle puisse se développer en AGI.

Selon Qi Yuan, professeur distingué Hao Qing de l'Université de Fudan, doyen de l'Institut d'intelligence scientifique de Shanghai (ci-après dénommé « Institut de Shanghai ») et fondateur de la grande société modèle de confiance « Infinite Lightyear », « l'une des plus hautes manifestations de l'intelligence artificielle générale" Il s'agit de découvrir les lois inconnues du monde complexe. En bref, cela devrait être une « IA Einstein ». Cela nous oblige à créer une combinaison de prédiction de probabilité de « boîte noire » à pensée rapide et de pensée lente. » le raisonnement logique de la boîte blanche pour créer un grand modèle de confiance de la « boîte grise » ; et grâce à l'intégration profonde de la technologie et de l'industrie, nous promouvons la recherche fondamentale, la formation des talents et la mise en œuvre des résultats pour créer un écosystème d'innovation scientifique et intelligent.

Lors de la Conférence mondiale sur l'intelligence artificielle (WAIC) 2024 et de la Conférence de haut niveau sur la gouvernance mondiale de l'intelligence artificielle, qui se sont terminées il y a peu, l'Institut de technologie de Shanghai a organisé avec succès le forum thématique « Intelligence artificielle : changement de paradigme de la recherche scientifique et développement industriel ». . C'est aussi la première fois que cette nouvelle institution de R&D apparaît au WAIC. L'Institut Shangzhi peut être considéré comme un modèle pour Shanghai dans l'exploration du modèle écologique scientifique intelligent « 1+1+N » axé sur l'innovation, c'est-à-dire que le « 1 » de l'Institut Shangzhi sert de centre et de plaque tournante de l'écosystème responsable. pour la planification stratégique globale, l'intégration des ressources et la R&D et l'innovation des technologies clés, combinées avec une autre université Fudan « 1 » et les « N » de nombreuses universités, instituts de recherche scientifique, entreprises technologiques, équipes d'innovation et institutions d'investissement, promeuvent conjointement recherche scientifique, formation des talents, transformation des réalisations scientifiques et technologiques et innovation et modernisation de l'industrie.

La norme pour l'AGI devrait être de créer "AI Einstein"

D’un point de vue technique, les grands modèles avec de plus en plus de paramètres mèneront-ils à l’intelligence artificielle générale ? Aujourd’hui, que ce soit du point de vue de la technologie de l’IA elle-même ou du point de vue de la consommation d’énergie, même si les grands modèles basés sur l’architecture autorégressive Transformer ont encore des dividendes, ils ne suffisent pas à conduire à une intelligence artificielle générale. L’intelligence artificielle nécessite le développement de nouveaux grands modèles de confiance « boîte grise ». Ceci est un résumé des nombreuses années d’expérience pratique de Qi Yuan dans le monde universitaire et industriel.

Il y a dix ans, avec l'idée de « rendre l'intelligence artificielle utile », Qi Yuan a conduit l'équipe à augmenter pour la première fois le système d'apprentissage automatique de base d'Alibaba de 2 millions de paramètres à des centaines de millions de paramètres, obtenant ainsi un effet commercial à grande échelle. améliorations. Démontrer la transformation intégrée des données, des algorithmes et des capacités d’ingénierie. C’est exactement l’incarnation de la loi Scaling dont on parle aujourd’hui dans le cercle de l’intelligence artificielle.

Qi Yuan a rappelé que l'équipe avait goûté aux avantages de la loi de mise à l'échelle à cette époque : après que les paramètres du modèle aient été augmentés cent fois, l'effet global a été amélioré à pas de géant. "Mais maintenant, je me demande : pourquoi n'avons-nous pas fait davantage de modèles d'IA à l'époque ? Pourquoi me suis-je arrêté là alors que nous avons fait un pas en avant ?" pas assez, pour atteindre des dizaines de milliards, des centaines de milliards, voire des milliards. À cette époque, les universités et les institutions manquaient de puissance de calcul, et même dans le monde industriel, atteindre une puissance de calcul aussi élevée nécessitait des coûts très élevés, voire même. Sans parler du monde universitaire.

La raison pour laquelle la norme pour l'AGI devrait être de créer un « IA Einstein », a expliqué Qi Yuan, est d'être efficace et intelligent. Tout d'abord, Einstein a vu les « nuages ​​sombres de la physique au début du 20e siècle » à travers plusieurs points de données clés. L'AGI devrait également être capable de découvrir des lois inconnues qui comprennent le monde complexe. Cependant, aucun des grands modèles actuels ne peut le faire. Bien que le grand modèle visuel SORA simule le monde physique à un degré sans précédent, SORA construit toujours un monde tridimensionnel basé sur la simulation du monde bidimensionnel, ce qui est encore loin. d'une compréhension approfondie du monde physique. Beaucoup de distance. La seconde est la consommation d'énergie. La puissance du cerveau humain est d'environ 15 watts, et la puissance maximale d'un GPU est de plusieurs centaines de watts. Sans oublier que la prise en charge de grands modèles à usage général nécessite un kilocard ou un cluster de dix mille cartes. . Pour l’instant, si vous continuez à utiliser l’architecture existante, cela nécessitera une énorme consommation d’énergie, ce qui rendra difficile la réalisation de l’objectif d’efficacité et d’intelligence.

"AI Einstein" est également un objectif clé de l'IA pour la science (Remarque : Intelligence scientifique, ci-après dénommée AI4S). L'intelligence scientifique joue déjà un rôle important en accélérant la résolution d'équations physiques connues, mais l'intelligence scientifique doit combiner des règles et des données connues, réduire la forte dépendance aux données et à la puissance de calcul, améliorer la précision du raisonnement et des prévisions, et s'ajuster en fonction de la connaissance des données. règles et proposer de nouvelles théories scientifiques. Cela coïncide également avec l'objectif à long terme de Qi Yuan de travailler à l'Université de Fudan et à l'Institut de la propriété intellectuelle de Shanghai : « utiliser l'intelligence artificielle pour comprendre le monde complexe et découvrir des lois inconnues ».

Le grand modèle à champ vertical de confiance « boîte grise » donne du pouvoir à des milliers d'industries

Quels problèmes doivent être résolus de toute urgence lorsque les grands modèles mettent en œuvre une nouvelle productivité à partir des outils d’IA ? Du point de vue de Qiyuan, la grande industrie du mannequinat est confrontée à de nombreux défis communs, ce qui rend difficile l'adéquation de la technologie, des produits et de la demande du marché.

"À l'heure actuelle, le plus gros problème dans la mise en œuvre de modèles à grande échelle est qu'ils semblent utiles à première vue, mais ils sont inutiles une fois utilisés." Qi Yuan a expliqué que le cœur des modèles de langage à grande échelle actuels est simplement de les utiliser. prédire le mot suivant pour prédire le mot suivant, mais cela ne convient pas à un raisonnement rigoureux en plusieurs étapes. "La langue est un outil de communication, pas un outil de réflexion." Récemment, un article publié par le Massachusetts Institute of Technology (MIT) et d'autres institutions dans la revue universitaire de premier plan "Nature" a souligné que la langue est un outil puissant de diffusion. connaissances culturelles, et cela peut être lié à Nos capacités de réflexion et de raisonnement ont co-évolué pour refléter la complexité de la cognition humaine. Mais le langage ne crée pas la complexité du raisonnement.

Compte tenu des caractéristiques existantes des grands modèles telles que le manque de fiabilité, la faible interprétabilité et le coût élevé, une solution vraiment efficace consiste à combiner le raisonnement probabiliste sur les réseaux neuronaux avec des calculs symboliques logiques, à l'instar de la combinaison du prix Nobel d'économie Daniel Card. La pensée rapide basée sur l'instinct humain et la pensée lente basée sur le raisonnement logique décrites dans le livre de Niemann « Penser vite et lentement » « peuvent être considérées comme un grand modèle de « boîte grise », estime Qi Yuan, la « boîte grise » fait confiance aux grands modèles qui. combiner l'informatique symbolique avec les réseaux de neurones peut réduire « l'illusion » de l'intelligence artificielle et résoudre les problèmes professionnels dans les domaines verticaux, responsabilisant ainsi des milliers d'industries et libérant la productivité des grands modèles.

Qu’est-ce qu’un grand modèle de confiance « boîte grise » ? « L'apprentissage profond était à l'origine considéré comme une « boîte noire », mais maintenant nous combinons la « boîte blanche » du raisonnement logique avec l'apprentissage profond, et cela devient une « boîte grise », a expliqué Qi Yuan : « La « boîte noire » originale. " fait que les gens ne savent rien du processus de production de données, et le grand modèle de la " boîte grise " peut faire en sorte que les gens " sachent ce qui se passe et pourquoi " à l'aide d'un raisonnement logique. Les modèles peuvent utiliser l'apprentissage en profondeur pour réduire les règles qui ne le font pas. correspondre aux données d'observation du monde réel.

Qi Yuan a déclaré que pour que des scénarios complexes dans diverses industries deviennent de nouveaux champs de bataille où l'IA joue un rôle central, qu'il s'agisse de la finance et des assurances, de l'énergie éolienne, du transport maritime, des scénarios médicaux et pharmaceutiques, il est nécessaire d'intégrer des connaissances systématiques de l'industrie. logique de raisonnement et mécanismes de prise de décision combinés avec de grands modèles. Les grands modèles « boîte grise » ne sont pas seulement la direction générale de l'intelligence artificielle générale, mais aussi un outil puissant permettant aux grands modèles de pénétrer profondément dans les champs verticaux et de véritablement résoudre des problèmes pratiques. "Si vous regardez les choses d'un point de vue industriel, cette compréhension est très intuitive." Qi Yuan a donné un exemple. Les médecins n'ont pas besoin d'être des avocats, et les avocats n'ont pas besoin d'être des experts en investissement. domaine et créer ses propres outils de productivité. Techniquement parlant, un « oubli catastrophique » peut se produire si un grand modèle surapprend sur des tâches non pertinentes. Tout comme si Li Bai travaillait comme comptable toute la journée et n'écrivait pas de poésie, son inspiration poétique pourrait progressivement s'estomper. « Nous avons observé que lors de l'entraînement d'un grand modèle dans un champ vertical, si le modèle est autorisé à apprendre trop de fonctions non pertinentes, cela interférera avec ses capacités d'origine. Par conséquent, il est nécessaire de créer un grand modèle « boîte grise » dans le domaine vertical. Je pense que cela a une grande valeur dans la mise en œuvre industrielle ".

"Je pense que le grand modèle de la "boîte grise" jouera un rôle de plus en plus important sur la voie de la mise en œuvre de l'AGI et de l'industrie verticale, car à partir d'une méthodologie bayésienne, il s'agit de combiner nos connaissances connues et cachées. Les informations inconnues dans les données sont combinées pour découvrir de nouvelles lois et résoudre des problèmes scientifiques et industriels », Qi Yuan a dit sans ambages qu'à l'avenir, « AI Einstein » pourra aussi être « AI Buffett ».

Ouvrir la chaîne d'innovation et construire un écosystème d'innovation scientifique et intelligent

Lors de la Conférence mondiale sur l’intelligence artificielle de 2024, une équipe dirigée par Qi Yuan a publié un modèle financier et médical fiable à grande échelle en langage léger, comportant des dizaines de milliards de paramètres. Les tests de grands modèles dans ces deux domaines verticaux ont dépassé le grand modèle GPT4-Turbo aux mille milliards de paramètres d'OPEN AI, attirant une fois de plus l'attention de l'industrie sur la mise en œuvre de grands modèles.

« Les avancées actuelles en matière d'intelligence artificielle ne proviennent pas seulement de l'innovation des principes sous-jacents, mais sont également motivées par des produits orientés vers les besoins sociaux. Ce dont la société a besoin, ce n'est pas seulement la publication d'articles théoriques ou l'innovation de modèles commerciaux, mais aussi l'intégration profonde des technologies. "L'innovation et l'innovation industrielle, qui reposent sur une percée dans le principe d'unité, une fois les deux combinées, nous pouvons nager vers un endroit où l'eau est plus bleue", a déclaré Qi Yuan.

Le monde universitaire et l’industrie ont des missions différentes. Le monde universitaire doit explorer de nouvelles choses, tandis que l’industrie doit d’abord résoudre des problèmes pratiques. Il existe un problème commun au pays et à l'étranger : les instituts de recherche doivent étudier de nombreuses questions d'innovation technologique, mais s'ils ignorent la productivisation et les besoins sociaux, ils connaîtront deux lacunes : l'absence de véritable pression concurrentielle et l'incapacité de modérer les technologies innovantes dans la concurrence. Une rétroaction efficace sur les informations sur le marché oriente l'orientation de la recherche et du développement technologique.

À cette fin, Qiyuan attendait avec impatience d'ouvrir la chaîne d'innovation « universités-instituts de recherche-start-ups » et de créer un bon écosystème d'innovation. Il pense non seulement à la technologie sous-jacente, mais comprend également la demande du marché. Utilisez la demande et les scénarios du marché pour orienter les produits et innovez de bas en haut pour renforcer la compétitivité de base des produits.

Shangzhiyuan, créée en 2023, s'engage en faveur d'une innovation originale en matière d'IA pour la science qui combine connaissances et données. Récemment, l'Institut Shangzhi a publié la série Fuxi de modèles météorologiques à grande échelle 2.0 pour des applications industrielles telles que les nouvelles énergies, l'assurance et la gestion urbaine, et a pris la tête du lancement de l'Alliance écologique pour l'innovation météorologique intelligente, unissant plusieurs unités pour promouvoir progressivement l'industrialisation. de la série Fuxi d'application de modèles météorologiques à grande échelle 2.0. Le lancement du produit du grand modèle de confiance « boîte grise » est également en cours. Infinite Lightyear, une grande société de modèles de confiance dont Qi Yuan est le fondateur, a été créée.

Afin de faire prospérer davantage l'écosystème de l'innovation scientifique et intelligente, la deuxième conférence a été parrainée conjointement par l'Académie intelligente de Shanghai et l'Université de Fudan, et guidée conjointement par la Commission municipale des sciences et technologies de Shanghai, la Commission municipale de développement et de réforme de Shanghai, la Commission municipale d'économie et d'information de Shanghai. Commission, Commission municipale de l'éducation de Shanghai et d'autres départements. Le Concours mondial de science et d'intelligence a été lancé. Le concours prévoit un prix d'un million de dollars pour recruter des joueurs du monde entier afin d'explorer conjointement les domaines pionniers de l'intelligence scientifique. Dans le même temps, l'Institut Shangzhi a dirigé le développement d'une plate-forme de données scientifiques couvrant les données scientifiques multimodales. La plate-forme dispose de capacités complètes allant de la collecte et du traitement des données à la gestion et à la modélisation, garantissant un traitement efficace, une fiabilité et une interopérabilité sûre des données. . Sur la base de cette plateforme, le SPIC et ses partenaires ont construit plusieurs ensembles de données scientifiques de haute qualité pour les domaines des sciences de la vie, des sciences physiques et des sciences de l'atmosphère, fournissant ainsi des ressources précieuses pour la recherche en intelligence scientifique. En outre, l'Institut Shangzhi a pris l'initiative de lancer la Global Scientific Data Ecological Alliance. Le premier groupe d'unités membres de l'alliance comprend plus de dix unités, dont China Telecom Co., Ltd., COSCO Shipping Property Insurance Captive Co., Ltd., Shanghai. Lingang New Area Cross-Border Data Technology Co., Ltd. L'alliance construira une plate-forme mondiale et multidisciplinaire d'ouverture et de partage de ressources de mégadonnées de recherche scientifique grâce à la coopération avec les gouvernements, les entreprises, les universités, les instituts de recherche et d'autres parties.

"La recherche scientifique et l'industrie ne devraient pas être 'nouvelles pour le plaisir'. Nous espérons que nous pourrons construire l'intelligence artificielle générale et les applications futures pour résoudre les problèmes du monde réel", a déclaré Qi Yuan.

auteur:

Photo : Photo gracieuseté du Shanghai Intelligence Research Institute Editeur : Wu Jinjiao Rédacteur en chef : Jiang Peng

Veuillez indiquer la source lors de la réimpression de cet article.