Rapport hebdomadaire AI | Le grand modèle ne peut pas déterminer si la version 9.11 ou 9.9 est plus grande ; OpenAI publie le modèle léger GPT-4o mini

Rapport hebdomadaire AI | Le grand modèle ne peut pas déterminer lequel est le plus grand, 9.11 ou 9.9. OpenAI lance le modèle léger GPT-4o mini ;

2024-07-21

Le grand modèle ne peut pas déterminer lequel est le plus grand, 9,11 ou 9,9.

Un problème de mathématiques difficile à résoudre pour les élèves du primaire a paralysé de nombreux grands modèles d'IA dans le pays et à l'étranger. Qu'est-ce qui est le plus grand, 9,11 ou 9,9 ? Concernant cette question, le 17 juillet, les journalistes de China Business News ont testé 12 grands modèles, parmi lesquels Alibaba Tongyi Qianwen, Baidu Wenxinyiyan, Minimax et Tencent Yuanbao ont répondu correctement, mais ChatGPT-4o, Byte Doubao, Dark of the Moon Mian kimi, Zhipu Qingyan , Zero One All Things Knowledge, Step Stars Yuewen, Baichuan Zhibai Xiaoying, Shangtang Discussion ont tous eu de mauvaises réponses, et les mauvaises manières sont différentes. La plupart des grands modèles comparent par erreur les nombres après la virgule dans leurs questions-réponses, pensant que 9,11 est supérieur à 9,9.

Commentaire : Derrière ces erreurs, la faible capacité mathématique des grands modèles est un problème de longue date. Certains initiés de l'industrie pensent que les modèles de langage génératif sont conçus pour ressembler davantage à une pensée littérale qu'à une pensée numérique. Cependant, une formation ciblée sur le corpus pourrait progressivement améliorer la capacité du modèle à répondre à des questions scientifiques à l'avenir.

OpenAI lance le modèle léger GPT-4o mini, le coût du modèle a chuté de 99 % en deux ans

Le 18 juillet, heure locale, OpenAI a publié un nouveau grand modèle léger GPT-4o mini. Selon les rapports, GPT-4o mini remplacera désormais GPT-3.5 Turbo dans le robot de questions et réponses ChatGPT, et les utilisateurs d'entreprise pourront accéder à GPT-4o mini à partir de la semaine prochaine. "Nous prévoyons que GPT-4o mini étendra l'application de l'intelligence artificielle et rendra l'intelligence artificielle plus abordable." Selon un article sur le site officiel d'OpenAI, le prix d'entrée du GPT-4o mini est de 15 cents (0,15 $)/million de jetons. (éléments de mots). ), le prix de sortie est de 60 cents (0,6 USD)/million de jetons, 60 % moins cher que GPT-3.5 Turbo. OpenAI a déclaré que la société continuerait également à réduire les coûts tout en améliorant les performances du modèle. Par rapport au modèle text-davinci-003 2022, le coût du GPT-4o mini a baissé de 99 %.

Commentaire : Bien qu'OpenAI n'ait pas publié le modèle de nouvelle génération GPT-5, il met toujours à jour le modèle en fonction de ses capacités existantes et continue de réduire le coût des grands modèles. D’autres grands fabricants de modèles font également la promotion de modèles légers cette année. Google a lancé le modèle léger Gemini 1.5 Flash en mai de cette année. La série Claude 3 publiée par Anthropic en mars comprend le léger Claude 3 Haiku. Les grands modèles avec des paramètres plus petits ont montré un grand potentiel cette année. La formation peut améliorer les performances en augmentant la quantité de données plutôt qu'en augmentant la quantité de paramètres.

Six grands fabricants de modèles ont répondu au problème des faibles capacités numériques des grands modèles

Les journalistes de China Business News ont récemment contacté et interviewé un certain nombre de grands fabricants de modèles, notamment Alibaba Tongyi, Tencent Hunyuan Team, Dark Side of the Moon Kimi, MiniMax Conch, Xueersi Jiuzhang, NetEase Youdao, etc. Au cours de l'interview, ils ont répondu aux principales questions. problème de mauvais modèles mathématiques. Wang Xiaoming, chef de produit du laboratoire Alibaba Tongyi, a déclaré que des problèmes similaires sont des problèmes courants de calcul mathématique et de raisonnement logique, et qu'il s'agit également de cas que les développeurs testent souvent pendant le processus de formation et d'utilisation des modèles. Les grands modèles peuvent répondre « correctement » ou « ». faux" "C'est en fait une question de probabilité. L’équipe Hunyuan de Tencent a déclaré que le grand modèle lui-même est un modèle probabiliste et qu’il est difficile de lui permettre de résoudre de manière stable de tels problèmes de calcul numérique ou de comparaison dans diverses circonstances.

Commentaire : « Lequel est le plus grand, 9.11 ou 9.9 ? » n'est pas difficile pour les humains, mais pour les grands modèles, ce n'est pas forcément une question facile à répondre. À en juger par les réponses complètes, les points de vue mentionnés par les responsables des grands fabricants de modèles incluent que les grands modèles ne contrôlent pas encore avec précision les règles de calcul ou de comparaison entre les nombres. Dans le même temps, l'exploration humaine des capacités des grands modèles est en cours. à un stade très précoce. De nombreux initiés de l'industrie pensent également qu'à l'avenir, il sera nécessaire d'améliorer le niveau d'intelligence du modèle de base sous-jacent et de résoudre ces erreurs au niveau des données de formation et des outils externes. La solution finale pourrait être d'améliorer les capacités de la prochaine génération. modèle. La découverte de tels cas aidera les fabricants à mieux comprendre les limites des capacités des grands modèles.

La loi sur l’intelligence artificielle entrera en vigueur dans toute l’UE le 1er août

La première loi mondiale sur l'intelligence artificielle (EU AI Act), publiée par l'Union européenne, entrera en vigueur dans toute l'UE le 1er août. Il s'agit également du projet de loi le plus complet visant la réglementation de l'intelligence artificielle publié à ce jour dans le monde. La loi européenne sur l'intelligence artificielle jette également les bases d'une réglementation mondiale sur l'intelligence artificielle, visant à obtenir le même « effet Bruxelles » que le règlement général sur la protection des données (RGPD). Selon le dernier projet de loi, les entreprises qui enfreignent la réglementation seront passibles d'amendes administratives pouvant aller jusqu'à 35 millions d'euros ou 7 % du chiffre d'affaires annuel maximum, le montant le plus élevé étant retenu.

Commentaire : L’UE a toujours été à l’avant-garde de la réglementation technologique. La loi de l'UE sur l'intelligence artificielle est la première loi réglementaire globale sur l'intelligence artificielle au monde, démontrant la clairvoyance et le leadership de l'UE dans le domaine de la réglementation technologique. Cependant, les règles augmenteront également les coûts de fonctionnement des entreprises. You Yunting, associé du cabinet d'avocats Shanghai Dabang, a déclaré que depuis la mise en œuvre du RGPD, les coûts des entreprises, en particulier les coûts de conformité, ont considérablement augmenté. On s'attend à ce que la loi sur l'intelligence artificielle soit la même, ce qui signifie que les entreprises doivent investir dans de nouvelles réglementations et nommer du personnel spécialisé pour étudier les politiques de conformité. De plus, le traitement des notifications de violations, les systèmes de divulgation publique, etc. augmenteront également les coûts.

Les résultats des sept grands modèles après avoir participé à l'examen d'entrée à l'université sont publiés : seules deux matières scientifiques peuvent être suivies

En juin précédent, OpenCompass, le système d'évaluation Sinan du Laboratoire d'intelligence artificielle de Shanghai, a publié les premiers résultats complets de l'évaluation de l'examen d'entrée à l'université d'IA, montrant que les candidats en IA pouvaient obtenir un maximum de 303 points dans trois matières en plus de la langue. et les mathématiques, et j'ai échoué dans toutes les mathématiques. Le 17 juillet, OpenCompass a en outre publié une évaluation élargissant la portée des matières. L'équipe a testé sept grands modèles d'IA dans les neuf matières de l'examen d'entrée à l'université, afin qu'ils puissent être comparés aux résultats d'admission à l'examen d'entrée à l'université.

Si AI passe l’examen d’entrée à l’université, dans quelle université peut-elle être admise ? Le test OpenCompass a révélé que si le grand modèle passe l'examen d'arts libéraux, le meilleur score peut être « admis » dans un livre, mais s'il passe l'examen scientifique, il ne peut être « admis » que dans deux livres au maximum (sur la base de la ligne de score de la province du Henan, qui compte le plus grand nombre d'examens d'entrée à l'université cette année) pour référence).

Commentaire : À en juger par l'évaluation des enseignants notateurs, par rapport aux candidats humains, le grand modèle actuel présente encore des limites majeures. Après avoir terminé la notation, les enseignants ont convenu que même si le grand modèle permettait de bien maîtriser les connaissances de base, il n'était toujours pas satisfaisant en termes de raisonnement logique et d'application flexible des connaissances. Plus précisément, lorsqu'ils répondent à des questions subjectives, les grands modèles ne peuvent souvent pas comprendre complètement la racine de la question et ne comprennent pas la direction des pronoms, ce qui entraîne des réponses incorrectes. Lorsqu'ils répondent à des questions mathématiques, le processus de résolution de problèmes est mécanique et peu logique. des problèmes de logique spatiale se produisent souvent.

Li Feifei incube une "licorne", la valorisation de World Labs dépasse le milliard de dollars

Le 17 juillet, il a été rapporté que la valorisation de World Labs, une start-up d'« intelligence spatiale » fondée par le célèbre informaticien chinois Li Feifei, avait dépassé le milliard de dollars. La startup utilise principalement une technologie de traitement de données visuelles de type humain pour doter l’IA de capacités de raisonnement avancées.

Depuis sa création en avril de cette année, World Labs a mené deux tours de financement, avec des investisseurs parmi lesquels Andreessen Horowitz, le principal investisseur technologique, et le fonds d'IA Radical Ventures. Il est entendu que le dernier cycle de financement de la société pourrait atteindre environ 100 millions de dollars américains. Li Feifei, Andreessen Horowitz et Radical Ventures n'ont pas répondu aux demandes de commentaires.

Commentaire : En tant que figure légendaire, les tendances entrepreneuriales de Li Feifei ont également attiré beaucoup d'attention de la part de l'industrie. Li Feifei est devenu professeur titulaire au Département d'informatique de Stanford à l'âge de 33 ans, académicien de la National Academy of Engineering à l'âge de 44 ans et est actuellement directeur du Stanford Human-Centered Artificial Intelligence Institute (HAI). ). ImageNet, la réalisation de référence dans le domaine de la vision par ordinateur, a également été pilotée par elle. Il a de nombreux disciples, comme Andrej Karpathy qui a travaillé chez OpenAI et Tesla, et Jim Fan qui travaille actuellement chez Nvidia, etc. Ce sont également des personnalités influentes dans le domaine de l'IA.

Les géants des fabricants de puces IA et de cloud computing « s'emparent » des entreprises mondiales d'IA

Selon les statistiques de Crunchbase, une société de bases de données de services aux entreprises, le financement des startups mondiales d'IA au premier semestre de cette année a augmenté de 24 % sur un an pour atteindre 35,6 milliards de dollars. Le deuxième trimestre a été le trimestre avec le plus grand nombre de projets. Investissements dans l’IA ces dernières années. Selon les statistiques publiques de China Business News, Nvidia a investi ou acquis cette année pas moins de 16 sociétés liées à l'IA, et la plupart des tours de financement ont totalisé plus de 100 millions de dollars américains. Après que Microsoft ait investi dans OpenAI, la société a également participé à plusieurs rondes de financement totalisant plus de 100 millions de dollars cette année. Google a largement déployé l'écosystème de l'IA à travers ses multiples plateformes d'investissement et a participé à pas moins de 31 tours de financement. Dans ce cycle de boom des investissements dans l'IA, les figures actives incluent AMD, Amazon, SoftBank, etc.

Commentaire : La popularité de l’IA se reflète intuitivement dans les investissements. Les styles d’investissement et les préférences des grands géants ne sont pas exactement les mêmes. Il convient de considérer qu’il s’agit de fabricants dont l’activité principale est le matériel semi-conducteur comme Nvidia et AMD, ou de fabricants de cloud comme Microsoft, Google et Amazon, ils sont tous différents. J'espère investir dans certaines grandes entreprises. Les fournisseurs de modèles et les fournisseurs de cloud sont plus disposés à lier fortement les start-ups de grande taille. En observant les plus grandes rondes de financement du secteur cette année, nous constatons que les grands modèles de base, la conduite autonome, les données d'IA et les robots humanoïdes sont les plus grands points chauds.

Le Royaume-Uni ouvre une enquête antitrust sur l'accord Microsoft et Inflection AI

Le régulateur antitrust britannique, la Competition and Markets Authority (CMA), a récemment déclaré avoir ouvert une enquête antitrust formelle sur la transaction Microsoft-Inflection AI. En mars de cette année, Microsoft a accepté de verser 650 millions de dollars à la startup d’IA Inflection AI pour obtenir une licence pour son logiciel d’IA. De plus, Microsoft a annoncé l’embauche des cofondateurs d’Inflection AI, Mustafa Suleyman et Karén Simonyan, ainsi que de la majorité des employés de l’entreprise.

Commentaire : La valorisation d’Inflection AI est d’environ 4 milliards de dollars. Les initiés du secteur affirment que le comportement de Microsoft équivaut à annexer Inflection AI à bas prix. Contrairement à l’acquisition, Inflection AI conserve toujours sa technologie propriétaire. Outre le Royaume-Uni, des informations ont été publiées le mois dernier selon lesquelles la Federal Trade Commission (FTC) des États-Unis réexaminait également l'accord. Selon certaines informations, la FTC a assigné Microsoft et Inflection AI à comparaître, demandant des documents pertinents des deux dernières années.

La société de robots humanoïdes Zhuji Dynamics finalise un financement de série A

Le 15 juillet, China Business News a appris que la start-up générale de robots humanoïdes Zhuji Dynamics avait finalisé un financement de série A, dirigé par China Merchants Venture Capital, la plateforme d'investissement en capital-investissement du groupe SAIC, Shangqi Capital, et les anciens actionnaires Fengrui Capital, Oasis Capital et Mingshi Capital ont également participé à l’investissement, et le montant du financement n’a pas été divulgué. Auparavant, Alibaba avait également investi dans Zhuji Dynamics. Zhuji Dynamics a été fondée en 2022. Le fondateur Zhang Wei est professeur titulaire à l'Université des sciences et technologies du Sud. Les produits de Zhuji Dynamics comprennent des robots humanoïdes grandeur nature, des robots quadrupèdes, des robots bipèdes et des solutions associées.

Commentaire : De nombreuses entreprises de robots humanoïdes sont encore en cours de financement. Cette année, il y a eu des événements de financement constants dans le domaine des robots humanoïdes. En janvier de cette année, Xingdong Era a annoncé l'achèvement d'un financement providentiel de plus de 100 millions de yuans. Par la suite, Yushu Technology a annoncé l'achèvement d'un financement providentiel B2 de 1 milliard de yuans, Kepler Exploration Robot a finalisé un financement providentiel et Galaxy Universal Robots a finalisé un financement providentiel. financement rond de 700 millions de yuans. Les géants de l'Internet Tencent, Baidu et Alibaba ont respectivement investi dans UBTECH, Zhiyuan Robot et Zhuji Dynamics, tandis que Meituan a investi dans Galaxy Universal Robots et Yushu Robot. Une fois que les entreprises de robots humanoïdes ont levé des fonds, la prochaine étape consiste à mettre en œuvre la production de masse.

NVIDIA et Mistral AI lancent le grand modèle Mistral-NeMo

Selon l'actualité du 19 juillet, NVIDIA et la startup française Mistral AI ont publié le grand modèle de langage Mistral-NeMo AI, qui comporte 12 milliards de paramètres et une fenêtre contextuelle (le nombre maximum de jetons que le modèle AI peut traiter en même temps) de 128 000 jetons. Le grand modèle Mistral-NeMo AI est principalement destiné aux environnements d'entreprise et met en œuvre des solutions d'intelligence artificielle sans utiliser une grande quantité de ressources cloud.

Commentaire : Mistral AI a bouclé un financement de 600 millions d'euros cette année, et la liste des investisseurs comprend Nvidia et Samsung. Microsoft a également annoncé précédemment un investissement de 15 millions d’euros dans Mistral AI, qui sera converti en fonds propres lors du prochain tour de table de Mistral AI. Mistral AI s'est associé à Nvidia pour lancer de grands modèles, et la société cherchera également à trouver un équilibre et à rechercher une coopération entre les grands géants. Nvidia s'implique davantage dans l'écosystème de l'IA. Il a déjà ouvert le modèle de la série Nemotron-4 340B que les développeurs peuvent utiliser pour générer des données synthétiques pour la formation de grands modèles de langage.

nouvelles

Rapport hebdomadaire AI | Le grand modèle ne peut pas déterminer lequel est le plus grand, 9.11 ou 9.9. OpenAI lance le modèle léger GPT-4o mini ;

Introduction

mes coordonnées