nouvelles

yan junjie, fondateur de minimax : la seule chose que vous pouvez faire est de vous améliorer|ai frontier

2024-09-20

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

ndlr :

"ai daily", une filiale de la china financial news agency et du science and technology innovation board daily, a officiellement lancé aujourd'hui l'interview "insight·ai frontier". les entretiens se concentrent sur des entreprises exceptionnelles, des entrepreneurs, des universitaires de premier plan, des investisseurs, etc. dans le domaine de l'intelligence artificielle et des grands modèles au pays et à l'étranger, apportant les dernières explorations, pratiques et réflexions sur l'ia au service de milliers d'industries. insight・ai est la première ligne, la perspicacité, le pionnier, la première ligne !

"kechuangban daily", 20 septembre (reporter huang xinyi)en tant que l'un des six tigres de l'ia, minimax a finalisé le cycle de financement a+. le dernier cycle a été mené par alibaba, pour un montant de 600 millions de dollars. la valorisation de l'entreprise a dépassé 2,5 milliards de dollars, et les investisseurs derrière elle incluent tencent, sequoia china, hillhouse, idg, mihoyo, etc.

au sein de minimax, les collègues s'appellent uniquement par leurs surnoms. quant au fondateur yan junjie, les employés l'appellent io (nom de la fleur). yan junjie a été vice-président de sensetime, vice-président de l'institut de recherche et directeur technique du smart city business group. en décembre 2021, à la veille de la cotation de sensetime, yan junjie quitte sensetime et fonde minimax.

récemment, minimax a publié le premier modèle de génération de vidéo haute définition ai, abab-video-1. après la conférence de presse, yan junjie a révélé dans une interview avec le science and technology innovation board daily et d'autres médias que le modèle de la série abab7 utilisant la technologie de nouvelle génération sera officiellement lancé dans les prochaines semaines et que l'effet sera comparable à celui du gpt. -4o modèle. parlant des difficultés liées à la commercialisation de grands modèles, yan junjie a répondu qu'il s'agissait effectivement d'un test industriel et que seules les entreprises qui réussissent ce test peuvent réussir.

"lorsque personne n'utilise un produit, ou lorsqu'un produit ne rapporte pas d'argent, on ne peut certainement pas blâmer les utilisateurs. la plupart d'entre eux ne peuvent blâmer que leur propre technologie ou les produits qui ne sont pas assez bons. cela peut être considéré comme une critique d’une industrie. si vous réussissez le test, vous pouvez vous en sortir. si vous ne réussissez pas, vous devriez fermer.

yan junjie à la conférence de presse

▌la concurrence est inévitable et nous devons amplifier à l’infini les domaines dans lesquels nous pouvons être plus forts.

avec la montée d'une nouvelle vague d'intelligence artificielle représentée par gpt, davantage d'espace d'imagination a été créé pour la réalisation de l'intelligence artificielle générale (agi).

yan junjie pense que :l’agi n’est pas quelque chose d’extraordinaire, mais quelque chose qui peut faire partie de la vie de chacun.

« par exemple, lorsque les gens regardent douyin ou des comptes vidéo, ils ne réalisent pas qu’il s’agit d’une plate-forme de distribution de contenu pour de courtes vidéos basée sur des algorithmes de recommandation. ils ont plutôt l’impression que douyin et wechat font désormais partie de la vie de chacun.il en va de même pour l'agi. lorsque l'ia deviendra comme un téléphone mobile et fera partie de l'utilisation quotidienne de chacun, l'agi deviendra réalité. bien sûr, cela prendra beaucoup de temps, mais je pense que nous pouvons travailler dur, étape par étape.

concernant les changements que l'ia peut apporter à court terme de cinq ans, yan junjie estime que dans cinq ans, avec l'aide de l'ia, chacun augmentera considérablement la limite supérieure de son qi et sera plus élevé que la personne ayant le qi le plus élevé. dans une salle réunissant des centaines de personnes. "bien sûr, il n'est pas certain dans quelle mesure la limite supérieure du qi humain peut être améliorée avec l'aide de l'ia."

à l’horizon 2024, la concurrence pour les grands modèles deviendra de plus en plus féroce. face à l’attaque rapide des grands industriels, l’espace vital des start-up s’est comprimé.

« la concurrence est inévitable. » yan junjie a déploré : « dans certains secteurs bien développés en chine, comme les véhicules électriques, les téléphones mobiles et l'internet mobile, plusieurs entreprises se sont engagées dans une concurrence très féroce à long terme, ce qui a finalement conduit à la concurrence chinoise. produits prenant la tête du monde.étant donné que l'histoire du développement d'autres industries émergentes est la suivante et que les grands modèles sont susceptibles de produire une grande valeur sociale, il devrait en effet y avoir beaucoup de concurrence. c'est la loi objective du développement。”

yan junjie estime que si une start-up ne peut pas gagner dans une concurrence féroce, elle doit être éliminée.

lorsque des entreprises bien plus grandes que vous commenceront à vous concurrencer, vous vous rendrez compte que certaines choses sont inutiles. parce que ces grands fabricants sont des centaines de fois meilleurs que vous. ce que nous pouvons faire, c’est amplifier (rendre plus fortes) à l’infini les choses qui ont le potentiel de devenir plus fortes.cela se résume à deux points : l’un est de savoir comment améliorer la technologie et l’autre est de savoir comment créer de meilleures co-créations avec les utilisateurs. ces deux points nécessitent des jugements très critiques et nécessitent une accumulation à très long terme. "

▌les grands modèles multimodaux signifient que l'infrastructure sous-jacente doit également être mise à niveau

le domaine des grands modèles générés par vidéo a été très actif ces derniers mois. vidu, un grand modèle vidéo créé par shengshu technology, a été lancé ; zhipu ai a officiellement publié le grand modèle de génération vidéo « qingying » ; alibaba damo academy a lancé un ; la plate-forme de création vidéo d'ia basée sur une station « xunguang » ; kuaishou keling ai est officiellement lancée sur la page web et ouvre un cadre de génération de vidéo de portrait contrôlable appelé liveportrait...

récemment, minimax a également publié son premier modèle de génération de vidéo ai haute définition. yan junjie estime que les grands modèles multimodaux sont la seule voie à suivre, car le contenu multimodal est une partie importante de la communication humaine.

« la plupart du contenu que nous lisons quotidiennement n'est plus du texte, mais du contenu dynamique. lorsque nous ouvrons xiaohongshu, il affichera des images et des textes, lorsque nous ouvrirons douyin, il affichera des vidéos, et même lorsque nous ouvrirons pinduoduo pour acheter des choses. , la plupart du temps, il affichera des images.pour la société humaine, la signification fondamentale des grands modèles est d'améliorer le traitement de l'information. la plupart des informations sont reflétées dans le contenu multimodal, plutôt que dans le texte qui en constitue souvent la partie la plus essentielle. afin d'avoir une couverture d'utilisateurs très élevée et une très grande profondeur d'utilisation, la seule façon de produire du contenu dynamique (multimodal) n'est pas seulement de produire du contenu purement textuel. il s'agit d'un jugement très fondamental.

bien que la multimodalité soit généralement optimiste, l'industrie a également ressenti lors de l'exploration que par rapport aux modèles textuels, le développement de modèles de génération vidéo est évidemment plus difficile à développer.

à cet égard, yan junjie estime que la plupart du temps, la complexité du travail sur la vidéo est en effet plus difficile que celle sur le texte, car le texte de la vidéo est naturellement très long. par exemple, une vidéo implique des dizaines de millions d’entrées et de sorties, qui seront naturellement difficiles à traiter. deuxièmement, la quantité de vidéo est énorme. un autre exemple est qu'une vidéo de 5 secondes pèse plusieurs mégaoctets, mais qu'une lecture de texte de 5 secondes peut être inférieure à 1 ko. il s'agit d'un espace de stockage de plusieurs milliers de fois.le défi réside dans la manière de traiter les données, de les nettoyer et d'étiqueter l'infrastructure sous-jacente qui était auparavant construite sur la base du texte. cela signifie que l'infrastructure doit également être mise à niveau.

"de plus, il faut plus de patience. il existe de nombreuses choses open source pour écrire du texte. ce sera plus rapide si nous faisons de la recherche et du développement basés sur l'open source. mais il n'y a pas tellement de choses open source pour la vidéo. il faut que ce soit à refaire, et cela demande encore plus de patience."

▌objectivement parlant, la guerre des prix a fait augmenter le nombre d'appels au modèle

depuis cette année, de nombreuses grandes entreprises de modélisme ont lancé une guerre des prix en échange de la popularité des grands modèles ia. yan junjie estime qu'objectivement, la guerre des prix a effectivement augmenté le nombre d'appels de modèles.

"lorsque la guerre des prix des modèles nationaux a commencé, la plupart des entreprises qui pensaient à l'origine que les grands modèles étaient chers ont commencé à découvrir que les grands modèles étaient bon marché et pouvaient être utilisés en toute confiance. en fin de compte, une découverte surprenante a été faite.après la guerre des prix des grands modèles, de nombreuses entreprises très traditionnelles ont commencé à être très disposées à utiliser de grands modèles. ils estiment que le coût est faible de toute façon, et peu importe si quelque chose ne va pas, ils peuvent simplement l'appeler une fois de plus. objectivement parlant, cela augmente considérablement le nombre d'appels de modèles. "

dans un contexte de concurrence féroce entre les modèles nationaux, minimax se développe sur les marchés étrangers. yan junjie a déclaré : « c'est précisément en raison de la concurrence féroce entre les modèles nationaux que nous devons aller de l'avant. au moins maintenant, nous pouvons atteindre un niveau comparable au gpt dans les langues des pays non anglophones. et divers puisque toutes sortes de choses ne peuvent être évitées, essayez de faire de votre mieux.nous voyons le côté optimiste. l’utilisation des grands modèles nationaux connaît en effet une croissance significative, et les modèles chinois deviennent effectivement de plus en plus compétitifs à l’étranger. je pense que ce sont deux changements positifs. "

concernant le modèle de commercialisation spécifique, yan junjie a présenté que la commercialisation de l'ensemble de l'entreprise peut être divisée en deux formes. l'une est la plate-forme ouverte minimax pour la face b et l'autre est le mécanisme publicitaire au sein du produit.

« la plateforme ouverte minimax compte désormais plus de 30 000 entreprises clientes et développeurs, parmi lesquelles des sociétés internet bien connues, des entreprises traditionnelles, etc. les utilisateurs utiliseront nos capacités vocales et visuelles, car toutes les entreprises ne peuvent pas le faire elles-mêmes. nous sommes un bon partenaire. . deuxièmement, les produits minimax disposent également de mécanismes publicitaires qui peuvent être monétisés. cependant, à ce stade, le plus important n'est pas de les commercialiser, mais de réellement rendre la technologie largement disponible.

à l'heure actuelle,il existe six startups indépendantes à grande échelle en chine, dont zhipu ai, baichuan intelligence, zero one thousand things, dark side of the moon, minimax et step star, appelées les « six petits tigres de l'ia ».. zhu xiaohu, associé directeur de jinshajiang venture capital, a déclaré sans détour dans une interview aux médias que les grands modèles sont trop chers et qu'il est impossible de subvenir à ses besoins grâce à la commercialisation. le meilleur résultat pour ces startups est de vendre à de grands fabricants.

parlant des remarques de l'investisseur zhu xiaohu et des difficultés liées à la commercialisation de grands modèles, yan junjie a répondu qu'il s'agissait bien d'un test de l'industrie et que seules les entreprises qui réussissent ce test peuvent réussir.

« lorsque personne n'utilise le produit, ou lorsque le produit ne rapporte pas d'argent, vous ne pouvez certainement pas blâmer les utilisateurs pour le moment. la plupart du temps, vous ne pouvez blâmer que votre propre technologie ou le produit qui n'est pas assez bon. nous sommes, c’est comme ça que nous voyons les choses.

selon yan junjie, qq ne savait pas comment gagner de l'argent en 2000. il a essayé de nombreux plans de monétisation commerciale mais a échoué. cependant, il a finalement trouvé des services et des jeux mobiles à valeur ajoutée, et tout passera par ce processus. "cela peut être considéré comme un test pour une industrie. si elle réussit le test, elle pourra s'en sortir. si elle échoue, (l'entreprise) devrait être fermée."

tout au long de l'interview, yan junjie a toujours semblé relativement calme quant à la concurrence dans le secteur et aux perspectives des entreprises."vous ne pouvez certainement pas blâmer les utilisateurs, ni l'écosystème. (pour beaucoup de choses), nous ne pouvons que nous reprocher de ne pas faire assez bien. au moins, nous avons travaillé dur. j'espère que nous pourrons nous améliorer. c'est la seule chose que nous pouvons faire. »

(huang xinyi, journaliste du science and technology innovation board daily)
rapport/commentaires