nachricht

minimax-gründer yan junjie: das einzige, was sie tun können, ist, sich selbst zu verbessern ai frontline

2024-09-20

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

anmerkung des herausgebers:

„ai daily“, eine tochtergesellschaft von china finance news und science and technology innovation board daily, hat heute offiziell das „insight·ai frontier“-interview gestartet. die interviews konzentrieren sich auf herausragende unternehmen, unternehmer, führende wissenschaftler, investoren usw. im bereich der künstlichen intelligenz und großer modelle im in- und ausland und bringen die neuesten erkenntnisse, praktiken und überlegungen zum thema ki ein, die tausende von branchen stärken. insight・ai ist die frontlinie, einsicht, pionier, frontlinie!

„kechuangban daily“ 20. september (reporter huang xinyi)als einer der sechs ki-tiger hat minimax die a+-finanzierungsrunde abgeschlossen. die letzte runde wurde von alibaba mit einem betrag von 600 millionen us-dollar angeführt. die unternehmensbewertung liegt bei über 2,5 milliarden us-dollar. zu den dahinter stehenden investoren zählen tencent, sequoia china, hillhouse, idg, mihoyo usw.

innerhalb von minimax nennen sich kollegen untereinander nur mit ihrem spitznamen. den gründer yan junjie nennen die mitarbeiter io (blumenname). yan junjie war einst vizepräsident von sensetime, vizepräsident des forschungsinstituts und cto der smart city business group. im dezember 2021, am vorabend der börsennotierung von sensetime, verließ yan junjie sensetime und gründete minimax.

kürzlich hat minimax das erste ki-modell zur erzeugung hochauflösender videos abab-video-1 veröffentlicht. nach der pressekonferenz gab yan junjie in einem interview mit dem science and technology innovation board daily und anderen medien bekannt, dass das modell der abab7-serie mit technologie der neuen generation in den nächsten wochen offiziell veröffentlicht wird und der effekt mit dem gpt vergleichbar sein wird -4o-modell. als er auf die schwierigkeiten bei der kommerzialisierung großer modelle einging, antwortete yan junjie, dass dies tatsächlich ein branchentest sei und nur unternehmen, die diesen test bestehen, erfolgreich sein könnten.

„wenn niemand ein produkt nutzt oder wenn ein produkt kein geld einbringt, kann man definitiv nicht den benutzern die schuld geben. die meisten von ihnen können nur ihre eigene technologie oder die produkte dafür verantwortlich machen, die nicht gut genug sind. das kann als betrachtet werden.“ eine kritik an einer branche. wenn sie den test bestehen können, sollten sie ihn verlassen.

yan junjie bei der pressekonferenz

▌wettbewerb ist unvermeidlich und wir müssen die bereiche, in denen wir stärker sein können, unendlich vergrößern.

mit dem aufkommen einer neuen welle künstlicher intelligenz, die durch gpt repräsentiert wird, wurde mehr fantasieraum für die verwirklichung der künstlichen allgemeinen intelligenz (agi) geschaffen.

yan junjie glaubt, dassagi ist nichts besonderes, sondern etwas, das teil des lebens eines jeden werden kann.

„wenn sich die leute zum beispiel douyin oder videokonten ansehen, merken sie nicht, dass es sich um eine plattform zur verbreitung von inhalten für kurze videos handelt, die auf empfehlungsalgorithmen basiert. stattdessen haben sie das gefühl, dass douyin und wechat ein teil des lebens aller geworden sind.“das gleiche gilt für agi, wenn ki wie ein mobiltelefon wird und teil des täglichen gebrauchs aller wird, wird agi verwirklicht. natürlich wird das lange dauern, aber ich denke, wir können schritt für schritt hart arbeiten.

hinsichtlich der veränderungen, die ki innerhalb von fünf jahren bewirken kann, glaubt yan junjie, dass jeder mit hilfe der ki in fünf jahren die obergrenze seines iq deutlich erhöhen und höher sein wird als die person mit dem höchsten iq in einem veranstaltungsort mit hunderten von menschen. „natürlich ist es nicht sicher, inwieweit die obergrenze des menschlichen iq mithilfe von ki verbessert werden kann.“

ab 2024 wird der wettbewerb um große modelle immer härter. angesichts der schnellen angriffe großer hersteller wurde der lebensraum von start-up-unternehmen komprimiert.

„wettbewerb ist unvermeidlich.“ yan junjie beklagte: „in einigen gut entwickelten industrien in china, wie elektrofahrzeugen, mobiltelefonen und mobilem internet, haben mehrere unternehmen einen langfristigen und sehr harten wettbewerb geführt, der letztendlich zu chinesen geführt hat.“ produkte, die weltweit führend sind.da die entwicklungsgeschichte anderer aufstrebender industrien ähnlich ist und große modelle wahrscheinlich einen großen gesellschaftlichen wert erzeugen, sollte es in der tat viel konkurrenz geben. dies ist das objektive gesetz der entwicklung。”

yan junjie glaubt, dass ein startup-unternehmen, wenn es im harten wettbewerb nicht gewinnen kann, ausscheiden sollte.

wenn unternehmen, die um ein vielfaches größer sind als sie, mit ihnen konkurrieren, werden sie feststellen, dass einige dinge nutzlos sind. weil diese großen hersteller hunderte und tausende male besser sind als sie. was wir tun können, ist, dinge, die das potenzial haben, stärker zu werden, unendlich zu verstärken (stärker zu machen).es läuft auf zwei punkte hinaus: zum einen geht es darum, die technologie zu verbessern, und zum anderen darum, wie bessere co-kreationen mit benutzern geschaffen werden können. beide punkte erfordern eine sehr kritische beurteilung und erfordern eine sehr langfristige anhäufung. "

▌multimodale großmodelle erfordern auch einen ausbau der zugrunde liegenden infrastruktur

der bereich der videogenerierten großmodelle war in den letzten monaten sehr aktiv. vidu, ein von shengshu technology erstelltes großes videomodell, wurde von zhipu ai offiziell veröffentlicht. sensetime veröffentlichte vimi, das erste große steuerbare zeichenvideogenerierungsmodell für c-end-benutzer stationsbasierte ki-videoerstellungsplattform „xunguang“; kuaishou keling ai wird offiziell auf der webseite eingeführt und stellt ein steuerbares framework zur erstellung von porträtvideos namens liveportrait zur verfügung …

kürzlich hat minimax auch sein erstes ki-modell zur erzeugung hochauflösender videos veröffentlicht. yan junjie glaubt, dass multimodale große modelle der einzige weg sind, da multimodale inhalte ein wichtiger teil der menschlichen kommunikation sind.

„die meisten inhalte, die wir jetzt jeden tag lesen, sind keine texte, sondern einige dynamische inhalte. wenn wir xiaohongshu öffnen, werden bilder und texte angezeigt, wenn wir douyin öffnen, werden videos angezeigt, und sogar wenn wir pinduoduo öffnen, um dinge zu kaufen meistens werden bilder angezeigt.für die menschliche gesellschaft besteht die hauptbedeutung großer modelle darin, eine bessere informationsverarbeitung zu erreichen, und nicht im text, der oft der wichtigste teil davon ist. um eine sehr hohe nutzerabdeckung und eine sehr hohe nutzungstiefe zu erreichen, ist die einzige möglichkeit zur ausgabe von (multimodalen) dynamischen inhalten nicht nur die ausgabe rein textbasierter inhalte. dies ist eine sehr kernentscheidung.

obwohl multimodalität im allgemeinen optimistisch ist, hat die branche während der erkundung auch das gefühl gehabt, dass die entwicklung von videogenerierungsmodellen im vergleich zu textmodellen offensichtlich schwieriger zu entwickeln ist.

in dieser hinsicht glaubt yan junjie, dass die arbeitskomplexität von videos in den meisten fällen tatsächlich schwieriger ist als die von texten, da der videotext von natur aus sehr lang ist. beispielsweise umfasst ein video zig millionen ein- und ausgänge, die naturgemäß nur schwer zu verarbeiten sind. zweitens ist die menge an videos riesig. ein weiteres beispiel ist, dass ein 5-sekunden-video mehrere megabyte wiegt, ein 5-sekunden-text jedoch weniger als 1 kb groß sein kann. dies ist eine speicherlücke von tausenden.die herausforderung besteht darin, daten zu verarbeiten, daten zu bereinigen und die zugrunde liegende infrastruktur zu kennzeichnen, die zuvor auf textbasis erstellt wurde. dies bedeutet, dass auch die infrastruktur aktualisiert werden muss.

„außerdem ist mehr geduld erforderlich. es gibt viele open-source-dinge zum schreiben von texten. es wird schneller gehen, wenn wir forschung und entwicklung auf basis von open source betreiben. aber es gibt nicht so viele open-source-dinge für videos. das muss sein.“ noch einmal gemacht, und es erfordert mehr geduld.

▌objektiv betrachtet hat der preiskampf die anzahl der aufrufe des modells erhöht

seit diesem jahr haben viele große modellunternehmen im austausch für die beliebtheit von ki-großmodellen einen preiskampf begonnen. yan junjie glaubt, dass der preiskampf objektiv gesehen tatsächlich die zahl der modellaufrufe erhöht hat.

„als der preiskampf bei inländischen modellen begann, stellten die meisten unternehmen, die ursprünglich große modelle für teuer hielten, fest, dass große modelle günstig sind und bedenkenlos verwendet werden können. am ende wurde eine überraschende entdeckung gemacht.“nach dem preiskampf bei großen modellen zeigten viele sehr traditionelle unternehmen eine hohe bereitschaft, große modelle einzusetzen. sie haben das gefühl, dass die kosten ohnehin niedrig sind und es keine rolle spielt, wenn etwas schief geht, können sie es einfach noch einmal melden. objektiv gesehen erhöht sich dadurch die anzahl der modellaufrufe erheblich. "

angesichts des harten wettbewerbs zwischen inländischen modellen expandiert minimax in ausländische märkte. yan junjie sagte: „gerade wegen des harten wettbewerbs zwischen inländischen modellen müssen wir vorankommen. zumindest können wir jetzt ein niveau erreichen, das in sprachen aus nicht englischsprachigen ländern mit gpt vergleichbar ist. wettbewerb.“ und verschiedene da sich alles mögliche nicht vermeiden lässt, versuchen sie, ihr bestes zu geben.wir sehen die optimistische seite der nutzung großer inländischer modelle in der tat deutlich, und chinesische modelle werden in der tat im ausland immer wettbewerbsfähiger. ich denke, das sind zwei positive veränderungen. "

in bezug auf das spezifische kommerzialisierungsmodell stellte yan junjie vor, dass die kommerzialisierung des gesamten unternehmens in zwei formen unterteilt werden kann: die eine ist die offene minimax-plattform für die b-seite und die andere ist der werbemechanismus innerhalb des produkts.

„die offene minimax-plattform hat mittlerweile mehr als 30.000 unternehmenskunden und entwickler, darunter bekannte internetunternehmen, traditionelle unternehmen usw. benutzer werden unsere sprach- und visuellen fähigkeiten nutzen, da nicht alle unternehmen dies selbst tun können. wir sind ein guter partner.“ zweitens verfügen die produkte von minimax auch über werbemechanismen, die sich monetarisieren lassen. das wichtigste ist jedoch nicht, sie zu kommerzialisieren, sondern die technologie wirklich allgemein verfügbar zu machen.

derzeit,in china gibt es sechs unabhängige große modell-startups, darunter zhipu ai, baichuan intelligence, zero one thousand things, dark side of the moon, minimax und step star, die als „sechs kleine tiger der ki“ bezeichnet werden.. zhu xiaohu, geschäftsführender gesellschafter von jinshajiang venture capital, sagte in einem interview mit den medien unverblümt, dass große modelle zu teuer seien und es unmöglich sei, sich durch kommerzialisierung zu ernähren. das beste ergebnis für diese startups ist der verkauf an große hersteller.

auf die bemerkungen des investors zhu xiaohu und die schwierigkeiten bei der kommerzialisierung großer modelle eingehend, antwortete yan junjie, dass dies tatsächlich ein branchentest sei und nur unternehmen, die diesen test bestehen, erfolgreich sein könnten.

„wenn niemand das produkt nutzt oder wenn das produkt kein geld verdient, können sie den benutzern zum jetzigen zeitpunkt definitiv nicht die schuld geben. meistens können sie nur ihrer eigenen technologie oder dem produkt die schuld geben, das sowieso nicht gut genug ist.“ wir sind so sehen wir das.“

nach ansicht von yan junjie wusste qq im jahr 2000 nicht, wie man geld verdient. das unternehmen versuchte es mit zahlreichen kommerziellen monetarisierungsplänen, scheiterte jedoch schließlich daran, mobile mehrwertdienste und spiele zu finden, und alle werden diesen prozess durchlaufen. „dies kann als test für eine branche betrachtet werden. wenn sie den test besteht, wird sie entkommen können. wenn sie scheitert, sollte (das unternehmen) geschlossen werden.“

während des gesamten interviews wirkte yan junjie stets relativ gelassen, was den branchenwettbewerb und die unternehmensaussichten anging.„man kann sicherlich weder den benutzern die schuld geben, noch kann man dem ökosystem die schuld geben. (für viele dinge) können wir uns nur selbst dafür verantwortlich machen, dass wir es nicht gut genug gemacht haben. zumindest haben wir hart gearbeitet. ich hoffe, dass wir besser werden können. das ist das einzige, was wir tun können.

(huang xinyi, reporter des science and technology innovation board daily)
bericht/feedback