nachricht

robin lis interne rede enthüllte: das open-source-modell ist nicht effizient und kann das rechenleistungsproblem nicht lösen

2024-09-11

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

„die außenwelt hat einige missverständnisse über große modelle.“ kürzlich wurde eine interne rede von robin li aufgedeckt. robin li glaubt, dass die kluft zwischen großen modellen in zukunft noch größer werden könnte. er erklärte weiter, dass die „obergrenze“ großer modelle sehr hoch sei und noch weit von der idealen situation entfernt sei. daher müsse das modell weiterhin schnell iterieren, aktualisieren und aktualisieren können jahre oder mehr als zehn jahre, um die benutzeranforderungen kontinuierlich zu erfüllen, kosten zu senken und die effizienz zu steigern.

in bezug auf die aussage der branche, dass „es zwischen den fähigkeiten großer modelle keine barrieren gibt“, vertrat robin li eine andere ansicht: „jedes mal, wenn ein neues modell veröffentlicht wird, muss es mit gpt-4o verglichen werden, und meinte, dass meine punktzahl fast gleich ist.“ das gleiche gilt, sogar die werte in einigen einzelnen items haben es übertroffen, was aber nicht bedeutet, dass es keine lücke zu den modellen auf dem neuesten stand der technik gibt.“

er sagte, dass viele modelle, um sich zu beweisen, nach ihrer veröffentlichung in die rangliste aufgenommen werden und die testfragen und antwortfähigkeiten erraten werden. aus der rangliste können die fähigkeiten der modelle sehr ähnlich sein, „aber in wirklichkeit.“ anwendungen, die stärke ist immer noch es gibt eine klare lücke.

robin li wies darauf hin, dass die kluft zwischen den modellen mehrdimensional sei. die industrie achtet oft stärker auf die lücke in bezug auf verständnis, generierung, logik, gedächtnis und andere fähigkeiten, ignoriert jedoch dimensionen wie kosten und denkgeschwindigkeit. obwohl einige modelle den gleichen effekt erzielen können, sind sie aufgrund ihrer qualität immer noch schlechter als fortgeschrittene modelle hohe kosten und langsame argumentationsgeschwindigkeit.

robin li sagte auch: „vor der ära der großen modelle war jeder daran gewöhnt, dass open source kostenlos und kostengünstig ist.“ er erklärte, dass beispielsweise open-source-linux kostenlos sei, da man bereits einen computer habe und die nutzung von linux kostenlos sei. im zeitalter großer modelle ist dies jedoch nicht der fall, und open-source-modelle stellen keine rechenleistung bereit. sie müssen ihre eigene ausrüstung kaufen, wodurch die rechenleistung nicht effizient genutzt werden kann.

„das open-source-modell ist im hinblick auf die effizienz nicht effizient.“ er sagte: „das closed-source-modell sollte genauer gesagt als geschäftsmodell bezeichnet werden. es ermöglicht unzähligen benutzern, die forschungs- und entwicklungskosten sowie die für die argumentation verwendeten maschinenressourcen und gpus zu teilen.“ . die gpu-nutzungseffizienz ist am höchsten. die gpu-nutzung der xinda-modelle 3.5 und 4.0 hat mehr als 90 % erreicht.

robin li analysierte, dass das open-source-modell in bereichen wie lehre und wissenschaftlicher forschung wertvoll ist, im kommerziellen bereich jedoch, wenn es um effizienz, effektivität und niedrigste kosten geht, hat das open-source-modell keine vorteile.

auf der ebene der groß angelegten modellanwendung glaubt robin li, dass copilot zuerst erscheinen wird, um menschen zu unterstützen, gefolgt von agentenintelligenz, die auf dieser ebene über ein gewisses maß an autonomie verfügt und unabhängig voneinander werkzeuge verwenden, reflektieren und sich selbst weiterentwickeln kann der automatisierungsgrad entwickelt sich, er wird zum ki-arbeiter und kann alle aspekte der arbeit selbstständig erledigen.

er sagte auch, dass, obwohl „viele menschen hinsichtlich der entwicklungsrichtung der intelligenz optimistisch sind, intelligenz derzeit kein konsens ist, und unternehmen wie baidu, die intelligenz als wichtigste strategie und wichtigste entwicklungsrichtung großer modelle betrachten, nicht.“ viele".

robin li glaubt, dass die schwelle für intelligente agenten tatsächlich sehr niedrig ist. viele menschen wissen nicht, wie man große modelle in anwendungen umwandelt. es ist sehr praktisch, intelligente agenten darauf aufzubauen von modellen.