nachricht

interpretation|xiao yanghua: welche auswirkungen wird das o1-modell mit mathematischen fähigkeiten auf doktorniveau haben?

2024-09-13

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

·die denkfähigkeit auf expertenniveau ist keine frage-und-antwort-taktik, sondern erfordert starkes denkvermögen. die schwierigkeit beim training großer modellschlussfähigkeiten besteht darin, dass eine große anzahl menschlicher denkprozesse nie zum ausdruck gebracht wird, sodass daten über den denkprozess äußerst rar sind. er spekulierte, dass openai dieses mal eine große menge synthetischer daten verwenden sollte.
·es wird für menschen immer schwieriger, ihr verständnis für künstliche intelligenz zu verbessern, um mit der entwicklungsgeschwindigkeit der künstlichen intelligenz schritt zu halten. wenn künstliche intelligenz übermenschlich ist, ist dies eine große governance-herausforderung fähigkeiten, es ist wahrscheinlich, dass es zeiten geben wird, in denen menschen nicht in der lage sind, ihre superkräfte zu aktivieren, weil sie außerhalb der menschlichen wahrnehmungsebene liegen.
das von openai eingeführte neue modell o1 verfügt über leistungsstarke argumentationsfunktionen. visuelle china-karte
am 12. september (ortszeit) brachte openai eine neue generation der modellreihe o1 auf den markt. im vergleich zu früheren modellen hat dieses modell starke denkfähigkeiten bewiesen und bei der bewältigung von benchmark-aufgaben in physik, chemie und biologie eine ebenso gute leistung gezeigt diese fähigkeit hatten frühere modelle nicht.
am 13. september sagte xiao yanghua, professor und doktorvater an der fakultät für informatik und technologie der fudan-universität und direktor des shanghai key laboratory of data science, in einem interview mit the paper, dass die entstehung des o1-modells dies bedeute die argumentationsfähigkeiten großer modelle können das expertenniveau vollständig erreichen. dies kann als meilenstein in der künstlichen intelligenz angesehen werden, der die anwendung von modellen auf unternehmensseite erheblich verbessern wird.
er gab jedoch auch zu, dass die intellektuellen, wahrnehmungsmäßigen und rationalen fähigkeiten des modells die menschlichen fähigkeiten übertreffen werden. es sei schwierig vorherzusagen, welche auswirkungen künstliche intelligenz auf den menschen haben wird „die entwicklung übersteigt mittlerweile die geschwindigkeit, mit der der mensch sie verstehen kann, und die steuerung künstlicher intelligenz wird eine große herausforderung sein“, sagte xiao yanghua.
gute denkfähigkeit bei komplexen aufgaben, leistung ähnlich der eines doktoranden.
als frühes modell verfügt das neue inferenzmodell o1 noch nicht vollständig über die von chatgpt verwendeten funktionen, wie z. b. das durchsuchen von netzwerkinformationen, das hochladen von dateien und bildern usw. openai sagte jedoch, dass dies eine erhebliche verbesserung für komplexe denkaufgaben darstelle und eine neue ebene der fähigkeiten der künstlichen intelligenz darstelle.
„durch training lernen sie, ihre denkprozesse zu verfeinern, verschiedene strategien auszuprobieren und ihre fehler zu erkennen.“ groß angelegte reinforcement-learning-algorithmen bringen den modellen bei, mithilfe ihrer gedankenketten während des trainingsprozesses effektiv zu denken, und das o1-modell kann vorher denken auf den benutzer reagieren erzeugen sie eine lange interne gedankenkette. mit mehr verstärkendem lernen und mehr zeit zum nachdenken verbessert sich die leistung von o1 weiter. es lernt, knifflige schritte in einfachere zu zerlegen. wenn die aktuelle methode nicht funktioniert, versucht sie einen anderen ansatz.
das neue inferenzmodell o1 zeichnet sich durch mathematik und programmierung aus und zeichnet sich durch die präzise generierung und fehlerbehebung komplexer codes aus. openai bewertete die mathematische leistung des modells im aime (american mathematics invitational competition) bei der aime-prüfung 2024. bei einer einzelnen stichprobe jedes problems erreichte o1 durchschnittlich 74 %(11,1/15). bei der qualifikationsprüfung zur internationalen mathematischen olympiade (imo) löste gpt-4o nur 13 % der probleme richtig, während das neue argumentationsmodell 83 % erreichte.
das neue modell kann komplexe aufgaben lösen und benchmark-aufgaben in physik, chemie und biologie wie ein doktorand bearbeiten. openai führte gpqa-diamanten-benchmarks in chemie, physik und biologie durch. um das modell mit menschen zu vergleichen, wurden promovierte experten rekrutiert, um gemeinsam fragen zu beantworten.
„wir haben herausgefunden, dass o1 die menschlichen experten übertraf und damit das erste modell war, dem dies in diesem benchmark gelungen ist. diese ergebnisse bedeuten nicht, dass o1 in allen aspekten leistungsfähiger ist als doktoranden, sondern nur, dass das modell die bedürfnisse von doktoranden besser lösen kann. forscher im gesundheitswesen.“ kann o1 verwenden, um zellsequenzierungsdaten zu kommentieren, physiker können o1 verwenden, um die komplexen mathematischen formeln zu generieren, die für die quantenoptik benötigt werden, und es kann von entwicklern in allen bereichen verwendet werden, so openai, um mehrstufige arbeitsabläufe zu erstellen und auszuführen.
die fähigkeit zur meilensteinbegründung wird die anwendungseffekte erheblich verbessern
„das vorherige große sprachmodell ähnelte eher einem studenten der geisteswissenschaften und ist noch weit vom niveau eines studenten der naturwissenschaften entfernt. die kernfähigkeit der menschlichen intelligenz ist jedoch das denken und denken. die o1-serie des neuen argumentationsmodells von openai zeigt den menschlichen denkprozess.“ „xiao yanghua sagte: die essenz des neuen inferenzmodells o1 ist immer noch ein großes sprachmodell, aber es schöpft das potenzial des großen modells voll aus.“ in der vergangenheit wurde die generierungsfähigkeit großer modelle durch den korpus bestimmt, der etwa „mit dreihundert tang-gedichten vertraut ist, und man kann sie rezitieren, auch wenn man nicht weiß, wie man sie verfasst“. die fähigkeit zum denken auf expertenebene ist jedoch keine frage-und-antwort-taktik, sondern erfordert ein starkes denkvermögen. die schwierigkeit beim training großer modellschlussfähigkeiten besteht darin, dass eine große anzahl menschlicher denkprozesse nie zum ausdruck gebracht wird, sodass daten über den denkprozess äußerst rar sind. er spekulierte, dass openai dieses mal eine große menge synthetischer daten verwenden sollte.
„openai hat einen klaren first-mover-vorteil. sein basismodell ist stärker, es sammelt viele denkprozessdaten, überprüft und synthetisiert eine große menge hochwertiger denkdaten und verfügt über starke bewertungsfähigkeiten. welche denkprozesse sind richtig?“ und welche argumentationsprozesse es ist falsch, was den einsatz von reinforcement learning erfordert. „reinforcement learning“ ist im wesentlichen ein prozess des erkundens und ausprobierens. wenn es nicht funktioniert, versuchen sie es einfach mit einer anderen methode mit diesen technologien und daten hat openai das große modell zu einem echten modell für naturwissenschaftsstudenten gemacht und expertenniveau erreicht.
chen yunwen, vorsitzender von daguan data, sagte, dass frühere modelle komplexe fortgeschrittene mathematische probleme nicht berechnen konnten und o1 über verbesserte mathematische fähigkeiten und argumentationsfähigkeiten verfügt, was eine große verbesserung darstellt. die verbesserung der mathematischen fähigkeiten bedeutet jedoch nicht, dass das forschungs- und entwicklungsparadigma großer modelle wesentliche änderungen erfahren hat, sondern lediglich gezielte verbesserungen bei früheren mängeln.
nach ansicht von xiao yanghua kam das aufkommen von o1 nicht unerwartet. „tatsächlich gingen wir schon sehr früh davon aus, dass große modelle über stärkere emotionale und rationale fähigkeiten verfügen würden.“ hier, und der effekt ist so erstaunlich.“ er glaubt, dass sich openai in zukunft in viele große modelle differenzieren könnte, die auf der grundlage des allgemeinen großen modells gut darin sind, verschiedene dinge zu tun.
beispielsweise waren die vorgängerversionen von gpt-4 mit allen kenntnissen und fakten vertraut und legten wert auf intellektuelle fähigkeiten; bei gpt-4o standen die wahrnehmungsfähigkeiten im vordergrund; die verbesserung der modellrationalität wird es der to-b-industrie ermöglichen, eine enorme entwicklung einzuleiten. „der größte schmerz und engpass von to b liegt in den argumentationsfähigkeiten großer modelle. das aufkommen des neuen inferenzmodells der o1-serie bedeutet, dass viele probleme in der to b-branche in zukunft erheblich gemildert werden können.“
herausforderungen durch die rasante entwicklung der künstlichen intelligenz
„openai ist wirklich leistungsstark. obwohl die technische roadmap von openai bisher nicht über den erkenntnisbereich hinausgegangen ist, kennen wir alle die entwicklungsrichtung großer modelle, einschließlich multimodalität und verbesserter argumentationsfähigkeiten, aber nur openai hat sie schnell in die realität umgesetzt.“ sie trainieren große modelle genauso wie menschen. sie haben sehr starke vorstellungen von der intellektuellen entwicklung und der kognitiven entwicklung des menschen und haben bisher keine falschen schritte gefunden. " erklären.
openai hat offensichtliche first-mover-vorteile bei der entwicklung groß angelegter inländischer modelle: „die vorteile von openai sind für uns alle nachteile. wir müssen uns beruhigen und langsam aufholen. im allgemeinen bereich der künstlichen intelligenz gibt es nur den ersten, nicht den zweiten.“ „auf lange sicht gibt es jedoch eine obergrenze für die verbesserung der individuellen fähigkeiten großer modelle, sagte xiao yanghua. weil die echten originaldaten des menschen begrenzt sind und die produktionsgeschwindigkeit langsam ist. „derzeit verwendet openai menschliche daten, um neue daten zu synthetisieren und die denkfähigkeit zu verbessern. allerdings sind synthetische daten durch die originaldaten begrenzt. es kann weder unendlich viele daten synthetisieren noch im wesentlichen neuartige daten erhalten. aus diesem grund kann es keine neuen themen erfinden. schlagen sie vor eine neue theorie wie einstein. „in bezug auf die hardware erfordert das denken weniger rechenleistung als das training, aber aufgrund der verlängerung der denkkette werden die anforderungen an die effizienz des denkens höher, was höhere anforderungen an die beschleunigung und optimierung des denkens stellt.“ argumentationsprozess.
da sich große modelle jedoch in vielerlei hinsicht verbessert haben, haben sie die governance vor herausforderungen gestellt. die herausforderung besteht darin, dass sich das menschliche verständnis für sie nicht so schnell verbessert hat, wie es sich entwickelt hat.
der philosoph kant teilte den menschlichen erkenntnisprozess in drei phasen ein: wahrnehmungsbezogen, intellektuell und rational. heutzutage verbessern sich die sensibilität, intelligenz und rationalität großer modelle und es ist wahrscheinlich, dass nur sehr wenige menschen in diesen drei erkenntnissen stark sind.
„derzeit hat o1 das niveau eines doktoranden erreicht. in zukunft wird das erreichen des niveaus eines wissenschaftlers nur noch ein prozess sein, bei dem quantitative veränderungen erreicht werden. der mensch wird nach und nach in den kognitiven blinden fleck der entwicklung künstlicher intelligenz geraten.“ was bedeutet beispielsweise die derzeitige denkfähigkeit großer modelle? kann sie wirklich in der ki eingesetzt werden? der anteil der menschen über dem wissensniveau wird immer kleiner. fast niemand auf der welt kann den doktortitel erreichen. niveau in mathematik, physik, chemie oder mathematik. „wie viele von uns können ki verstehen, erkennen und kontrollieren?“ governance-herausforderung. themen wie beschäftigung, wirtschaft, ethik und soziale beziehungen werden eine breite diskussion auslösen. „der mensch ist der entsperrer der magie der künstlichen intelligenz. wenn künstliche intelligenz über übermenschliche fähigkeiten verfügt, handelt es sich wahrscheinlich um superkräfte, die der mensch nicht aktivieren kann.“ liegen jenseits der menschlichen erkenntnisebene.“
der zeitungsreporter zhang jing
(dieser artikel stammt von the paper. für weitere originalinformationen laden sie bitte die „the paper“-app herunter.)
bericht/feedback