nachricht

wie „vernünftig“ o1 wie ein mensch? fragen und antworten des openai-forschungsteams: enthüllung von modelldetails, zukunftsplänen und tipps zur maximierung der o1-leistung

2024-09-15

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

am 13. september kündigte openai das offizielle debüt der o1-modellreihe an, was eine neue ära im ki-bereich markierte und die ära großer modelle einläutete, die in der lage sind, allgemeine komplexe argumentationsaufgaben auszuführen. nach der veröffentlichung des modells veranstaltete das openai-forschungsteam eine ama-veranstaltung (ask me anything) auf der sozialen plattform x, bei der viele details des modells der o1-serie ausführlich enthüllt wurden.

bildquelle: x soziale plattform
  • ki-assistent der stufe „alien“.

laut openai umfasst die o1-serie zwei versionen: o1-preview, eine frühe iteration des vollständigen modells, und das schnellere, leichte o1-mini. im gegensatz zu früheren modelleno1 ist in der lage, lange ketten verborgener denkprozesse zu erzeugen, bevor es die endgültige antwort gibt, und demonstriert so menschenähnliche denkfähigkeitenforscher vergleichen o1 mit einem „alien“ mit superkräften

bildquelle: x soziale plattform

während des begründungsprozesseso1 nutzt verstärkungslernen, um eine „argumentation“-leistung zu erzielen. obwohl es derzeit keine pläne gibt, diese gedankenketten-token api-benutzern oder chatgpt anzuzeigen, haben die forscher herausgefunden, dass die in den eingabeaufforderungen eingebetteten anweisungen die denkweise von o1 beeinflussen können. im gegensatz,gpt-4o kann durch eingabeaufforderungen nicht das leistungsniveau der gedankenkette von o1 erreichen

bildquelle: x soziale plattform

das modell der o1-serie verwendet denselben tokenizer wie gpt-4o und bleibt beim eingabe-token konsistent. aber,o1 ist in der lage, längere, offenere aufgaben zu bewältigen, wodurch die notwendigkeit einer eingabeaufteilung reduziert wird. zukünftig wird o1 auch größere eingabekontextfenster unterstützen

o1 zeigte auch beeindruckende denk- und verallgemeinerungsfähigkeiten, wie das entschlüsseln von codes, das nachdenken über philosophische fragen und die durchführung von selbsttests zur beurteilung seiner fähigkeiten.

das hat das forschungsteam auch herausgefundendie leistung von o1-preview bei einigen personalisierten schreibaufgaben entspricht der leistung von gpt-4o oder ist etwas besser als diese.

  • ist die mini-version noch stärker?

im vergleich zu o1-preview ist o1-mini hinsichtlich größe und geschwindigkeit optimiert.

bildquelle: x soziale plattform

obwohl es in einigen bereichen wie dem weltwissen einschränkungen geben kann,o1-mini demonstriert seine vorteile bei mint-aufgaben (wissenschaft, technologie, ingenieurwesen, mathematik) und code-bezogenen aufgaben. auch,o1-mini kann mehr gedankenketten erkunden als o1-preview

bildquelle: x soziale plattform
  • o1 wird bald die tool-integration und das multimodale verständnis unterstützen

obwohl o1-preview derzeit keine tools verwendet,openai plant, funktionen wie funktionsaufrufe, code-interpreter und web-browsing hinzuzufügen. tool-unterstützung, strukturierte ausgabe und systemansagen werden in zukünftigen updates ebenfalls eingeführt

bildquelle: x soziale plattform

darüber hinaus erklärte das openai-entwicklerteam:in zukunft können benutzer die denkzeit und token-limits von o1 steuern.und versprach, die umsetzung dieser funktion aktiv voranzutreiben.

openai fördert außerdem aktiv die streaming-unterstützung und das feedback zum inferenzfortschritt in der api. auch,o1 verfügt bereits über integrierte multimodale funktionen,es wird erwartet, dass es das neueste niveau bei multimodalen verständnisaufgaben (mmlu) erreicht.

bildquelle: x soziale plattform
  • o1-mini hat ein limit von 50 prompts pro woche

o1-mini steht derzeit chatgpt plus-benutzern offen, es gibt jedoch ein limit von 50 eingabeaufforderungen pro woche.alle trinkgelder werden auf das gleiche kontingent angerechnet. openai verspricht,api-zugriffsebenen und ratenlimits werden in zukunft schrittweise erhöht, und nach der lockerung der beschränkungen werden mengenrabatte gewährt.

es wird erwartet, dass die preisgestaltung des o1-modells dem trend der preissenkungen alle 1–2 jahre folgt. auch,persönliche unterstützung bei der feinabstimmung steht auf der produkt-roadmap, aber der genaue veröffentlichungsplan ist noch nicht klar.

bildquelle: x soziale plattform
  • geheimnisse zur maximierung der o1-leistung

o1-mini wird derzeit mit daten vom oktober 2023 trainiert, und zukünftige iterationen werden neuere datensätze verwenden, um sein wissen über die welt zu erweitern.

um die argumentationsvorteile von o1 voll auszuschöpfen,das team empfiehlt den benutzern, beim entwerfen von eingabeaufforderungen informative, konkrete beispiele für grenzfälle bereitzustellen und die erforderlichen argumentationsschritte und den stil klar anzugeben. aber sei vorsichtig,ein irrelevanter kontext kann den inferenzprozess des modells beeinträchtigen

tägliche wirtschaftsnachrichten, umfassende selbstöffentliche informationen

tägliche wirtschaftsnachrichten

bericht/feedback