nachricht

plötzlich! der leiter von openai sora ist übergelaufen und zu google deepmind gewechselt

2024-10-04

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina



  neuer weisheitsbericht

herausgeber: qiao yangtaozi
[einführung in die neue weisheit]oeine weitere schlüsselfigur von penai ist zurückgetreten.der verantwortliche von sora hat gerade offiziell angekündigt, dass er openai verlassen wird, um sich google deepmind anzuschließen, was zufällig der anlass für die heutige veröffentlichung von canvas ist.
jedes mal, wenn openai etwas großes ankündigt, muss jemand gehen.
nein, canvas ist gerade erst erschienen, aber aus dem sora-projekt gibt es schon wieder schlechte nachrichten – der verantwortliche tim brooks hat auf twitter offiziell seinen rücktritt bekannt gegeben und ist google deepmind beigetreten.

ich werde google deepmind beitreten, um an der videogenerierung und weltsimulatoren zu arbeiten! ich kann es kaum erwarten, mit einem so talentierten team zusammenzuarbeiten.

ich bin hieropenaidie zwei jahre, die es dauerte, sora zu erschaffen, waren eine erstaunliche zeit. vielen dank an alle leidenschaftlichen und freundlichen menschen, mit denen ich zusammenarbeite. vorfreude auf die nächste etappe!

drücken sie den kürbis und starten sie die schaufel. es scheint, dass die offizielle rücktrittsankündigung am tag der veröffentlichung zur tradition von openai werden kann.

im kommentarbereich feierten google-chefs, darunter jeff dean, chefwissenschaftler von deepmind und google research, und logan kilpatrick, produktleiter von google ai studio.

denny zhou, gründer und leiter des deepmind-inferenzteams——

obwohl alexis conneau, der leiter des „her“-projekts, der vor der vollständigen veröffentlichung von gpt-4o zurücktrat, nicht zu google wechselte, fing er auch an, online witze zu machen – willkommen, ein ehemaliger openai-mitarbeiter zu werden.

es scheint, dass googles eigenes videogenerierungsmodell veo sora voraussichtlich übertreffen wird.

derzeit arbeitet bill peebles, soras anderer co-leiter, noch bei openai.

obwohl es im februar dieses jahres veröffentlicht wurde, ist sora immer noch ein „zukunftsmodell“ und steht nur einer kleinen gruppe von testern und künstlern des roten teams offen.

im gegensatz zum „her“-projekt, das die flagge „diesen herbst“ trägt, hat openai keine klare frist für die online-veröffentlichung angegeben.

als er den cto und die verantwortliche person traf, die nacheinander gingen, war soras zukunft erneut ungewiss.

persönliche erfahrung

tim brooks ist co-leiter des sora-projekts bei openai, wo sich seine forschung auf die entwicklung groß angelegter generativer modelle konzentriert, die die reale welt simulieren können.

dieser typ erhielt seinen doktortitel vom berkeley ai research center und sein doktorvater war alyosha efros. während seiner doktorarbeit schlug er eine technologie namens instructpix2pix vor.

bevor er zu openai kam, war er an der entwicklung der ki-technologie für mobile pixel-kameras bei google beteiligtnvidiaarbeitete an videogenerierungsmodellen.

gleichzeitig ist er auch der hauptforscher von dall·e 3.

ein weiterer teil seines lebenslaufs ist wirklich spannend – seine fotografischen arbeiten wurden von „national geographic“, „nature’s best photography“ und „national wildlife federation“ ausgezeichnet.

seine tierfotos:

er trat auch im beacon theater am broadway in new york auf und gewann preise bei internationalen a-cappella-bauchrednerwettbewerben.

die internetnutzer brachten ihren neid darüber zum ausdruck, dass er diese art von freiheit hat.

darüber hinaus stellte tim brooks in seinem lebenslauf auch eher „versailles“ fest: „ich habe eine leidenschaft für ki, und glücklicherweise passt diese leidenschaft perfekt zu meinen hobbys in fotografie, film und musik.“

nachdem ich deepmind beigetreten bin, habe ich gesagt, dass ich mich weiterhin mit der videogenerierung und weltsimulatoren befassen werde und weiterhin meine leidenschaft für ki mit meinen hobbys für fotografie und filme verbinden werde.

von der videogenerierung zur simulierten welt

im april dieses jahres, nur zwei monate nach der veröffentlichung des sora-modells, nahmen die co-leiter tim brooks und bill peebles an einer vom agi house organisierten grundsatzrede teil und äußerten ihre ansichten zur videoerzeugungstechnologie: „sie wird alles simulieren. implementierung von agi.“ ".

vincents videomodelle, wie beispielsweise soras nachgewiesene fähigkeit, komplexe szenen zu erzeugen, offenbaren nach und nach ein detailliertes verständnis der menschlichen interaktion und des physischen kontakts, was ein wichtiger schritt für agi ist.

um videos mit realistischen inhalten und realistischen bildern zu generieren, ist ein internes modell erforderlich, um zu verstehen, wie sich alle objekte und menschen in der umgebung bewegen und interagieren. daher glauben sie, dass sora zur entwicklung allgemeiner künstlicher intelligenz beitragen wird.

in bezug auf die methodik betonten sowohl tim brooks als auch bill peebles besonders die skalierbarkeit des modells. sie glauben, dass der grund für den erfolg des sprachmodells in seiner fähigkeit zur erweiterung liegt, und zitierten die ansichten in „the bitter lesson“:

langfristig gesehen werden sich methoden, die die leistung bei zunehmender skalierung verbessern, letztendlich durchsetzen, wenn die rechenleistung zunimmt.

durch die erstellung eines transformer-basierten frameworks und den vergleich verschiedener sora-modelle demonstrierten sie die auswirkung einer erhöhten rechenleistung beim modelltraining auf leistungsverbesserungen.

vom basismodell bis hin zu einem modell mit einer 32-fachen steigerung der berechnungen lässt sich eine allmähliche verbesserung des verständnisses von szenen und objekten feststellen.

wir haben immer versucht, unseren ansatz einfach zu halten, auch wenn die realität manchmal anspruchsvoller ist, als es sich anhört.

unser hauptaugenmerk liegt darauf, etwas so einfach wie möglich zu machen und es dann massiv zu skalieren.


referenzen: