nachricht

huang renxuns vorhersage ist wirklichkeit geworden. google demonstriert das echtzeit-ki-modell gamengen

2024-08-29

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

① durch maschinelles lernen ermöglichten forscher es dem gamengen-modell, in den 1990er jahren das ego-shooter-spiel „doom“ erfolgreich in echtzeit zu generieren. ② obwohl das fertige produkt noch rau ist, zeigt diese forschung weiterhin die aussichten für zukünftige ki-generierte spiele ③ jensen huang, ceo von nvidia, sagte einmal voraus, dass wir in etwa 5 bis 10 jahren spiele sehen werden, die vollständig von ki generiert werden.

financial associated press, 29. august (herausgeber shi zhengcheng)die ära der echtzeitgenerierung von spielen durch ki-modelle ist still und leise für uns angebrochen.

diese woche veröffentlichten forscher von google und der universität tel aviv einen artikel mit dem titel „das diffusionsmodell ist eine echtzeit-spiel-engine„der artikel stellt gamengen vor, die erste spiel-engine in der computergeschichte, die vollständig von neuronalen netzwerkmodellen unterstützt wird.

(quelle: github)

die forscher schrieben in der arbeit: „heutzutage werden videospiele von menschen programmiert, und gamengen ist teil des proof-of-concept für ein neues paradigma in game-engines – bei dem spiele zu gewichten neuronaler modelle und nicht zu codezeilen werden.。”

um es verständlicher auszudrücken: alle aktuellen videospiele sind vorgefertigt, entwickler müssen code schreiben, spieltexte und texturmodelle vorbereiten und diese dann auf der spielkarte platzieren – davon hängen die rendering- und statusaktualisierungen des spielbildschirms ab für manuell bearbeitete regeln aktiviert. doch das gamengen-modell eröffnet eine ganz andere idee:verwenden sie ki-generierungsmodelle, um spielbilder in echtzeit basierend auf den aktionen und reaktionen des spielers zu berechnen und zu generieren.

in der demonstration gelang es den forschern mithilfe maschinellen lernens, das ego-shooter-spiel „doom“ in den 1990er-jahren mithilfe des gamengen-modells erfolgreich in echtzeit zu generieren. das video zeigt, dass spieler in dem ki-generierten spiel in der szene waffen drehen und abfeuern können und gleichzeitig die anzahl der verbleibenden kugeln, das verbleibende blutvolumen nach dem angriff und die erforderlichen bedingungen genau wiedergeben können zum öffnen des nächsten levels erfüllt sind.

(quelle: demonstrationsvideo)

es ist zu beachten, dass es sich bei der oben gezeigten bildserie ausschließlich um bilder handelt, die von ki in echtzeit generiert wurden.die neuesten fortschritte zeigen auch, dass ki-modelle nach erfolgreicher generierung von texten, bildern, audio und kurzen videos möglicherweise in der lage sind, spielszenen zu generieren, was eine deutlich höhere logik, kohärenz und echtzeitinteraktion erfordert.

wie haben sie es gemacht?

um diese ki, die spiele in echtzeit generieren kann, zu trainieren, muss sie laut dem forschungsteam zunächst einen reinforcement learning (rl)-agenten trainieren, um das spiel zu spielen, und dann die aufgezeichneten clips verwenden, um das generative diffusionsmodell zu trainieren vorhersagen basierend auf vergangenen szenen und spieleraktionen, weshalb ki-generierte spiele veränderungen in gesundheit und munition sowie animationen von angegriffenen feinden anzeigen können.

die größere herausforderung besteht darin, die von der ki erzeugten bilder zeitlich und logisch kohärent zu halten. um die autoregressive drift während der inferenz zu mildern, zerstörten die forscher die kontextrahmen, indem sie während des trainings gaußsches rauschen zu den codierten rahmen hinzufügten, was es der ki ermöglichte, die in vorherigen rahmen abgetasteten informationen zu korrigieren und so die stabilität der bilderzeugung über die zeit aufrechtzuerhalten.

(quelle: forschungsbericht)

das gaben forscher bekanntfür den betrieb dieses modells ist nur ein einziger tpu (googles selbst entwickelter ki-prozessor) erforderlich, der eine generierungsgeschwindigkeit von 20 bildern pro sekunde erreichen kann.

natürlich zeigen die obigen absätze auch die einschränkungen von gamengen: diese ki muss sich auf die eingabe vorhandener spiele (oder texte, bilder und anderer materialien) verlassen, um spiele zu generieren.

dr. jim fan, leitender forschungsmanager und leiter der embodied intelligence group bei nvidia, kommentierte in den sozialen medien:gamengen ähnelt eher einem neural radiation field (nerf) als einem videogenerierungsmodell. das neuronale strahlungsfeld erzeugt eine 3d-darstellung der szene, indem es bilder der szene aus verschiedenen winkeln aufnimmt. dies bedeutet aber auch, dass das modell nicht über die fähigkeit zur verallgemeinerung verfügt und sich keine neuen szenarien „vorstellen“ kann. dies ist auch der unterschied zwischen gamengen und sora: es können keine neuen szenen oder interaktionsmechanismen generiert werden.

(quelle: x)

dies erwähnten die forscher auch in der arbeit und erklärten, dass mit hilfe dieser technologiezukünftige spieleentwickler werden in der lage sein, neue spiele mit „textbeschreibungen und beispielbildern“ zu erstellen, wodurch es möglich wird, einen verfeinerten satz von bildern in ein neues spielbares level oder einen neuen spielbaren charakter für ein bestehendes spiel umzuwandeln, basierend ausschließlich auf beispielen und nicht auf programmierkenntnissen . .

jen-hsun huang: in 5–10 jahren wird es spiele geben, die vollständig von ki generiert werden

echtzeit-gaming mit ki-rendering ist keine neue idee. als im märz dieses jahres die neueste generation von chips mit blackwell-architektur auf den markt kam, sagte nvidia-ceo jensen huang folgendes voraus:in etwa 5 bis 10 jahren werden wir spiele sehen können, die vollständig von ki generiert wurden.

tatsächlich bewegt sich nicht nur das google-team in diese richtung.als openai dieses jahr erstmals die sora-demo veröffentlichte, demonstrierte es auch seine fähigkeit, das pixelspiel „minecraft“ zu simulieren.

(quelle: openai)

die jüngste entwicklung fällt auch mit cai haoyu, dem ehemaligen vorsitzenden von mihoyo, zusammen, der kürzlich heftige diskussionen darüber ausgelöst hat, „ihn zum austritt zu überreden“.

cai haoyu erklärte diese woche öffentlich:aigc hat die spieleentwicklung revolutioniert, jetzt braucht es nur noch zeit, bis sich dieses phänomen vollständig entfaltet. er glaubt, dass es in zukunft nur noch zwei arten von spieleentwicklern geben wird, in der branche weiterzuarbeiten: die besten 0,0001 % der genies und die 99 % der geschäftsenthusiasten, die spiele entwickeln, die ihren eigenen bedürfnissen entsprechen. was die verbleibenden spieleentwickler betrifft, die „vom normalfall zum profi“ wechseln, sollte jeder so schnell wie möglich seinen beruf wechseln.

(quelle: internet)