Nachricht

Wer kann Sora in Bezug auf praktische Erfahrung bei der Entwicklung inländischer KI-Video-Großmodelle übertreffen?

2024-08-10

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

Cover-Nachrichtenreporter Xiong Yingying
Anfang dieses Jahres veröffentlichte das amerikanische Unternehmen OpenAI das AI-Videogenerierungsmodell Sora, das wie ein Donnerschlag auf dem Boden war und neue Möglichkeiten für Anwendungen der künstlichen Intelligenz eröffnete. Damals beklagten viele Internetnutzer, dass die Kluft zwischen uns und ausländischer KI-Technologie immer größer werde.
Allerdings wurden in nur einem halben Jahr nacheinander „inländische Sora“ wie Keling, PixVerse V2, Qingying und Vidu veröffentlicht und stehen Benutzern kostenlos zur Verfügung.
Welches inländische Videomodell ist das beste? Während die Technologie weiterhin bahnbrechende Fortschritte macht, stellt sich die Frage, wer bei der Kommerzialisierung die Führung übernehmen kann?
4 „inländische Sora“-Produkte werden in diesem Monat auf den Markt gebracht
Tatsächliche Testerfahrung des Reporters
Während der Preiskampf zwischen großen inländischen Herstellern und großen Modellen heftig ist, konzentrieren sich einige Unternehmen auf den Bereich der KI-Videogenerierung und unternehmen heimliche Anstrengungen. Unvollständigen Statistiken zufolge gibt es derzeit mehr als 10 große inländische KI-Videomodelle. Allein im Juli dieses Jahres wurden 4 „inländische Sora“-Modelle online gestartet.
Am 6. Juli wurde die Kuaishou Keling AI-Webseite offiziell gestartet und bietet Wensheng-Video- und Tusheng-Videofunktionen, mit denen Videos mit einer Länge von bis zu 10 Sekunden erstellt werden können. Außerdem wurden Funktionen wie die Steuerung der Kamerabewegung und die Anpassung des ersten und letzten Bildes hinzugefügt.
Am 24. Juli veröffentlichte Aishi Technology offiziell PixVerse V2, das gleichzeitig weltweit veröffentlicht wird. Dieses Modell kann mehrere Videoclips gleichzeitig generieren und eine Videogenerierung von 8 Sekunden für einen einzelnen Clip und 40 Sekunden für mehrere Clips erreichen.
Anschließend wurden nacheinander auch Qingying, erstellt von Zhipu AI Company, und Vidu, unabhängig entwickelt von Shengshu Technology, veröffentlicht. Unter anderem konzentriert sich Qingying auf die schnelle Generierung innerhalb von 30 Sekunden; Vidu fügt zusätzlich zum üblichen realistischen Stil die Generierung von Videoclips im Animationsstil hinzu.
Die groß angelegten Videogenerierungsmodelle der oben genannten vier Unternehmen stehen derzeit zum Testen zur Verfügung. Nach kurzer Registrierung per Telefon, E-Mail usw. hatten Reporter auch tatsächliche Erfahrungen.
Um die Funktion „Bildvideo“ zu testen, hat der Reporter das gleiche Bild einer Rose, die noch nicht geblüht hat, auf vier große Model-Websites hochgeladen und das Eingabewort „Blume blüht“ eingegeben. Sowohl Qingying als auch Vidu haben erfolgreich Rosen generiert Video von blühenden Blumen. In dem von PixVerse und Keling erstellten Video kann man die Blumen schwingen sehen, aber es gibt keinen dynamischen Effekt des „Blühens“. Aber als der Reporter das Aufforderungswort in „eine langsam blühende Blume“ änderte, erstellte Keling auch erfolgreich ein Video einer blühenden Rose. Es ist ersichtlich, dass es Unterschiede in der Fähigkeit verschiedener großer Modelle gibt, Sprache zu verarbeiten und zu verstehen.
Video-Screenshots von vier inländischen Großmodellen
Gemessen an der Geschwindigkeit der Videogenerierung erzielte Vidu die schnellste Zeit und erstellte ein 3-Sekunden-Video in weniger als 1 Minute. Die anderen drei großen Modelle haben die Videogenerierung alle innerhalb von 5 Minuten abgeschlossen. Obwohl Qingying mit einer „schnellen Generierung in 30 Sekunden“ wirbt, wird auf der Generierungsseite „voraussichtlich 3 Minuten in der Warteschlange“ angezeigt, vielleicht weil zu viele Leute es versuchen.
Den Erfahrungsrückmeldungen von Internetnutzern auf sozialen Plattformen nach zu urteilen, haben alle großen Modelle mehr oder weniger Probleme wie Zeichenverzerrungen und fehlende Bilder.
„Es gibt viele, die abwarten, aber nur wenige, die handeln.“
Investitionen im Bereich großer Modelle sind eher zurückhaltend
Als Sora Anfang des Jahres geboren wurde, gab es im Internet noch pessimistische Stimmen, die glaubten, China sei im Bereich der KI weit hinter den USA zurückgeblieben. In nur einem halben Jahr sind in China eine Reihe großer KI-Videomodelle entstanden, die mit Sora konkurrieren.
Tianyancha zeigt, dass Zhipu AI, gegründet 2019, die Finanzierung der Serie C abgeschlossen hat und derzeit einen Wert von mehr als 10 Milliarden hat. Obwohl Aishi Technology und Shenshu Technology erst im Jahr 2023 gegründet wurden, haben sie drei bzw. vier Finanzierungsrunden abgeschlossen. Heißt das, dass die Investitionsbereitschaft in großen Modellrennbahnen nach wie vor groß ist?
„Grundsätzlich sehen wir immer noch mehr und investieren sehr wenig.“ Guo Tao, ein Angel-Investor und Experte auf dem Gebiet der künstlichen Intelligenz, sagte, dass die größten Investoren derzeit mehrere große Internetunternehmen seien, die umfangreich in mehrere große Modelle investiert hätten Projekte. Einerseits können große Hersteller einige Anwendungsszenarien für große Videomodelle in ihren bestehenden Geschäften finden. Andererseits können diese großen Modelle, wenn sie einen gewissen Grad an Überschneidung mit dem eigenen Geschäft haben, als Ergänzung dazu verwendet werden Auch die Produktpalette großer Hersteller kann durch vorhandene ökologische Ressourcen bis zu einem gewissen Grad gestärkt werden.
Das KI-Unternehmen Zhipu hat in mehreren Finanzierungsrunden über 100 Millionen Yuan eingesammelt
Insgesamt haben inländische Investmentinstitute gegenüber großen Modellen wie Vincent Video und Tush Video immer noch eine konservative und vorsichtige Haltung. Der Hauptgrund dafür ist, dass ihre Kommerzialisierung vor vielen Herausforderungen steht.
Nach Ansicht von Guo Tao weisen die erstellten Videos immer noch gewisse Mängel auf, egal ob es sich um Sora oder ein großes inländisches Model handelt. Beispielsweise haben KI-generierte Charaktere manchmal einen zusätzlichen Finger, können beim Schießen den Korb nicht treffen usw. Dies zeigt, dass das große Modell die räumliche Beziehung zwischen Objekten nicht ausreichend versteht und auch das Algorithmusmodell weiter verbessert werden muss.
Neben technischen Problemen, die noch überwunden werden müssen, ist der größte Schwachpunkt bei der Kommerzialisierung großer KI-Videomodelle das Fehlen ausgereifter Anwendungsszenarien.
„Kuaishou selbst verfügt beispielsweise über eine Plattform und Inhalte und relativ gesehen über bestimmte Anwendungsszenarien. Viele Self-Media-Unternehmen nutzen sie möglicherweise, aber für einige rein technische Unternehmen ist es immer noch schwierig, sie zu finden.“ . Ein besonders gutes und starres Nachfrageszenario, bei dem die Benutzer bereit sind zu zahlen.
Plattform beschleunigt die Erforschung der Kommerzialisierung
Es wird erwartet, dass der Markt für Mikrokurzfilme bei der Landung die Führung übernehmen wird
Auch wenn es bei der Kommerzialisierung Herausforderungen gibt, erforschen und versuchen große Modellplattformen im In- und Ausland aktiv die Kommerzialisierung.
Der Reporter stellte fest, dass derzeit auch inländische KI-Videomodelle begonnen haben, auf Verbraucherseite zu zahlen. Am 24. Juli enthüllte der offizielle WeChat-Beitrag von Keling AI, dass die Zahl der Benutzer, die Berechtigungen beantragt haben, 1 Million überschritten hat. Am selben Tag wurde gleichzeitig das kostenpflichtige Mitgliedschaftssystem eingeführt, das drei Mitgliedschaftskategorien umfasst: Gold, Platin und Diamant. Der jährliche Mitgliedspreis liegt zwischen über 500 Yuan und mehr als 5.000 Yuan.
PixVerse verwendet ein Abonnement-Zahlungsmodell, einschließlich Basisversion, Standardversion und unbegrenzter Version, mit Stückpreisen zwischen 5 Yuan und 60 Yuan.
Viele Brancheninsider sagten jedoch, dass große KI-Modelle derzeit noch sehr hohe Rechenleistungskosten und Kundenakquisekosten haben und der Wettbewerb auf dem Markt äußerst hart ist Es ist nicht einfach, Rentabilität zu erzielen bei C-seitiger Zahlung.
Medienberichten zufolge hat die weltbekannte Kinderspielzeugmarke „Toys R Us“ im Juni dieses Jahres mit OpenAI zusammengearbeitet, um den von Sora produzierten 1-minütigen Werbefilm „The Origin of Toys R Us“ zu nutzen Die Generierung realisierbarer kommerzieller Werbung für Sexualität wird weiter demonstriert.
Im Juli wurde das erste inländische AIGC-Original-Fantasy-Mikrokurzdrama „Mountains and Seas Strange Mirror: Breaking the Waves“ offiziell veröffentlicht. Das Drama hat 5 Episoden und eine Dauer von 15 Minuten , der fantastische Kunpeng und das seltsame Biest usw. werden alle von KI generiert.
Da immer mehr Produktionsfirmen und Plattformen beginnen, den Integrationspfad von „KI + Mikrokurzdrama“ zu erkunden, könnten große KI-Videomodelle die ersten sein, die auf dem Mikrokurzdramamarkt kommerzialisiert werden.
Bericht/Feedback