Nachricht

Die Videogenerierung bricht sprunghaft durch, HiDream.ai HiDream.ai-Modell 2.0 erreicht die Minutenebene

2024-08-12

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

Kürzlich hat HiDream.ai mit dem HiDream-Modell 2.0 einen großen Durchbruch im Bereich Wensheng-Videos erzielt und die Videogenerierungszeit von 15 Sekunden im letzten Jahr auf Minutenniveau erhöht, nachdem im Dezember letzten Jahres die 4-Sekunden-Grenze überschritten wurde . Ein weiterer Technologiesprung nach vorne.

Die Wensheng-Videofunktion von HiDream.ai HiDream.ai 2.0 wurde dank der selbst entwickelten DiT-Architektur hinsichtlich Dauer, Natürlichkeit des Bildes, Inhalt und Charakterkonsistenz deutlich verbessert. Im Vergleich zur herkömmlichen U-Net-Architektur weist die DiT-Architektur eine höhere Flexibilität auf und kann die Qualität der Bild- und Videoerzeugung effektiv verbessern. Wie wir alle wissen, basiert die grundlegende Implementierung der DiT-Architektur auf der Transformer-Technologie. Um die Leistung dieser Technologie weiter zu verbessern, übernimmt HiDream.ai HiDream Large Model 2.0 vollständig selbst entwickelte Module für die gesamte Transformer-Netzwerkstruktur, die Trainingsdatenzusammensetzung und Trainingsstrategien, insbesondere im Hinblick auf Trainingsstrategien und Verbesserung.

Dieses Modell verwendet einen effizienten räumlich-zeitlichen gemeinsamen Aufmerksamkeitsmechanismus, der sich nicht nur an die räumlichen und zeitlichen Domäneneigenschaften des Videos anpasst, sondern auch das Geschwindigkeitsproblem des herkömmlichen Aufmerksamkeitsmechanismus im Trainingsprozess löst. Um das Training längerer Videoclips zu unterstützen, kann HiDream.ai HiDream Large Model 2.0 Videoclips von mehreren Minuten oder sogar zehn Minuten verarbeiten und ermöglicht so die direkte Ausgabe von minutenlangen Videos. Gleichzeitig hat HiDream.ai auch ein Untertitelmodell für die Generierung von Videobeschreibungen entwickelt, um eine detaillierte und genaue Beschreibung von Videoinhalten zu erreichen.

In Bezug auf die Trainingsstrategie verwendet HiDream.ai HiDream Large Model 2.0 Videoclips unterschiedlicher Länge für das gemeinsame Training von Video- und Bilddaten und passt die Abtastrate von Videos unterschiedlicher Länge dynamisch an, um das Totaltraining abzuschließen. Darüber hinaus führt das Modell auch erweiterte chemische Analysen auf der Grundlage von Benutzer-Feedback-Daten durch.Gewohnheit, um die Leistung weiter zu optimieren.

Das HiDream Large Model 2.0 von HiDream.ai wurde von ursprünglich 15 Sekunden auf das Minutenniveau erweitert und hat nun eine deutliche Steigerung der Videogenerierungszeit erreicht und damit das branchenführende Niveau erreicht. Neben der deutlichen Verbesserung der Videodauer auf Minutenebene ist ein weiteres Highlight dieses Upgrades die Variabilität der Videodauer und -größe. Frühere Modelle zur Videogenerierung haben in der Regel eine voreingestellte feste Dauer und können vom Benutzer nicht ausgewählt werden. HiDream.ai gibt Benutzern das Recht, die Videodauer entweder direkt festzulegen oder das System dynamisch anhand des Inhalts der Eingabeaufforderung beurteilen zu lassen. Wenn der Inhalt komplex ist, generiert das System ein längeres Video; wenn der Inhalt einfach ist, wird ein kürzeres Video generiert. Bei dieser dynamischen Anpassungsmethode kann das System die kreativen Anforderungen des Benutzers adaptiv erfüllen. Gleichzeitig kann die Größe des Videos auch an die Bedürfnisse des Benutzers angepasst werden. Dieses flexible Design verbessert das Benutzererlebnis erheblich.

Erwähnenswert ist, dass das HiDream Large Model 2.0 von HiDream.ai auch das Erscheinungsbild von Videobildern deutlich verbessert hat. Die Bewegungen von Objekten sind natürlicher und flüssiger, die Details werden feiner wiedergegeben und es unterstützt 4K Ultra-High-Definition Video. Klare Bildqualität. Mit diesem Technologie-Upgrade entwickelt sich das HiDream Large Model 2.0 von HiDream.ai schnell in Richtung der Erzeugung hochwertigerer Videos mit mehreren Objektiven und beschleunigt sich in Richtung L3-Stufe. Es wird davon ausgegangen, dass die aktualisierte Vincent Video-Funktion bald zum Einsatz kommt und Benutzer umfangreichere und qualitativ hochwertigere Videogenerierungsdienste nutzen können.

Brancheninsider sagten, dass mit der kontinuierlichen Verbesserung und Aktualisierung des großen Modells 2.0 von HiDream.ai HiDream.ai weitere revolutionäre Veränderungen im Bereich der Erstellung von Videoinhalten erwartet werden, Benutzern dabei geholfen wird, kreative Monetarisierung einfacher zu realisieren und die gesamte Branche zu fördern hin zu einem breiteren Entwicklungsraum.

(Quelle: Financial Business Information)

Für weitere spannende Informationen laden Sie bitte den „Jimu News“-Client im Anwendungsmarkt herunter. Bitte nicht ohne Genehmigung nachdrucken. Sie können gerne Nachrichtenhinweise geben und werden nach der Annahme bezahlt.

Bericht/Feedback