La génération vidéo perce à pas de géant, le grand modèle 2.0 de HiDream.ai HiDream.ai entre dans les rangs des minutes

La génération vidéo fait un pas de géant, le modèle HiDream.ai HiDream.ai 2.0 entre dans le niveau minute

2024-08-12

Récemment, le modèle HiDream 2.0 de HiDream.ai a fait une percée majeure dans le domaine des vidéos Wensheng, augmentant le temps de génération vidéo de 15 secondes l'année dernière à une minute, après avoir dépassé la limite de 4 secondes en décembre de l'année dernière. . Un autre bond en avant technologique.

La fonction vidéo Wensheng de HiDream.ai HiDream.ai 2.0 a été considérablement améliorée en termes de durée, de naturel de l'image, de contenu et de cohérence des personnages, grâce à son architecture DiT auto-développée. Par rapport à l'architecture U-Net traditionnelle, l'architecture DiT offre une plus grande flexibilité et peut améliorer efficacement la qualité de la génération d'images et de vidéos. Comme nous le savons tous, la mise en œuvre de base de l'architecture DiT repose sur la technologie Transformer. Afin d'améliorer encore les performances de cette technologie, HiDream.ai HiDream Large Model 2.0 adopte des modules entièrement auto-développés pour l'ensemble de la structure du réseau Transformer, la composition des données de formation et les stratégies de formation, notamment en termes de stratégies de recherche approfondies et de stratégies de formation. amélioration.

Ce modèle adopte un mécanisme d'attention conjointe spatio-temporelle efficace, qui non seulement s'adapte aux caractéristiques du domaine spatial et temporel de la vidéo, mais résout également le problème de vitesse du mécanisme d'attention traditionnel dans le processus de formation. Afin de prendre en charge la formation de clips vidéo plus longs, HiDream.ai HiDream Large Model 2.0 peut traiter des clips vidéo de plusieurs minutes, voire dix minutes, permettant de sortir directement des vidéos d'une minute. Dans le même temps, HiDream.ai a également développé un modèle de sous-titrage pour la génération de descriptions vidéo afin d'obtenir une description détaillée et précise du contenu vidéo.

En termes de stratégie de formation, HiDream.ai HiDream Large Model 2.0 utilise des clips vidéo de différentes longueurs pour la formation conjointe des données vidéo et image, et ajuste dynamiquement le taux d'échantillonnage des vidéos de différentes longueurs pour compléter une formation longue durée. En outre, le modèle effectue également une analyse chimique améliorée basée sur les données des commentaires des utilisateurs.habitude, pour optimiser davantage les performances.

Étendu des 15 secondes d'origine au niveau des minutes, le HiDream Large Model 2.0 de HiDream.ai a désormais atteint une augmentation significative du temps de génération vidéo, atteignant le niveau de pointe de l'industrie. En plus de l'amélioration significative de la durée de la vidéo au niveau de la minute, un autre point fort de cette mise à niveau est la variabilité de la durée et de la taille de la vidéo. Les modèles de génération vidéo précédents ont généralement une durée fixe prédéfinie et ne peuvent pas être sélectionnés par l'utilisateur. HiDream.ai donne le droit de choisir aux utilisateurs. Les utilisateurs peuvent soit spécifier directement la durée de la vidéo, soit laisser le système juger dynamiquement en fonction du contenu de l'invite d'entrée. Lorsque le contenu est complexe, le système génère une vidéo plus longue ; lorsque le contenu est simple, une vidéo plus courte est générée. Dans cette méthode d'ajustement dynamique, le système peut répondre de manière adaptative aux besoins créatifs de l'utilisateur. Dans le même temps, la taille de la vidéo peut également être personnalisée en fonction des besoins de l'utilisateur. Cette conception flexible améliore considérablement l'expérience utilisateur.

Il convient de mentionner que HiDream Large Model 2.0 de HiDream.ai a également considérablement amélioré l'apparence et la sensation des images vidéo. Les mouvements des objets sont plus naturels et plus fluides, les détails sont rendus plus finement et il prend en charge l'ultra haute définition 4K. Vidéo. Qualité d'image claire. Avec cette mise à niveau technologique, HiDream.ai HiDream Large Model 2.0 évolue rapidement vers la génération de vidéos multi-objectifs de meilleure qualité et s'accélère vers le stade L3. Il est entendu que la fonction Vincent Video mise à niveau sera bientôt utilisée et que les utilisateurs pourront bénéficier de services de génération vidéo plus riches et de meilleure qualité.

Les initiés de l'industrie ont déclaré qu'avec l'amélioration et la mise à niveau continues du grand modèle 2.0 de HiDream.ai HiDream.ai, il devrait apporter des changements plus révolutionnaires dans le domaine de la création de contenu vidéo, aider les utilisateurs à réaliser facilement une monétisation créative et promouvoir l'ensemble de l'industrie. évoluer vers un espace de développement plus large.

(Source : Informations financières sur les entreprises)

Pour des informations plus intéressantes, veuillez télécharger le client "Jimu News" sur le marché des applications. Veuillez ne pas réimprimer sans autorisation. Vous êtes invités à fournir des indices d'actualité et vous serez payé une fois accepté.

Rapport/Commentaires

nouvelles

La génération vidéo fait un pas de géant, le modèle HiDream.ai HiDream.ai 2.0 entre dans le niveau minute

Introduction

Mes coordonnées