nouvelles

PixVerse V2 est là !Générez 5 "Sora" en un seul souffle, et la piste de génération vidéo "volume" s'envole

2024-07-24

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina


Auteur |

Courriel | [email protected]

"Trop bouclés !"

Depuis juin, les produits de génération vidéo ont marqué le début d'une vague d'explosion, de Keling à Luma et Runway Gen3, et leurs capacités de modélisation et leurs effets de production s'améliorent de plus en plus.

Tout à l'heure, PixVerse a lancé la version V2. En plus de mettre à jour l'architecture DiT, il peut effectivement générer cinq contenus vidéo à effet "Sora" d'affilée !

Lors de tests créatifs tels que des chats mangeant des nouilles et des chiens conduisant des motos, la clarté vidéo, la qualité dynamique et l'esthétique de PixVerse V2 ont tous donné de bons résultats.

Selon Silicon Star,Basé sur l'architecture DiT (Diffusion + Transformer) combinée au mécanisme d'attention spatio-temporelle, PixVerse V2 a subi des mises à niveau progressives des capacités du modèle.Il prend en charge la génération de vidéos de 8 secondes à la fois, tout en améliorant considérablement la plage dynamique, l'expression des détails et l'authenticité de la vidéo ; une autre mise à jour majeure est que PixVerse V2 prend en charge la génération en un clic de 1 à 5 contenus vidéo continus, et le Les clips sont Il maintiendra automatiquement la cohérence de l'image principale, du style d'image et des éléments de la scène, c'est-à-dire que tout le monde peut facilement générer du contenu vidéo de 40 secondes !

Du point de vue de l'effet de génération, d'une part, la version PixVerse V2 du contenu vidéo généré a une densité d'informations plus élevée et peut transmettre plus d'informations en quelques secondes. En même temps, la cohérence est améliorée, ce qui rend le contenu généré. contenu plus utilisable ; d'autre part, la conception du produit V2 simplifie autant que possible les fonctions complexes, permettant aux novices de créer.

Nous avons constaté qu'avec l'itération continue de la technologie et des produits de modèles de génération vidéo, les utilisateurs ordinaires, qu'ils soient nationaux ou étrangers, ont manifesté une demande énorme. La création de contenu vidéo IA ne se limite pas aux groupes professionnels. Les utilisateurs ordinaires sont également désireux d'exprimer leur créativité et leurs idées à travers des outils simples et intuitifs.

En regardant les itérations du produit PixVerse V2 sous cet angle, vous constaterez que chaque fonction s'efforce de se rapprocher des utilisateurs.

1

1. Chaque itération est un pas de plus vers les utilisateurs

Depuis son lancement, PixVerse est devenu l'un des produits de génération vidéo les plus populaires, basé sur l'innovation technologique et une connaissance approfondie des besoins des utilisateurs.

Dans la dernière version V2, l'une des fonctionnalités révolutionnaires est la possibilité de générer plusieurs vidéos en même temps tout en conservant la cohérence et la cohérence des éléments entre les vidéos. Cette fonctionnalité est d'une grande importance pour la création de contenu vidéo de longue durée, qui permet aux créateurs de générer une série de clips vidéo interdépendants autour d'un thème ou d'un scénario.


Lors de notre évaluation, nous avons constaté que PixVerse V2 fonctionnait bien lors de la gestion de scènes complexes et de longues séquences vidéo. La même image de personnage peut circuler librement entre différents décors de scène. De plus, la cohérence ne se limite pas à la cohérence visuelle, mais inclut également des transitions fluides dans les actions et les intrigues, ce qui est particulièrement important pour les vidéos narratives.

Un autre point fort est sa convivialité améliorée. Contrairement à ces « jouets créatifs » sur le marché qui ne peuvent générer que de courts clips et nécessitent un « tirage de cartes » constant et un montage secondaire, PixVerse V2 peut non seulement générer des clips vidéo de haute qualité, mais également étendre la créativité de courts clips, permettant ainsi une sortie directe. contenu créatif complet et utilisable.

Grâce à cette fonctionnalité, PixVerse V2 ne se limite plus à générer de courts plans pour un montage secondaire, mais peut directement produire des vidéos complètes pouvant être utilisées sur plusieurs plates-formes et plusieurs scènes.

Lors d'évaluations réelles, cette fonctionnalité de PixVerse V2 a considérablement amélioré l'efficacité et la commodité de la création vidéo. Les utilisateurs n'ont plus besoin de consacrer beaucoup de temps au montage et à la synthèse vidéo et peuvent se concentrer davantage sur la créativité et le contenu lui-même. Qu'il s'agisse d'une courte vidéo à partager sur les réseaux sociaux ou d'une vidéo dramatique qui nécessite une continuité, PixVerse V2 peut fournir une solution unique. La convivialité améliorée élargit encore le champ d'application de la technologie de génération vidéo IA, permettant aux utilisateurs ordinaires et aux créateurs professionnels d'en bénéficier.


On peut voir l’innovation de PixVerse V2 au niveau technique et le perfectionnement multiple de l’expérience utilisateur. Selon Silicon Star, PixVerse V2 a réalisé une percée dans la modélisation spatio-temporelle de diffusion en introduisant un mécanisme d'attention spatio-temporelle innovant dans le modèle sous-jacent, améliorant considérablement ses capacités de traitement pour les scènes complexes. Dans le même temps, ses puissantes capacités de compréhension de texte permettent au modèle de faire correspondre plus précisément les invites textuelles au contenu vidéo, réalisant ainsi une fusion multimodale profonde.

De plus, PixVerse V2 a également été optimisé en termes d'efficacité informatique. En améliorant le modèle de flux traditionnel et en pondérant la fonction de perte, le modèle peut converger plus rapidement, améliorant ainsi la vitesse et la précision de la génération vidéo. L'introduction du modèle 3D VAE et l'application du mécanisme d'attention spatio-temporelle améliorent encore la qualité de la compression et de la reconstruction vidéo, garantissant ainsi une transmission et un stockage efficaces du contenu vidéo.

En revenant sur plusieurs étapes majeures de PixVerse depuis sa sortie, nous constaterons que derrière cela se cache non seulement sa force technique, mais aussi sa compréhension approfondie du marché et des besoins des utilisateurs.

En mai, PixVerse a lancé sa fonction révolutionnaire de pinceau de mouvement. Cette fonctionnalité permet aux utilisateurs de contrôler le mouvement de zones spécifiques de la vidéo en traçant simplement des trajectoires, améliorant considérablement la flexibilité et l'intuitivité de la création vidéo. L'utilisation de scénarios spécifiques inclut, sans s'y limiter, la production d'animation, la créativité publicitaire, la génération de contenu pour les réseaux sociaux, etc. Les retours des utilisateurs ont été généralement positifs, affirmant que cette fonctionnalité simplifie grandement le processus de montage vidéo, rendant la création plus libre et intuitive.

En termes de paramètres de fonctions du produit, lorsque les utilisateurs sont fondamentalement satisfaits des résultats générés mais souhaitent ajuster les détails, PixVerse prend en charge les fonctions d'édition secondaire et de transformation gratuite, permettant aux utilisateurs d'ajuster de manière flexible l'effet d'affichage vidéo en fonction des besoins des différentes plates-formes et scénarios. De plus, PixVerse peut également choisir différents styles et formats d'image, offrant ainsi aux utilisateurs un plus grand degré de liberté dans la création vidéo.


Du pinceau de mouvement à la fonction de cohérence des caractères en passant par la génération vidéo cohérente de la version V2, chaque mise à jour se rapproche des utilisateurs. Ce concept innovant centré sur l'utilisateur fait de PixVerse non seulement un produit réalisé grâce à la technologie, mais également un partenaire dans la réalisation de la créativité des utilisateurs.

1

2. La profondeur détermine l’innovation

Lorsque nous évaluons si un produit de génération vidéo est un jouet ou un outil de productivité, la densité de l'information est un indicateur important de la qualité du contenu.

Si une petite balle se déplace irrégulièrement sur un fond vierge, elle peut bouger pendant un temps infini, mais elle fournit très peu d’informations.

Dans PixVerse V2, Aishi Technology tente d'augmenter la densité d'informations de la génération vidéo grâce à des moyens techniques, libérant les utilisateurs du montage fastidieux du matériel vidéo et entrant directement dans la création de contenu vidéo créatif. La recherche ultime de cohérence, garantissant que le corps principal de plusieurs clips reste inchangé, et d'autres fonctions visent toutes à passer directement du matériel vidéo au contenu vidéo publiable.

Le chef de produit de PixVerse a déclaré : L'équipe adhère toujours à l'idée du produit consistant à « marcher avec les utilisateurs ». Dès les premières étapes du développement du produit, l'équipe mènera des recherches préalables approfondies, notamment en communiquant avec les praticiens de l'industrie, en observant les utilisateurs réels et en recueillant les commentaires de la communauté. Cette méthode de recherche globale des utilisateurs permet à Aishi de capturer les besoins subtils mais critiques des utilisateurs. Même les petites fonctionnalités proposées par les utilisateurs seront prises au sérieux et testées.

Ce concept innovant axé sur l'utilisateur rapproche les fonctions de PixVerse des besoins réels des utilisateurs. Le chef de produit d’Aishi a partagé le processus de naissance de Magic Brush, qui est un représentant typique de la création de produits d’Aishi.

Au début de cette année, Runway a lancé son premier pinceau, Motion Brush. Les utilisateurs peuvent ajuster la trajectoire de mouvement du sujet en sélectionnant différents pinceaux et en ajustant les boutons de commande ci-dessous. Après avoir vu cette fonction et grâce à des études de marché, des interviews d'utilisateurs et des commentaires de la communauté, nous avons constaté que les utilisateurs ont une forte demande pour des outils de montage vidéo plus flexibles, mais la méthode d'interaction de Motion Brush n'est pas assez flexible et le débogage n'est pas précis et assez contrôlable.


Après avoir découvert ce besoin, l'équipe produit PixVerse s'est concentrée sur la discussion : quel type de méthode d'interaction peut permettre aux utilisateurs d'utiliser la fonction pinceau de manière plus intuitive et concise ?

Sur la base de recherches préliminaires auprès des utilisateurs, l'équipe produit a découvert que premièrement, les utilisateurs doivent déboguer les trajectoires de mouvement de plusieurs sujets, et qu'il n'y a pas de fonction de sélection de partition dans Motion Brush, deuxièmement, après avoir sélectionné un sujet, les trajectoires de mouvement du sujet sont modifiables ; , bas, gauche et droite. Les boutons de commande ne peuvent pas simuler de véritables effets de mouvement. Par conséquent, lors de la création de Magic Brush, l'équipe produit a choisi des méthodes de maculage, une sélection intelligente des partitions et une méthode interactive qui permet aux utilisateurs de tracer librement des trajectoires de mouvement à 360 degrés.


Cependant, ce type de méthode d’interaction est pratique pour les utilisateurs mais pose de plus grands défis techniques. Sur la base de l'architecture DiT, l'équipe technique d'Aishi a développé l'algorithme de base pour prendre en charge la fonction Magic Brush, qui analyse le tracé de l'utilisateur et le convertit en effets de mouvement dans la vidéo.

Magic Brush a été rapidement lancé en seulement un mois, de la découverte des besoins des utilisateurs à l'établissement du projet de produit et aux solutions techniques. Ceci est indissociable du modèle opérationnel d'entreprise « court, plat et rapide » d'Aishi.

Le service marketing peut collecter rapidement les commentaires des utilisateurs et les communiquer aux équipes produit et techniques en temps opportun. Ce flux d'informations et ce processus de prise de décision rapides permettent à Aishi d'examiner rapidement la faisabilité des besoins, d'effectuer des tests A/B et de prendre des décisions rapides. Cette agilité est un avantage unique des startups et est également la clé de la capacité d'Aishi à itérer rapidement les produits.

Par rapport aux grandes entreprises technologiques, les startups présentent certains avantages en termes de rapidité de réponse et de flexibilité. Cette agilité ne se reflète pas seulement dans le développement de produits et les stratégies de marché, mais affecte également profondément la culture d'entreprise et la structure organisationnelle. En raison de leur petite taille, les startups sont plus flexibles dans l’allocation des ressources. Ils peuvent rapidement déplacer des ressources d'une tâche à une autre ou d'un projet à un autre, garantissant ainsi une utilisation maximale des ressources.

Dans le même temps, nous accordons plus d’attention aux commentaires des utilisateurs et plaçons leurs besoins au centre du développement de produits. Cette approche du développement de produits axée sur l'utilisateur permet aux startups de lancer plus rapidement des produits qui répondent aux besoins des utilisateurs. De nombreuses startups adoptent des méthodes de développement agiles, qui mettent l'accent sur l'itération rapide et l'amélioration continue. Commercialisez vos produits plus rapidement grâce à la publication régulière de nouvelles fonctionnalités et de corrections de bugs, et optimisez-les en fonction des commentaires des utilisateurs.

L'agilité et l'innovation en profondeur incarnées par Aishi sont les avantages uniques des start-up dans la nouvelle ère des grands modèles.

1

3. Nous avons besoin d’une bonne technologie et de produits encore meilleurs.

Aujourd’hui, nous avons découvert qu’il reste en réalité un long chemin à parcourir avant que la technologie n’atteigne les utilisateurs, et que les produits constituent les connecteurs les plus importants. La technologie est le moteur de l’innovation, mais sa valeur ne peut se refléter véritablement que lorsque la technologie est connectée aux utilisateurs par le biais de produits.

Au cours du processus de développement de PixVerse, l’équipe d’Aishi Technology a soigneusement peaufiné chaque détail. Dans la version V2, afin d'améliorer la convivialité de la vidéo, PixVerse prend en charge l'édition secondaire des résultats générés grâce à la reconnaissance intelligente du contenu et aux fonctions d'association automatique, les utilisateurs peuvent remplacer et ajuster de manière flexible le sujet, l'action, l'environnement et le mouvement de la caméra. vidéo, enrichissant encore les possibilités créatives du sexe.


Le responsable des produits d'Aishi a également déclaré : « Les atouts et les différences technologiques sont importants, mais les obstacles à la production, aux utilisateurs et aux retours techniques formés par la connexion de plus en plus d'utilisateurs via les produits sont encore plus critiques.

Dans le même temps, aux premiers stades du développement technologique, les produits constituent également le point de départ de la mise en œuvre de la technologie. Transformez la technologie avancée de l’IA en fonctions de produit réelles, perceptibles et exploitables par les utilisateurs. Cette transformation de la technologie en produits accélère non seulement l’application de la technologie, mais offre également aux utilisateurs une commodité et une créativité sans précédent.

Surtout lorsque la technologie n'a pas encore atteint le niveau cible, la promotion bidirectionnelle entre la technologie et les produits revêt une importance plus pratique.

Par exemple, concernant le Magic Brush mentionné ci-dessus, certains créateurs ont rapporté : « À ce stade, lorsque la capacité du modèle de base ne peut pas atteindre le point où plusieurs sujets se déplacent en fonction du monde physique, la personnalisation du pinceau de mouvement peut augmenter l'espace créatif de certains personnages. ' clignotant, les expressions et les mouvements relatifs complexes peuvent tous être réalisés avec des pinceaux de mouvement.

À ce stade, Vincent Video, bien que conceptuellement attrayant, se heurte en pratique à des limites dans la génération de contenu. En raison de la densité limitée des informations du texte lui-même, il est souvent difficile de transmettre tous les détails des scènes complexes et des changements dynamiques lors de la conversion directe des descriptions textuelles en contenu vidéo. Par conséquent, Tusheng Video est apparu comme une solution progressive.

Par rapport à la vidéo Vincent, la vidéo Tusheng peut fournir une densité d'informations plus élevée car elle est générée sur la base d'informations visuelles et peut capturer et reproduire avec plus de précision la complexité de la scène. Avant que les capacités du moule de base ne puissent résoudre la différence de densité d'informations entre le texte et la vidéo, l'introduction de Tusheng Video n'était pas seulement le reflet du progrès technologique, mais également une innovation dans les idées de conception de produits.

Au début de la technologie, la stratégie d'Aishi se traduisait par des percées technologiques tout en accordant plus d'attention à la mise en œuvre des produits. Des barrières entre les utilisateurs autres que les barrières techniques se forment et des barrières entre les produits sont établies grâce à la compréhension et à la compréhension des utilisateurs, repoussant ainsi les limites de la technologie et les limites des produits.

Seul un produit de génération vidéo réellement utilisable peut être laissé de côté. Il doit non seulement répondre aux besoins actuels des utilisateurs, mais également se concentrer sur l'avenir et choisir une voie de développement technologique durable.

Qu'il s'agisse de la première « lutte morte » avec la technologie de cohérence, de l'itération de Magic Brush ou de la nouvelle mise à niveau de la version PixVerse V2, la stratégie produit d'Aishi est basée sur le présent et résout des problèmes pratiques d'autre part ; elle regarde vers l'avenir, choisit la voie du développement à long terme et s'engage à construire un avenir durable.

Grâce à une recherche et un développement technologiques continus, à une connaissance approfondie des utilisateurs et à un peaufinage minutieux des détails des produits, dans le secteur de la génération vidéo, les entreprises, quelle que soit leur taille, ont besoin d'avancées technologiques continues pour créer des produits vraiment précieux et capables d'inspirer la créativité.

Tout comme le slogan de PixVerse V2 : Libérer le potentiel créatif pour tous, ce n'est pas seulement une opportunité pour PixVerse, mais aussi une opportunité pour tous les créateurs à l'ère des grands modèles.