2024 service trade fair｜η τεχνολογία shengshu λύνει το πρόβλημα της ασυνέπειας στη δημιουργία μεγάλων μοντέλων βίντεο

2024-09-15

"όταν εισάγουμε μια οδηγία στην τεχνητή νοημοσύνη και την αφήνουμε να δημιουργήσει ένα βίντεο, στην πραγματικότητα, η βασική έκκληση είναι να ελπίζουμε ότι η τεχνητή νοημοσύνη θα μας βοηθήσει να ολοκληρώσουμε μια πλήρη αφήγηση. για να επιτύχουμε αυτόν τον στόχο, πρέπει να διατηρήσουμε τα βασικά στοιχεία ενοποιημένα και ελεγχόμενα. " είπε στην πρόσφατη διεθνή έκθεση κίνας 2024 για το εμπόριο υπηρεσιών (εφεξής "εμπορική έκθεση υπηρεσιών"), ο tang jiayu, πρόεδρος και διευθύνων σύμβουλος της shengshu technology, έδωσε μια λύση: τη λειτουργία αναφοράς θέματος του βίντεο μεγάλου μοντέλου η vidu μπορεί να πραγματοποιήσει τον έλεγχο οποιασδήποτε συνεπούς γενιάς. για να το πετύχει αυτό, η βιομηχανία δοκίμασε μεθόδους όπως "το ai πρώτα δημιουργεί εικόνες, μετά οι εικόνες δημιουργούν βίντεο", αλλά η λειτουργία αναφοράς θέματος όχι μόνο μειώνει τον φόρτο εργασίας, αλλά σπάει και τους περιορισμούς στο περιεχόμενο βίντεο με εικόνες διαχωρισμού. οι καινοτομίες στην τεχνολογία έχουν δώσει μεγαλύτερο χώρο για φαντασία στην εμπορευματοποίηση μεγάλων μοντέλων βίντεο.

όταν τα μοντέλα μεγάλων γλωσσών έγιναν δημοφιλή, η τεχνολογία shenshu στόχευσε το πολυτροπικό κομμάτι και κυκλοφόρησε τις δυνατότητες wensheng video τον ιανουάριο του 2024. σύμφωνα με το σχέδιο της shengshu technology, οι δυνατότητες βίντεο απαιτούν μεγαλύτερη διάρκεια και μεγαλύτερη συνέπεια για να αναπτυχθούν, αλλά το ντεμπούτο της sora έφερε τα σχέδια της startup μπροστά από το χρονοδιάγραμμα.

το vidu κυκλοφόρησε στα τέλη απριλίου, υποστηρίζοντας τη δημιουργία βίντεο υψηλής ευκρίνειας διάρκειας 16 δευτερολέπτων με ένα κλικ. μεμονωμένο βίντεο που δημιουργήθηκε. στα τέλη ιουλίου, το vidu κυκλοφόρησε επίσημα παγκοσμίως, ανοίγοντας βίντεο tuxing, λειτουργίες συνέπειας ρόλων και δυνατότητες δημιουργίας βίντεο έως και 8 δευτερολέπτων.

αυτή τη φορά, ο tang jiayu επικεντρώθηκε στην εισαγωγή της πιο πρόσφατης λειτουργίας "αναφοράς θέματος" της vidu στην εμπορική έκθεση υπηρεσιών του 2024. η λεγόμενη αναφορά θέματος επιτρέπει στους χρήστες να ανεβάζουν μια εικόνα οποιουδήποτε θέματος και το vidu μπορεί να κλειδώσει την εικόνα του θέματος, να αλλάξει αυθαίρετα σκηνές μέσω περιγραφών και να εξάγει ένα βίντεο με το ίδιο θέμα, όπου "οποιοδήποτε" είναι η λέξη-κλειδί. είναι, είτε πρόκειται για άτομο, είτε πρόκειται για ζώα, για εμπορεύματα, χαρακτήρες κινουμένων σχεδίων ή φανταστικά θέματα, η συνέπεια και η δυνατότητα ελέγχου τους μπορούν να διασφαλιστούν στη δημιουργία βίντεο.

ένας δημοσιογράφος από το beijing business daily έμαθε ότι πριν από την κυκλοφορία αυτής της λειτουργίας, το μοντέλο μεγάλου βίντεο δεν ήταν χωρίς λύσεις για την επίτευξη αυτού του στόχου.

λαμβάνοντας ως παράδειγμα τη μέθοδο δημιουργίας εικόνων από τεχνητή νοημοσύνη και, στη συνέχεια, δημιουργίας βίντεο από εικόνες, μπορείτε να χρησιμοποιήσετε εργαλεία σχεδίασης τεχνητής νοημοσύνης, όπως το midjourney, για να δημιουργήσετε εικόνες διαχωρισμού πρώτα, να διατηρήσετε το θέμα σταθερό σε επίπεδο εικόνας και στη συνέχεια να τις μετατρέψετε εικόνες σε βίντεο κλιπ και να τις επεξεργαστείτε και να τις συνθέσετε.

αλλά το πρόβλημα είναι ότι η συνέπεια του σχεδίου με τεχνητή νοημοσύνη δεν είναι τέλεια και συχνά χρειάζεται να λυθεί μέσω επαναλαμβανόμενων τροποποιήσεων και μερικής επανασχεδίασης. το πιο σημαντικό, η πραγματική διαδικασία παραγωγής βίντεο περιλαμβάνει πολλές σκηνές και φακούς όταν αυτή η μέθοδος χειρίζεται σκηνές φακών πολλαπλών συστατικών, ο φόρτος εργασίας του σχεδίου είναι τεράστιος, ο οποίος μπορεί να αντιπροσωπεύει περισσότερο από το ήμισυ της όλης διαδικασίας, καθώς και το τελικό περιεχόμενο βίντεο. στερείται δημιουργικότητας και ευελιξίας λόγω της υπερβολικής εξάρτησης από τα split σουτ.

η λειτουργία "αναφορά θέματος" του vidu δημιουργεί απευθείας υλικό βίντεο "ανεβάζοντας την εικόνα θέματος + εισάγοντας την περιγραφή της σκηνής". αυτή η μέθοδος μειώνει σημαντικά τον φόρτο εργασίας και σπάει τους περιορισμούς στο περιεχόμενο βίντεο με εικόνες διαχωρισμού, επιτρέποντας στους δημιουργούς να δημιουργούν πλούσιο, ευέλικτο περιεχόμενο βίντεο με βάση περιγραφές κειμένου.

όταν μοιράστηκε τη δημιουργική διαδικασία της ταινίας μικρού μήκους κινουμένων σχεδίων "summer gift", ο shi yuxiang, διευθυντής του κεντρικού ραδιοφωνικού και τηλεοπτικού σταθμού της κίνας και καλλιτέχνης aigc, είπε ότι σε σύγκριση με τη βασική λειτουργία λήψης βίντεο, η λειτουργία "αναφορά θέματος" ξεφορτώνεται. των περιορισμών των στατικών εικόνων και δημιουργεί πιο όμορφες εικόνες είναι μολυσματικές και δωρεάν, βελτιώνοντας σημαντικά τη συνοχή της δημιουργίας. ταυτόχρονα, τον βοήθησε να εξοικονομήσει περίπου το 70% του φόρτου εργασίας του στο σχέδιο.

ο δημοσιογράφος του beijing business daily wei wei

αναφορά/σχόλια

νέα

2024 service trade fair｜η τεχνολογία shengshu λύνει το πρόβλημα της ασυνέπειας στη δημιουργία μεγάλων μοντέλων βίντεο

εισαγωγή

τα στοιχεία επικοινωνίας μου