Νέα

Πέρασε μισός χρόνος, πού πήγε το βίντεο AI;

2024-07-23

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina



Σταθερή εστίαση (dingjiaoone) πρωτότυπο

Συγγραφέας |

Συντάκτης |. Wei Jia

Από τότε που εμφανίστηκε η Sora στις αρχές του τρέχοντος έτους, οι άνθρωποι στο εσωτερικό και στο εξωτερικό ήθελαν να χρησιμοποιήσουν την τεχνητή νοημοσύνη για να ανατρέψουν το Χόλιγουντ Σόρα.

Δύο ξένες νεοσύστατες εταιρείες τεχνητής νοημοσύνης αναλαμβάνουν την ηγεσία της Luma, μια εταιρεία τεχνολογίας τεχνητής νοημοσύνης από το Σαν Φρανσίσκο, που κυκλοφόρησε το μοντέλο δημιουργίας βίντεο σε επίπεδο ταινίας γνωστή στον τομέα του βίντεο τεχνητής νοημοσύνης, η Runway, μια startup εταιρεία, ανακοίνωσε επίσης ότι θα ανοίξει τη δοκιμή του μοντέλου Gen-3 Alpha σε ορισμένους χρήστες, λέγοντας ότι μπορεί να παράγει λεπτομέρειες όπως φως και σκιά.

Για να μην ξεφύγει στην Κίνα, ο Kuaishou κυκλοφόρησε το Keling Web client, το οποίο επιτρέπει στους χρήστες να δημιουργούν περιεχόμενο βίντεο διάρκειας έως και 10 δευτερολέπτων, ενώ διαθέτει επίσης τον έλεγχο πρώτου και τελευταίου καρέ και λειτουργίες ελέγχου φακού κάμερας. Το πρωτότυπο μικρού μήκους δράμα φαντασίας AI "The Strange Mirror of Mountains and Seas: Chopping Waves" μεταδίδεται επίσης στο Kuaishou, με όλες τις εικόνες που δημιουργούνται από την AI. Το μικρού μήκους δράμα επιστημονικής φαντασίας AI "Sanxingdui: Future Apocalypse" μεταδόθηκε επίσης πρόσφατα και δημιουργήθηκε για το προϊόν βίντεο AI της Byte Jimeng.

Η ταχεία ταχύτητα ενημέρωσης των βίντεο με τεχνητή νοημοσύνη έχει προκαλέσει πολλούς χρήστες του Διαδικτύου να πουν: "Μπορεί να υπάρξει άλλη μια γενική απεργία στο Χόλιγουντ".

Σήμερα, στο κομμάτι της τεχνητής νοημοσύνης, υπάρχουν εγχώριοι και ξένοι κολοσσοί τεχνολογίας και Διαδικτύου όπως η Google, η Microsoft, η Meta, η Alibaba, η Byte και η Meitu, καθώς και αναδυόμενες εταιρείες όπως η Runway και η Aishi Technology από το "Fix Focus", μόνο εγχώρια , περίπου 20 εταιρείες έχουν λανσάρει προϊόντα/μοντέλα βίντεο τεχνητής νοημοσύνης που έχουν αναπτύξει μόνοι τους.

Στοιχεία από το Ερευνητικό Ινστιτούτο Toubao δείχνουν ότι το μέγεθος της αγοράς της βιομηχανίας παραγωγής βίντεο AI της Κίνας το 2021 είναι 8 εκατομμύρια γιουάν και αναμένεται ότι αυτό το μέγεθος της αγοράς θα φτάσει τα 9,279 δισεκατομμύρια γιουάν το 2026. Πολλοί άνθρωποι στον κλάδο πιστεύουν ότι το κομμάτι βίντεο που δημιουργήθηκε θα οδηγήσει σε μια στιγμή Midjourney το 2024.

Σε ποιο στάδιο ανάπτυξης έχουν φτάσει ο Soras σε όλο τον κόσμο; Ποιος είναι ο πιο δυνατός; Μπορεί το AI να καταρρίψει το Χόλιγουντ;

Siege of Sora: Αν και υπάρχουν πολλά προϊόντα, υπάρχουν λίγα που μπορούν να χρησιμοποιηθούν

Υπάρχουν πολλά προϊόντα/μοντέλα που κυκλοφορούν στο κομμάτι βίντεο AI, αλλά αυτά που μπορούν πραγματικά να χρησιμοποιηθούν από το κοινό είναι πολύ περιορισμένα. , ο εξαιρετικός εκπρόσωπος στο εξωτερικό είναι ο Sora, ο οποίος βρίσκεται ακόμα σε εσωτερικές δοκιμές έξι μήνες αργότερα και είναι ανοιχτός μόνο σε ομάδες ασφαλείας και ορισμένους εικαστικούς καλλιτέχνες, σχεδιαστές και παραγωγούς ταινιών. Η εγχώρια κατάσταση είναι παρόμοια, το προϊόν βίντεο AI της Alibaba Damo "Xunguang" και το μοντέλο βίντεο AI της Baidu, το UniVG, και οι δύο βρίσκονται στο στάδιο της εσωτερικής δοκιμής Αυτό έχει συζητηθεί.

Μεταξύ των υπόλοιπων διαθέσιμων προϊόντων βίντεο τεχνητής νοημοσύνης, ορισμένα έχουν ορίσει όρια χρήσης και οι χρήστες πρέπει να πληρώσουν ή να γνωρίζουν ορισμένες τεχνολογίες.Για παράδειγμα, αν δεν γνωρίζετε λίγη γνώση κώδικα σχετικά με το Open-Sora από την Luchen Technology, οι χρήστες δεν θα μπορούν να ξεκινήσουν.

Το "Fix Focus" ταξινόμησε τα προϊόντα βίντεο AI που κυκλοφορούν στο εσωτερικό και στο εξωτερικό και διαπίστωσε ότι οι μέθοδοι λειτουργίας και οι λειτουργίες του καθενός είναι παρόμοιες ευκρίνεια, στυλ δημιουργίας, δευτερόλεπτα δημιουργίας και άλλες λειτουργίες και τέλος κλικ Δημιουργία με ένα κλικ.

Η τεχνική δυσκολία πίσω από αυτά τα χαρακτηριστικά ποικίλλει. Το πιο δύσκολο είναι,Η ανάλυση και τα δευτερόλεπτα του παραγόμενου βίντεο, αυτό είναι επίσης το επίκεντρο του ανταγωνισμού μεταξύ εταιρειών στο κομμάτι βίντεο AI κατά τη διάρκεια της προώθησης.Σχετίζεται στενά με την ποιότητα των υλικών και την ποσότητα της υπολογιστικής ισχύος που χρησιμοποιείται στη διαδικασία εκπαίδευσης.

Ο ερευνητής τεχνητής νοημοσύνης Cyrus είπε στο "Fixed Focus" ότι επί του παρόντος τα περισσότερα βίντεο τεχνητής νοημοσύνης στο εσωτερικό και στο εξωτερικό υποστηρίζουν τη δημιουργία 480p/720p και μερικά υποστηρίζουν βίντεο υψηλής ευκρίνειας 1080p.

Εισήγαγε ότι όσο περισσότερα υλικά υψηλής ποιότητας και όσο υψηλότερη είναι η υπολογιστική ισχύς, το εκπαιδευμένο μοντέλο μπορεί να δημιουργήσει βίντεο υψηλότερης ποιότητας, αλλά αυτό δεν σημαίνει ότι τα υλικά υψηλής ποιότητας και η υπολογιστική ισχύς μπορούν να παράγουν υλικά υψηλής ποιότητας. Ωστόσο, εάν ένα μοντέλο εκπαιδευμένο με υλικά χαμηλής ανάλυσης αναγκαστεί να δημιουργήσει ένα βίντεο υψηλής ανάλυσης, θα καταρρεύσει ή θα επαναληφθεί, όπως να έχει πολλά χέρια και πόδια. Αυτό το είδος προβλήματος μπορεί να λυθεί με μεγέθυνση, επισκευή και επανασχεδιασμό, αλλά το εφέ και η λεπτομέρεια είναι μέτρια.

Πολλές εταιρείες θεωρούν επίσης τη δημιουργία μεγάλων δευτερολέπτων ως σημείο πώλησης.

Τα περισσότερα εγχώρια βίντεο τεχνητής νοημοσύνης υποστηρίζουν 2-3 δευτερόλεπτα, κάτι που θεωρείται σχετικά δυνατό προϊόν εάν μπορεί να φτάσει τα 5-10 δευτερόλεπτα. από αυτά είναι τόσο καλά όσο ο Sora Έχει ειπωθεί ότι έχει δημιουργηθεί το μεγαλύτερο βίντεο A 60 δευτερολέπτων, αλλά επειδή δεν είναι ακόμη ανοιχτό για χρήση, η συγκεκριμένη απόδοση δεν μπορεί να επαληθευτεί.

Το μήκος του ελαφρού τροχού δεν είναι αρκετό, το περιεχόμενο βίντεο που δημιουργείται πρέπει επίσης να είναι λογικό. Ο Zhang Heng, επικεφαλής ερευνητής της Pomegranate AI, είπε στο "Dingjiao": Τεχνικά, η τεχνητή νοημοσύνη μπορεί να απαιτείται να βγάζει συνεχώς έξοδο Τις περισσότερες φορές αυτό που θέλουμε δεν είναι ένα κομμάτι επιτήρησης.

Το "Fixed Focus" δοκίμασε 5 δημοφιλή δωρεάν προϊόντα Wensheng βίντεο AI στην Κίνα, συγκεκριμένα Jimeng byte, Morph Studio από Morph AI, PixVerse από Aishi Technology, Yiying AI από MewXAI και Vega AI από Right Brain Technology, τους έδωσε την ίδια οδηγία κειμένου : «Ένα κοριτσάκι με κόκκινο φόρεμα τάισε ένα μικρό λευκό κουνέλι με καρότα στο πάρκο».

Η ταχύτητα παραγωγής πολλών προϊόντων είναι παρόμοια, διαρκεί μόνο 2-3 λεπτά, αλλά η σαφήνεια και η διάρκεια είναι αρκετά διαφορετικές και η ακρίβεια είναι ακόμη πιο «χαοτικός χορός».


Yiying AI


Vega AI


ένα όνειρο


Morph


Pix Verse

Τα πλεονεκτήματα και τα μειονεκτήματα του καθενός είναι προφανή. Παρόλο που το παιχνίδι ήταν σύντομο σε διάρκεια, η ποιότητα του παιχνιδιού δεν ήταν υψηλή. Η ποιότητα εικόνας του PixVerse είναι σχετικά κακή.

Συγκριτικά, το περιεχόμενο που δημιουργείται από το Morph είναι ακριβές, αλλά μόνο για λίγα δευτερόλεπτα. Η ποιότητα της εικόνας του Yiying είναι επίσης καλή, αλλά δεν κατανοεί καλά το κείμενο και χάνει άμεσα το βασικό στοιχείο του κουνελιού, και το βίντεο που δημιουργείται δεν είναι αρκετά ρεαλιστικό και είναι πιο κωμικό.

Εν ολίγοις, κανένα προϊόν δεν μπορεί να παρέχει βίντεο που να πληροί τις απαιτήσεις.

Προκλήσεις βίντεο AI: ακρίβεια, συνέπεια, πλούτος

Η εμπειρία της «σταθερής εστίασης» είναι πολύ διαφορετική από τα διαφημιστικά βίντεο που κυκλοφορούν από διάφορες εταιρείες.

Ο Zhang Heng είπε στο "Fixed Focus" ότι από τεχνική άποψη, εξετάζουν κυρίως τα επίπεδα διαφορετικών μοντέλων βίντεο AI από τρεις διαστάσεις:Ακρίβεια, συνέπεια, πλούτος.

Πώς να κατανοήσετε αυτές τις τρεις διαστάσεις, ο Zhang Heng έδωσε ένα παράδειγμα.

Για παράδειγμα, δημιουργήστε ένα βίντεο με "δύο κορίτσια που παρακολουθούν έναν αγώνα μπάσκετ στην παιδική χαρά".

Η ακρίβεια αντικατοπτρίζεται, πρώτον, στην ακριβή κατανόηση της δομής του περιεχομένου, για παράδειγμα, εάν εμφανίζονται δύο κορίτσια στο βίντεο, δεύτερον, η ακρίβεια του ελέγχου της διαδικασίας, για παράδειγμα, μετά την εκτέλεση ενός σουτ, το μπάσκετ πρέπει να πέσει σταδιακά από το δίχτυ, τέλος, η στατική μοντελοποίηση δεδομένων είναι ακριβής.

Η συνέπεια αναφέρεται στην ικανότητα μοντελοποίησης της τεχνητής νοημοσύνης στο χώρο και στο χρόνο, η οποία περιλαμβάνει επίσης την προσοχή του θέματος και τη μακροπρόθεσμη προσοχή.

Η κύρια εστίαση μπορεί να γίνει κατανοητή καθώς, κατά τη διαδικασία παρακολούθησης ενός αγώνα μπάσκετ, τα δύο κοριτσάκια πρέπει να παραμένουν πάντα στην εικόνα και να μην μπορούν να τρέχουν αδιάφορα, η μακροχρόνια προσοχή σημαίνει ότι κατά τη διάρκεια της άσκησης, τα διάφορα στοιχεία στο βίντεο Δεν πρέπει επίσης να χάνεται.

Ο πλούτος σημαίνει ότι η τεχνητή νοημοσύνη έχει επίσης τη δική της λογική και μπορεί να δημιουργήσει κάποιες λογικές λεπτομέρειες ακόμη και χωρίς μηνύματα κειμένου.

Βασικά, κανένα από τα εργαλεία βίντεο AI στην αγορά δεν μπορεί να επιτύχει πλήρως τις παραπάνω διαστάσεις και κάθε εταιρεία προτείνει συνεχώς λύσεις.

Για παράδειγμα, όσον αφορά τη συνέπεια των χαρακτήρων, η οποία είναι πολύ σημαντική στο βίντεο, οι Meng και Keling σκέφτηκαν να χρησιμοποιήσουν Το Tusheng Video αντικαθιστά το Vincent Video. Δηλαδή, ο χρήστης χρησιμοποιεί πρώτα κείμενο για να δημιουργήσει εικόνες και στη συνέχεια χρησιμοποιεί τις εικόνες για να δημιουργήσει βίντεο ή δίνει απευθείας μία ή δύο εικόνες και η τεχνητή νοημοσύνη τις συνδέει σε ένα κινούμενο βίντεο.

«Αλλά αυτό δεν είναι μια νέα τεχνολογική ανακάλυψη και τα βίντεο Tusheng είναι λιγότερο δύσκολα από τα βίντεο του Vincent», είπε ο Zhang Heng στο «Dingzhong». κατοπτρική περιγραφή, μετατρέψτε την περιγραφή σε κείμενο και στη συνέχεια μετατρέψτε την σε εικόνες και θα λάβετε τα ενδιάμεσα βασικά καρέ του βίντεο Συνδέοντας αυτές τις εικόνες, μπορείτε να λάβετε ένα συνεχές βίντεο με δράση. Το Tusheng Video ισοδυναμεί με το να δίνεις στην τεχνητή νοημοσύνη μια συγκεκριμένη εικόνα που μπορεί να μιμηθεί, και το βίντεο που δημιουργείται θα συνεχίσει τα χαρακτηριστικά του προσώπου στην εικόνα για να επιτευχθεί η συνέπεια του πρωταγωνιστή.

Είπε επίσης ότι στα πραγματικά σενάρια, το αποτέλεσμα των βίντεο Tusheng είναι περισσότερο σύμφωνο με τις προσδοκίες των χρηστών, επειδή το κείμενο έχει περιορισμένη ικανότητα έκφρασης λεπτομερειών εικόνας, αλλά δεν είναι ακόμη διαθέσιμο στο εμπόριο. Διαισθητικά μιλώντας, τα 5 δευτερόλεπτα είναι το ανώτερο όριο του βίντεο Tusheng.

Προς το παρόν, πολλές ταινίες μικρού μήκους και τηλεοπτικές ταινίες που ισχυρίζονται ότι χρησιμοποιούν τεχνητή νοημοσύνη για ολόκληρη τη διαδικασία παραγωγής χρησιμοποιούν κυρίως βίντεο Tusheng ή βίντεο σε βίντεο.

Η τελευταία λειτουργία καρέ του Jimeng χρησιμοποιεί επίσης βίντεο Tusheng και δοκιμάστηκε ειδικά η "σταθερή εστίαση" Τα αποτελέσματα είναι τα εξής:



Στη διαδικασία του συνδυασμού, οι χαρακτήρες εμφανίζονται παραμορφωμένοι και παραμορφωμένοι.

Ο Cyrus είπε επίσης ότι τα βίντεο πρέπει να είναι συνεκτικά. Πολλά εργαλεία βίντεο AI που υποστηρίζουν τη μετατροπή εικόνας σε βίντεο προβλέπουν επίσης επακόλουθες ενέργειες μέσω εικόνων ενός καρέ.

Εννοείται ότιΌταν πρόκειται για την επίτευξη της συνέπειας των πρωταγωνιστών στο Vincent Video, κάθε εταιρεία δεν βασίζεται αποκλειστικά στη δημιουργία δεδομένων.Ο Zhang Heng είπε ότι τα περισσότερα μοντέλα βασίζονται στο αρχικό υποκείμενο μεγάλο μοντέλο DIT, που επικαλύπτεται με διάφορες τεχνολογίες, όπως το ControlVideo (μια ελεγχόμενη μέθοδος δημιουργίας κειμένου-βίντεο που προτείνεται από το Harbin Institute of Technology και το Huawei Cloud), με αποτέλεσμα να εμβαθύνει την κατανόηση του πρωταγωνιστή από την AI Η μνήμη των χαρακτηριστικών του προσώπου εμποδίζει το πρόσωπο να αλλάξει πολύ κατά τη διάρκεια της κίνησης.

Ωστόσο, είναι ακόμα σε πειραματικό στάδιο, ακόμη και με την τεχνική υπέρθεση, το πρόβλημα της συνέπειας των χαρακτήρων δεν έχει λυθεί πλήρως.

Βίντεο AI, γιατί εξελίσσεται αργά;

Στον κύκλο της AI, οι Ηνωμένες Πολιτείες και η Κίνα είναι αυτή τη στιγμή οι πιο δημοφιλείς.

Μπορεί να φανεί από τη σχετική έκθεση των "The World's Most Influential Artificial Intelligence Scholars in 2023" (αναφέρεται ως η λίστα "AI 2000 Scholars") ότι μεταξύ των 1.071 ιδρυμάτων που έχουν συμπεριληφθεί στο παγκόσμιο "AI 2000 Institutions" την τετραετία από το 2020 έως το 2023, οι Ηνωμένες Πολιτείες έχουν 443, ακολουθούμενες από την Κίνα με 137. Κρίνοντας από την κατανομή των "AI 2000 Scholars" σε χώρες το 2023, οι Ηνωμένες Πολιτείες έχουν τον μεγαλύτερο αριθμό επιλεγμένων ατόμων, με 1.079 άτομα, λογιστικά για το 54,0% του παγκόσμιου συνόλου, ακολουθούμενη από την Κίνα με 280 επιλεγμένα άτομα.

Τα τελευταία δύο χρόνια, εκτός από το γεγονός ότι η τεχνητή νοημοσύνη έχει σημειώσει μεγάλη πρόοδο στις εικόνες και τη μουσική της Βινσεντίας, τα βίντεο τεχνητής νοημοσύνης, τα οποία είναι τα πιο δύσκολα να ξεπεραστούν, έχουν επίσης κάνει κάποιες ανακαλύψεις.

Στο Παγκόσμιο Συνέδριο Τεχνητής Νοημοσύνης που πραγματοποιήθηκε πρόσφατα, ο Le Yuan, συνεργάτης της Etian Capital, δήλωσε δημόσια ότι η τεχνολογία παραγωγής βίντεο έχει σημειώσει πρόοδο πολύ πέρα ​​από τις προσδοκίες τα τελευταία δύο ή τρία χρόνια. Ο Liu Ziwei, επίκουρος καθηγητής στο Τεχνολογικό Πανεπιστήμιο Nanyang στη Σιγκαπούρη, πιστεύει ότι η τεχνολογία παραγωγής βίντεο βρίσκεται επί του παρόντος στην εποχή GPT-3 και απέχει ακόμη περίπου μισό χρόνο από την ωριμότητα.

Ωστόσο, ο Leyuan τόνισε ότιΤο τεχνικό της επίπεδο εξακολουθεί να είναι ανεπαρκές για να υποστηρίξει την εμπορευματοποίηση μεγάλης κλίμακας, οι μεθοδολογίες που χρησιμοποιούνται και οι προκλήσεις που αντιμετωπίζονται κατά την ανάπτυξη εφαρμογών που βασίζονται σε γλωσσικά μοντέλα μπορούν επίσης να εφαρμοστούν σε πεδία εφαρμογών που σχετίζονται με βίντεο.

Η εμφάνιση του Sora στις αρχές του έτους συγκλόνισε τον κόσμο Το νέο μοντέλο διάχυσης DiT που βασίζεται στην αρχιτεκτονική του μετασχηματιστή κάνει τεχνολογικές ανακαλύψεις στη διάχυση και τη δημιουργία, βελτιώνοντας την ποιότητα και τον ρεαλισμό της δημιουργίας εικόνων, κάνοντας το βίντεο AI μια σημαντική ανακάλυψη. Ο Cyrus είπε ότι επί του παρόντος, τα περισσότερα βίντεο του Vincent στο εσωτερικό και στο εξωτερικό χρησιμοποιούν παρόμοια τεχνολογία.


Πηγή εικόνας/ Επίσημος ιστότοπος Sora

Αυτή τη στιγμή, όλοι είναι βασικά οι ίδιοι στην υποκείμενη τεχνολογία Αν και κάθε εταιρεία αναζητά επίσης τεχνολογικές ανακαλύψεις με βάση αυτό, περισσότερος όγκος δεδομένων εκπαίδευσης για τον εμπλουτισμό των λειτουργιών του προϊόντος.

Όταν χρησιμοποιούν το Byte's Jimeng και το Morph AI's Morph Studio, οι χρήστες μπορούν να επιλέξουν πώς να μετακινήσουν το βίντεο Η αρχή πίσω από αυτό είναι ότι τα σύνολα δεδομένων είναι διαφορετικά.

"Στο παρελθόν, οι φωτογραφίες που χρησιμοποιούσαν διάφορες εταιρείες κατά τη διάρκεια της εκπαίδευσης ήταν σχετικά απλές. Έδειχναν κυρίως ποια στοιχεία υπήρχαν στην εικόνα, αλλά δεν εξηγούσαν ποιος φακός χρησιμοποιήθηκε για τη λήψη αυτού του στοιχείου. Αυτό έκανε επίσης πολλές εταιρείες να ανακαλύψουν αυτό το κενό. χρησιμοποίησαν 3D Το σύνολο δεδομένων βίντεο απόδοσης συμπληρώνει τα χαρακτηριστικά του φακού." Ο Zhang Heng είπε ότι τα τρέχοντα δεδομένα προέρχονται από αποδόσεις από την κινηματογραφική και τηλεοπτική βιομηχανία και εταιρείες παιχνιδιών.

Το "Fixed focus" δοκίμασε επίσης αυτή τη λειτουργία, αλλά η αλλαγή του φακού δεν ήταν πολύ εμφανής.

Ο λόγος για τον οποίο το Sora έχει αναπτυχθεί πιο αργά από το GPT και το Midjourney είναι επειδή έχει άλλο χρονοδιάγραμμα και η εκπαίδευση μοντέλων βίντεο είναι πιο δύσκολη από το κείμενο και τις εικόνες. «Όλα τα δεδομένα εκπαίδευσης βίντεο που μπορούν να χρησιμοποιηθούν τώρα έχουν εξαντληθεί και σκεφτόμαστε επίσης μερικούς νέους τρόπους για να δημιουργήσουμε μια σειρά δεδομένων που μπορούν να χρησιμοποιηθούν για εκπαίδευση».

Και κάθε μοντέλο βίντεο με τεχνητή νοημοσύνη έχει το δικό του στυλ στο οποίο είναι καλό.

Ο Shen Renkui, ιδρυτής της Pomegranate AI, πιστεύει ότι οι τεχνολογίες βίντεο AI περιλαμβάνουν Κείμενο σε βίντεο (κείμενο σε βίντεο), Εικόνα σε βίντεο (εικόνα σε βίντεο), Βίντεο σε βίντεο (βίντεο σε βίντεο) και Avatar σε βίντεο (ψηφιακός άνθρωπος). που μπορεί να προσαρμοστεί Ψηφιακά άτομα με εικόνα και φωνή έχουν χρησιμοποιηθεί στον τομέα του μάρκετινγκ και έχουν φτάσει στο επίπεδο της εμπορικής χρήσης, ενώ το Vincent Video χρειάζεται ακόμα να λύσει τα προβλήματα ακρίβειας και ελέγχου.

Αυτή τη στιγμή, είτε πρόκειται για το μικρού μήκους δράμα επιστημονικής φαντασίας «Sanxingdui: Future Apocalypse» σε συμπαραγωγή Douyin και Bona, είτε για το μικρού μήκους δράμα φαντασίας AI «Mountains and Seas Strange Mirror: Cutting Waves» που δημιουργήθηκε αρχικά από Kuaishou, όλο και περισσότερες μεγάλες εταιρείες μοντέλων αναζητούν ενεργά ομάδες παραγωγής ταινιών και τηλεόρασης Για συνεργασία, υπάρχει ανάγκη προώθησης των δικών του τεχνολογικών προϊόντων και τα έργα δεν είναι εκτός βιομηχανίας.

Στον τομέα των μικρού μήκους βίντεο, η τεχνητή νοημοσύνη έχει ακόμη πολύ δρόμο μπροστά της και είναι ακόμη πρόωρο να πούμε ότι θα σκοτώσει το Χόλιγουντ.

*Η εικόνα τίτλου προέρχεται από την Pexels.