Μεγάλες εταιρείες έχουν ξεκινήσει έναν «αγώνα εξοπλισμών» στη δημιουργία βίντεο Μπορεί η τεχνητή νοημοσύνη να καταστρέψει πραγματικά το Χόλιγουντ;

Μεγάλες εταιρείες έχουν ξεκινήσει έναν «αγώνα εξοπλισμών» στη δημιουργία βίντεο Μπορεί η τεχνητή νοημοσύνη να καταρρίψει πραγματικά το Χόλιγουντ;

2024-07-15

Αναφορά Μηχανικής Καρδιάς

Τμήμα Σύνταξης Machine Heart

Ο κύκλος βίντεο AI σε σκοτώνει μέχρι θανάτου.

Στο μπροστινό μέρος, ο Kuaishou κυκλοφόρησε τον Ke Ling με τρόπο υψηλού προφίλ .

Καθοδηγούμενοι από τη λεπτή ατμόσφαιρα FOMO, περισσότεροι παίκτες τηρούν τον σκοπό "να κουραστούν μέχρι θανάτου, να κυλήσουν μέχρι θανάτου" και να βουτήξουν σε αυτό το κομμάτι——

Η Alibaba DAMO Academy στοιχηματίζει στην "Πλατφόρμα δημιουργίας βίντεο Xunguang", η ByteDance AI εξερευνά "γεννητικά δράματα ταινιών", η Meitu MOKI εστιάζει στη δημιουργία ταινιών μικρού μήκους με τεχνητή νοημοσύνη, η Haiper AI εστιάζει στη δημιουργική έκφραση...

Η Σαγκάη στις 5 Ιουλίου ήταν πολύ καυτή, όπως και το άγχος στον κύκλο βίντεο της AI.

Την ημέρα αυτή, Διεξαγωγή Αίθουσα Συνεδριάσεων.

Το φόρουμ συγκεντρώνει πολλές εταιρείες-αστέρες και ειδικούς στον τομέα του βίντεο AI για να συζητήσουν τις τελευταίες εξελίξεις στην τεχνολογία παραγωγής βίντεο και τις καινοτόμες πρακτικές της σε βιομηχανικές εφαρμογές.

Σε βάθος κοινή χρήση: τα ειλικρινή λόγια ενός κύκλου μυημένων

Από την εμφάνιση του ChatGPT, η τεχνολογία παραγωγής βίντεο που πυροδότησε ο Sora είναι σίγουρα το «πιο καυτό κοτόπουλο» στον κόσμο της τεχνολογίας.

Παρόλο που αυτός ο τομέας βρίσκεται ακόμη στα σπάργανα, η τεχνολογία παραγωγής βίντεο διευρύνει συνεχώς τα όρια της δημιουργίας ψηφιακού περιεχομένου με την εκπληκτική ταχύτητα ανάπτυξης και τις πιθανές προοπτικές εφαρμογής.

Ο Chen Weihua, επικεφαλής παραγωγής βίντεο στην Alibaba Damo Academy, ο Ni Bingbing, καθηγητής του Τμήματος Ηλεκτρονικής στο Πανεπιστήμιο της Σαγκάης Jiao Tong, ο Chen Jianyi, ανώτερος αντιπρόεδρος της Meitu Corporation και ο Miao Yishu, ιδρυτής της Haiper AI, παρευρέθηκαν στο φόρουμ και παρέδωσε βασικές ομιλίες.

Ο Chen Weihua, επικεφαλής της παραγωγής βίντεο στην Alibaba Damo Academy, δήλωσε ότι η κυκλοφορία του Sora στις αρχές του έτους όχι μόνο απέδειξε τις τεράστιες δυνατότητες της δημιουργίας βίντεο AI όσον αφορά την υψηλή ευκρίνεια, την υψηλή πιστότητα και την υψηλή ποιότητα, αλλά και ενέπνευσε. απεριόριστη φαντασία των ανθρώπων σχετικά με αυτήν την τεχνολογία.

Αν και το Sora είναι πολύ cool, η διαδικασία δημιουργίας εξακολουθεί να είναι δύσκολο να ελεγχθεί, η συνέπεια του πρωταγωνιστή είναι δύσκολο να εξασφαλιστεί και απαιτεί πολλή χειροκίνητη μετα-μοντάζ για να επιτευχθούν τα καλύτερα αποτελέσματα.

"Ο έλεγχος του περιεχομένου βίντεο είναι η μεγαλύτερη ζήτηση στη δημιουργία και είναι επίσης η μεγαλύτερη πρόκληση που αντιμετωπίζει ο αλγόριθμός μας σήμερα."

Το πιο πρόσφατο προϊόν AIGC που κυκλοφόρησε από την Alibaba DAMO Academy - Xunguang Video Creation Platform, στοχεύει στη βελτίωση της αποτελεσματικότητας της παραγωγής βίντεο και στην επίλυση προβλημάτων μετά την επεξεργασία βίντεο Μέσω της απλής οργάνωσης λήψης και των πλούσιων δυνατοτήτων επεξεργασίας βίντεο, οι χρήστες μπορούν να συνειδητοποιήσουν τον έλεγχο του περιεχομένου βίντεο. ακριβής έλεγχος και διατήρηση της συνέπειας των χαρακτήρων και των σκηνών σε πολλά βίντεο.

Το Xunguang παρέχει μια ενιαία πλατφόρμα εργαλείων για την ευρεία εφαρμογή του βίντεο τεχνητής νοημοσύνης δεν θα αντικαταστήσει το έργο του δημιουργού, αλλά θα βελτιστοποιήσει τη ροή εργασιών της δημιουργίας βίντεο και θα γίνει μια νέα μηχανή με γνώμονα τη δημιουργικότητα.

Ο Ni Bingbing, καθηγητής στο Τμήμα Ηλεκτρονικής στο Πανεπιστήμιο της Σαγκάης Jiao Tong, μοιράστηκε την τεχνολογία δημιουργίας περιεχομένου πολυμέσων για διανυσματοποίηση.

Μόλις άρχισε η ομιλία της έριξε κρύο νερό.

"Οι αλγόριθμοι τρέχουσας παραγωγής αντιμετωπίζουν δομικά και λεπτομερή προβλήματα. Για παράδειγμα, το περιεχόμενο που δημιουργείται μπορεί να έχει περισσότερα ή λιγότερα στοιχεία ή μπορεί να τρυπηθεί με το χέρι κ.λπ. εξακολουθεί να αντιμετωπίζει προκλήσεις "Ο Ni Bingbing είπε ότι ο λόγος είναι ότι όλη η γενετική νοημοσύνη είναι ουσιαστικά μια διαδικασία δειγματοληψίας και το βίντεο είναι ένας χώρος υψηλών διαστάσεων. Αν και η ποιότητα του περιεχομένου μπορεί να βελτιωθεί με την αύξηση των δεδομένων εκπαίδευσης και τη μείωση της ακρίβειας δειγματοληψίας. στον εξαιρετικά υψηλών διαστάσεων χώρο, εξακολουθεί να είναι δύσκολο να επιτευχθεί τελειότητα υπό το τρέχον τεχνικό πλαίσιο.

Επιπλέον, ο περιορισμός της υπολογιστικής ισχύος είναι επίσης σημαντικός παράγοντας. Προς το παρόν, οι δείκτες υπολογιστικής ισχύος, συμπεριλαμβανομένων μοντέλων μεγάλων γλωσσών και μοντέλων παραγωγής εικόνων και βίντεο, έχουν φτάσει στο επίπεδο των δεκάδων terabyte, εκατοντάδων terabyte ή ακόμη και χιλιάδων terabyte. Στο μέλλον, η τάση ανάπτυξης της γενετικής νοημοσύνης θα βυθιστεί σίγουρα στην τελική πλευρά και είναι αδύνατο για την τελική πλευρά να χρησιμοποιήσει απεριόριστη δειγματοληψία μεγάλης υπολογιστικής ισχύος για την επίλυση προβλημάτων.

Από αυτή την άποψη, ο Ni Bingbing πρότεινε τη χρήση ενός διανυσματικού πλαισίου αναπαράστασης για την εισαγωγή περιεχομένου βίντεο σε παραμέτρους δικτύου, επιτυγχάνοντας έτσι ακριβή έλεγχο του παραγόμενου περιεχομένου και καλύτερη συμμόρφωση με τους κανόνες του φυσικού κόσμου.

Πιστεύει ότι η τρέχουσα επιτυχία της γενετικής τεχνητής νοημοσύνης είναι εις βάρος της υπερβολικής κατανάλωσης υπολογιστικής ισχύος και δεδομένων. με υψηλότερη ποιότητα και αποτελεσματικότητα.

Ο Chen Jianyi, ανώτερος αντιπρόεδρος του Meitu Group, ανέλυσε τα σενάρια εφαρμογών και τις προκλήσεις της δημιουργίας βίντεο AI από την οπτική γωνία ενός διαχειριστή προϊόντων.

Κατά τη διάρκεια της έρευνας των χρηστών, ανακάλυψε δύο ενδιαφέροντα φαινόμενα.

Πρώτον, οι γνώστες θα εκπλαγούν επειδή το βίντεο δημιουργείται από AI, αλλά για τους απλούς χρήστες, δεν τους ενδιαφέρει αν το βίντεο δημιουργείται από AI, αλλά εστιάζουν στο αν το περιεχόμενο είναι ελκυστικό.

«Αυτό σημαίνει ότι ανεξάρτητα από την οπτική εμπειρία που επιτυγχάνει η τεχνολογία δημιουργίας βίντεο AI, πρέπει να επιστρέψουμε στο ίδιο το περιεχόμενο και να επικεντρωθούμε στις αξίες και τις ιστορίες που θέλει να μεταφέρει το βίντεο».

Δεύτερον, οι περισσότεροι απλοί χρήστες δεν είναι εξοικειωμένοι με επαγγελματικούς όρους όπως "Vincent Pictures" και "Vicent Videos" και δεν γνωρίζουν τις συγκεκριμένες χρήσεις τους. Πάρτε ως παράδειγμα το "Wen Sheng Tu" Αυτός ο όρος είναι ακριβώς όπως η λειτουργία "liquify" του PhotoShop τότε, η οποία είναι δύσκολο να κατανοηθεί, ωστόσο, εάν περιορίζεται σε μια σκηνή και περιγράφεται ως λειτουργία "αδυνατίσματος προσώπου". Οι χρήστες μπορούν να το καταλάβουν πιο διαισθητικά. Το ίδιο ισχύει και για το «Vincent Video».

Ταυτόχρονα, είπε ότι η τεχνολογία δημιουργίας βίντεο AI καθιστά την έκφραση περιεχομένου πιο συγκεκριμένη και εμπλουτίζει την οπτική δημιουργικότητα και εμπειρία, αλλά εξακολουθεί να χρειάζεται να λύσει βασικά ζητήματα όπως ο έλεγχος οπτικών ρυθμίσεων, ο δυναμικός έλεγχος και ο έλεγχος ήχου.

Η πλατφόρμα δημιουργίας ταινιών μικρού μήκους AI της Meitu Discovery, MOKI, ξεπερνά αυτές τις μεγάλες δυσκολίες.

Σύμφωνα με αναφορές, η MOKI έχει δημιουργήσει μια ολοκληρωμένη ροή εργασίας ταινιών μικρού μήκους με πυρήνα την τεχνολογία δημιουργίας βίντεο AI. Στο αρχικό στάδιο, οι δημιουργοί μπορούν να γράψουν σενάρια, να σχεδιάσουν οπτικά στυλ και να ορίσουν χαρακτήρες και στη συνέχεια να χρησιμοποιήσουν την τεχνολογία AI για να δημιουργήσουν υλικό βίντεο. Τέλος, μέσω των δυνατοτήτων post-production του AI, όλα τα υλικά συνδέονται για να σχηματίσουν μια συνεκτική ταινία μικρού μήκους.

Ως ιδρυτής της startup διασημοτήτων Haiper AI, ο Miao Yishu συζήτησε βαθιά τη σημασία και την αξία της τεχνολογίας παραγωγής βίντεο.

Η Miao Yishu είπε: «Ακούμε συχνά τέτοιες απόψεις, όπως «Η γλώσσα είναι ευφυΐα» ή «Τα μεγάλα γλωσσικά μοντέλα είναι γενική τεχνητή νοημοσύνη (AGI)». σημαντικοί τρόποι για να αποκτήσουν οι άνθρωποι γνώσεις, αλλά δεν είναι ο μόνος τρόπος για να μαθαίνουν οι άνθρωποι μέσω πολλαπλών μεθόδων μάθησης, όπως η όραση, η ακοή, η ανάγνωση και η κιναισθητική έξυπνος».

Μετά την κυκλοφορία του GPT-3.5, πολλοί άνθρωποι διατύπωσαν την άποψη ότι "η επεξεργασία φυσικής γλώσσας (NLP) δεν υπάρχει πλέον" επειδή τα μεγάλα γλωσσικά μοντέλα βασικά λύνουν τη μάθηση και τη σημασιολογία του γλωσσικού συστήματος μέσω αυτοπαλινδρομικών μοντέλων παραγωγής (πρόβλεψη της επόμενης λέξης κάθε φορά). προβλήματα συμπερασμάτων, δεν χρειαζόμαστε πλέον καν διακριτικά μοντέλα για να τελειοποιήσουμε συγκεκριμένα προβλήματα συμπερασμάτων.

Ομοίως, τα μοντέλα δημιουργίας βίντεο δημιουργούν επίσης μοντέλα παραγωγής μέσω της αυτόματης παλινδρόμησης (πρόβλεψη του επόμενου καρέ βίντεο κάθε φορά), έτσι το μοντέλο μαθαίνει σιωπηρά σημαντικές εργασίες στον τομέα της όρασης υπολογιστή, όπως η πρόβλεψη βάθους, ο σημασιολογικός σχολιασμός και η σημασιολογική κατάτμηση. Ως εκ τούτου, το 2024, θα ακούσουμε παρατηρήσεις όπως "Το Computer Vision (CV) δεν υπάρχει πια", επειδή το μοντέλο παραγωγής βίντεο έχει σταδιακά κατακτήσει τις αντιληπτικές ικανότητες και τους φυσικούς νόμους στη διαδικασία εκμάθησης δημιουργίας περιεχομένου βίντεο.

Χρειάζεται να καταλάβουμε τον πρώτο νόμο του Νεύτωνα σαν κουτάβι για να κυνηγάμε τις πεταλούδες στο δρόμο Αυτό μέσω της συνεχούς αλληλεπίδρασης με τον κόσμο και της παρατήρησης, μάθησης μέσω διαφόρων μοντέλων Στην πραγματικότητα, το μοντέλο παραγωγής βίντεο έχει δημιουργήσει ένα παγκόσμιο μοντέλο μαθαίνοντας να δημιουργείτε διαφορετικό περιεχόμενο βίντεο και μπορούμε εύκολα να αλληλεπιδράσουμε με το παγκόσμιο μοντέλο μέσω άμεσων λέξεων για απόδοση. το περιεχόμενο βίντεο που θέλουμε και όλα αυτά δεν απαιτούν να δημιουργήσουμε ρητά έναν προσομοιωτή για την προσομοίωση των λεγόμενων φυσικών νόμων.

Ο Miao Yishu τόνισε, "Η γενιά βίντεο είναι πέρα από τη δημιουργία βίντεο." Κατά την άποψή του, το μοντέλο παραγωγής βίντεο δεν μπορεί μόνο να δημιουργήσει περιεχόμενο βίντεο, αλλά είναι επίσης ένα σημαντικό βήμα για την εκμάθηση βασικών αντιληπτικών ικανοτήτων μέσω της πολλαπλής μάθησης, και είναι επίσης ο μόνος τρόπος για την τεχνητή νοημοσύνη να κινηθεί προς το AGI.

Συζήτηση στρογγυλής τραπέζης: Πώς να προχωρήσετε στη δημιουργία βίντεο;

Εκτός από το θέμα που μοιράστηκαν τέσσερις ειδικοί και μελετητές, το φόρουμ προσκάλεσε επίσης επισκέπτες από ακαδημαϊκό κόσμο, επιχειρήσεις, νεοφυείς επιχειρήσεις και γνωστά επενδυτικά ιδρύματα να διεξάγουν σε βάθος συζητήσεις στρογγυλής τραπέζης γύρω από τεχνολογίες αιχμής για παραγωγή βίντεο και καινοτόμες πρακτικές εφαρμογής στο βιομηχανίες προσγείωσης σκηνής.

Στην πρώτη συζήτηση στρογγυλής τραπέζης, ο Zhu Jiang, ιδρυτής και Διευθύνων Σύμβουλος της Jingying Technology, ο Liu Ziwei, επίκουρος καθηγητής του Τεχνολογικού Πανεπιστημίου Nanyang στη Σιγκαπούρη, ο Li Feng, διευθυντής AI του Shengqu Game Technology Center, ο Le Yuan, συνεργάτης της Yitian Capital και άλλοι προσκεκλημένοι συζητήθηκε «οδηγούμενο από μεγάλα μοντέλα, Πού θα πάει η πορεία βελτίωσης της τεχνολογίας παραγωγής βίντεο;» Αυτό το θέμα συζητήθηκε σε βάθος και συζητήθηκαν οι προοπτικές για την εφαρμογή της τεχνολογίας παραγωγής βίντεο στη βιομηχανία.

Ο Zhu Jiang, ιδρυτής και διευθύνων σύμβουλος της Jingying Technology, συγκρίνει την τεχνολογία παραγωγής βίντεο με την έκρηξη της ζωής στην Κάμβρια και πιστεύει ότι αυτή τη στιγμή βρίσκεται σε ένα στάδιο ταχείας ανάπτυξης τεχνολογίας και εφαρμογών. Τόνισε ότι οι εταιρείες επιπέδου εφαρμογών πρέπει να διατηρήσουν την κατανόησή τους και την ηγετική τους θέση στην τεχνολογία, δίνοντας παράλληλα προσοχή στις ανάγκες των χρηστών προκειμένου να ξεχωρίσουν από τον ανταγωνισμό. Είπε ότι στο τέλος τόσο οι εταιρείες μοντέλων όσο και οι εταιρείες εφαρμογών θα επιβιώσουν, αλλά οι εταιρείες μοντέλων μπορεί να είναι πιο γενικές, ενώ οι εταιρείες εφαρμογών πρέπει να δώσουν μεγαλύτερη προσοχή στην κατανόηση των χρηστών και των επιχειρήσεων.

Ο Liu Ziwei, επίκουρος καθηγητής στο Τεχνολογικό Πανεπιστήμιο Nanyang στη Σιγκαπούρη, πιστεύει ότι η τεχνολογία παραγωγής βίντεο βρίσκεται επί του παρόντος στην εποχή GPT-3 και απέχει ακόμη περίπου μισό χρόνο από την ωριμότητα. Ανέλυσε τα πλεονεκτήματα και τα μειονεκτήματα των τριών τεχνικών μονοπατιών του Diffusion, του Transformer και του γλωσσικού μοντέλου και πίστεψε ότι μπορεί να ενσωματωθούν και να αναπτυχθούν στο μέλλον. Τόνισε επίσης την ανάγκη να διερευνηθεί ο «πρώτος νόμος του Νεύτωνα» για την τεχνολογία παραγωγής βίντεο, δηλαδή πώς να επιτευχθούν προβλέψιμες βελτιώσεις επενδύοντας σε υπολογιστική ισχύ και δεδομένα.

Από τη σκοπιά της βιομηχανίας παιχνιδιών, ο Li Feng, επικεφαλής του AI στο Shengqu Game Technology Center, πιστεύει ότι η τεχνολογία παραγωγής βίντεο μπορεί να βελτιώσει την αποτελεσματικότητα και τη δημιουργικότητα ανάπτυξης παιχνιδιών. Ελπίζει να συνεργαστεί με εταιρείες μοντέλων για την εφαρμογή τεχνολογίας παραγωγής βίντεο στη διαδικασία ανάπτυξης παιχνιδιών, όπως η αναφορά στην ιδέα της διαφοροποιημένης απόδοσης για προεπισκόπηση σχεδίασης και διάταξης επιπέδου, οπτική ευθυγράμμιση των μεθόδων επικοινωνίας κατά τη συνεργασία Ε&Α και οπτική ευθυγράμμιση με άλλους δυναμικές εικόνες περιουσιακών στοιχείων.

Ο Le Yuan, συνεργάτης της Yitian Capital, ανέλυσε τις προκλήσεις που αντιμετωπίζει η εμπορική εφαρμογή της τεχνολογίας παραγωγής βίντεο από την άποψη του κεφαλαίου. Πιστεύει ότι η τεχνολογία παραγωγής βίντεο έχει σημειώσει πρόοδο πολύ πέρα από τις προσδοκίες τα τελευταία δύο ή τρία χρόνια, πράγμα που προκαλεί έκπληξη, ωστόσο, αντικειμενικά μιλώντας, το σημερινό τεχνικό επίπεδο εξακολουθεί να μην είναι αρκετό για να υποστηρίξει την εμπορευματοποίηση μεγάλης κλίμακας χρησιμοποιείται Η μεθοδολογία και οι προκλήσεις που αντιμετωπίζονται ισχύουν επίσης για πεδία εφαρμογών που σχετίζονται με βίντεο.

Ο δεύτερος διάλογος στρογγυλής τραπέζης του φόρουμ επικεντρώθηκε στο "Innovation and Opportunities in Video Generation Applications under the Wave of Deconstructed Generative AI Guests from Wuyuan Capital, FancyTech, Morph AI και Stanford University μίλησαν από επενδύσεις, εφαρμογές, τεχνολογία και τέχνη κ.λπ.". Από πολλές οπτικές γωνίες, διερευνώνται η κατεύθυνση ανάπτυξης και τα σενάρια εφαρμογής της τεχνολογίας παραγωγής βίντεο.

Ο Kong Jie, ιδρυτής και διευθύνων σύμβουλος της FancyTech, πιστεύει ότι η τεχνολογία παραγωγής βίντεο θα επιφέρει μεταρρυθμίσεις από την πλευρά της προσφοράς, επιτρέποντας σε περισσότερους ανθρώπους να συμμετέχουν στη δημιουργία περιεχομένου. Εισήγαγε την πλατφόρμα δημιουργίας βίντεο To B της FancyTech, η οποία βοηθά τους εμπόρους να μειώσουν το κόστος δημιουργίας περιεχομένου επαναφέροντας πραγματικά αντικείμενα σε εικονικές σκηνές.

Ο Shi Yunfeng, αντιπρόεδρος της Wuyuan Capital, ανέφερε ότι η τρέχουσα γενιά βίντεο βρίσκεται ακόμα στα αρχικά στάδια ανάπτυξης, παρόμοια με την κατάσταση εξερεύνησης όταν κυκλοφόρησε για πρώτη φορά το GPT2. Η εύρεση PMF είναι μια μεγάλη πρόκληση όταν τα θεμέλια της τεχνολογίας δεν είναι ακόμη στέρεα. Πιστεύει ότι παρόλο που η τεχνολογία συνεχίζει να προοδεύει, οι δημιουργοί είναι πολύ ενθουσιώδεις και έχουν ένα συγκεκριμένο εύρος διάδοσης, αλλά δεν υπάρχει ευρεία κατανάλωση περιεχομένου. Απαιτεί ταλαντούχους διαχειριστές προϊόντων να προσαρμόσουν το προϊόν και να δημιουργήσουν νέες φόρμες περιεχομένου που δεν είναι συμβατές με την υπάρχουσα ροή πληροφοριών.

Ο ιδρυτής και διευθύνων σύμβουλος της Morph AI Xu Huaizhe πιστεύει ότι η τεχνολογία παραγωγής βίντεο και οι εφαρμογές είναι εξίσου σημαντικές Ως ομάδα με τεχνικό υπόβαθρο, είναι πιο σημαντικό να συντονίζουμε την ανάπτυξη του επιπέδου του μοντέλου και του επιπέδου εφαρμογής. Παρουσίασε το Morph Studio, ένα εργαλείο παραγωγής βίντεο all-in-one, το οποίο βασίζεται στο κορυφαίο μοντέλο βίντεο AI της Morph. Αυτή τη στιγμή δοκιμάζεται παγκοσμίως και έχει λάβει θετικά σχόλια. Στο μέλλον, η Morph θα συνεχίσει να βελτιστοποιεί τις λειτουργίες προϊόντων και την εμπειρία του χρήστη μέσω των σχολίων των χρηστών, έτσι ώστε η τεχνολογία βίντεο AI της να μπορεί να εφαρμοστεί ταχύτερα μέσω προϊόντων και να βοηθά καλύτερα τους δημιουργούς.

Από τη σκοπιά του συνδυασμού τέχνης και τεχνολογίας, ο Rao Anyi, μεταδιδακτορικός ερευνητής στο Πανεπιστήμιο του Στάνφορντ, πιστεύει ότι η τεχνολογία παραγωγής βίντεο μπορεί να εμπνεύσει πιο διαδραστικές μεθόδους δημιουργίας. Τόνισε ότι ούτε οι μηχανές ούτε οι άνθρωποι μπορούν να είναι 100% σωστοί, επομένως πρέπει να εισαχθεί ένας διαδραστικός μηχανισμός βελτίωσης στη δημιουργική διαδικασία που θα επιτρέπει σε μηχανές και ανθρώπους να συνεργάζονται για να ολοκληρώσουν τη δημιουργία.

Συνολικά, οι προσκεκλημένοι στο διάλογο στρογγυλής τραπέζης είναι γεμάτοι προσδοκίες για τις προοπτικές εφαρμογής της τεχνολογίας παραγωγής βίντεο, αλλά αναγνωρίζουν επίσης ότι η τρέχουσα τεχνολογία βρίσκεται ακόμα στα αρχικά της στάδια και ότι πρέπει να διερευνηθούν νέα επιχειρηματικά μοντέλα και σενάρια εφαρμογών για να επιτευχθεί μεγαλύτερη αξία .

Η επιτυχημένη διεξαγωγή αυτού του φόρουμ όχι μόνο παρέχει μια πλατφόρμα επικοινωνίας και μάθησης για τους επαγγελματίες στον τομέα του βίντεο τεχνητής νοημοσύνης, αλλά παρέχει επίσης περισσότερες ευκαιρίες συνεργασίας για όλους τους κρίκους της σχετικής βιομηχανικής αλυσίδας. Κοιτάζοντας το μέλλον, η τεχνολογία βίντεο AI θα εισάγει έναν ευρύτερο χώρο ανάπτυξης και πλουσιότερα σενάρια εφαρμογών, δημιουργώντας μια καλύτερη οπτική εμπειρία για τους ανθρώπους.

Νέα

Μεγάλες εταιρείες έχουν ξεκινήσει έναν «αγώνα εξοπλισμών» στη δημιουργία βίντεο Μπορεί η τεχνητή νοημοσύνη να καταρρίψει πραγματικά το Χόλιγουντ;

Εισαγωγή

τα στοιχεία επικοινωνίας μου