Νέα

Δημιουργήστε βίντεο σε 30 δευτερόλεπτα, δωρεάν και απεριόριστους χρόνους Η κινεζική έκδοση του "Wisdom Spectrum Qingying" του OpenAI που κυκλοφόρησε σήμερα έχει παιχτεί τρελά.

2024-07-26

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina


Τους τελευταίους έξι μήνες, τα εγχώρια και ξένα μοντέλα γενιάς βίντεο εγκαινίασαν έναν νέο γύρο τεχνολογικής έκρηξης και ήταν πάντα δημοφιλή στα κοινωνικά δίκτυα στην πρώτη θέση.

Ωστόσο, σε αντίθεση με το «υστερήσεις» των μοντέλων παραγωγής γλωσσών, οι πρόσφατες τάσεις δείχνουν ότι η εγχώρια πρόοδος στον τομέα των μοντέλων παραγωγής βίντεο έχει ξεπεράσει κατά πολύ το διεθνές επίπεδο. Πολλοί ξένοι χρήστες του Διαδικτύου είπαν ότι το "Κινέζικο βίντεο AI Keling" πυροδοτεί το Διαδίκτυο, ενώ ο Sora του OpenAI κοιμάται.

Σήμερα, η Zhipu AI, κορυφαίος εγχώριος κατασκευαστής μοντέλων, κυκλοφόρησε επίσης το προϊόν παραγωγής βίντεο AI "Qingying".


Φυσικά, υπάρχουν πολλά μοντέλα βίντεο τεχνητής νοημοσύνης στο εσωτερικό και στο εξωτερικό, και όλα έχουν πολλά ελαττώματα, αλλά σε σύγκριση με τα "μελλοντικά" Sora, αυτά τα προϊόντα βίντεο τεχνητής νοημοσύνης είναι και ορατά και απτά και μπορεί να απαιτούν το πολύ λίγες περισσότερες προσπάθειες Βίντεο "σχεδίασης" εγγυημένης συμφωνίας.

Και αυτή η ίδια η εξερεύνηση είναι μέρος της τεχνολογικής προόδου.

Ακριβώς όπως το GPT-3 αμφισβητήθηκε και επικρίθηκε στην αρχή της γέννησής του και τελικά χρησιμοποίησε τον χρόνο για να αποδείξει την αξία του στη μεταφορά του παρελθόντος και στο άνοιγμα του μέλλοντος, παρομοίως, εάν δώσουμε σε αυτά τα εργαλεία δημιουργίας βίντεο AI λίγο χρόνο, μπορεί να μετατρέπονται από παιχνίδια σε εργαλεία μέσα σε λίγες μέρες.

Σύνδεσμος πρόσβασης για υπολογιστή Qingying:
https://chatglm.cn/video?fr=opt_homepage_PC
Σύνδεσμος πρόσβασης για κινητά Qingying:
https://chatglm.cn/video?&fr=opt_888_qy3

Δημιουργήστε βίντεο 6s σε μισό λεπτό, το "Zhipu Qingying" κυκλοφόρησε επίσημα

Σε σύγκριση με το Zhipu Qingying που κυκλοφόρησε σήμερα, πολλοί άνθρωποι μπορεί να είναι πιο εξοικειωμένοι με το Zhipu Qingyan, αλλά αντί να παρακολουθήσετε τη διαφήμιση για να δείτε την αποτελεσματικότητα, μπορείτε επίσης να ρίξετε μια ματιά στο demo που δημιουργήθηκε από το "Qingying".

Στο καταπράσινο δάσος, λίγο φως του ήλιου λάμπει μέσα από τα κενά των φύλλων, παράγοντας το φαινόμενο Tyndall και το φως παίρνει μορφή.


Όταν το τσουνάμι βρυχήθηκε σαν μαινόμενο τέρας, ολόκληρο το χωριό καταβροχθίστηκε αμέσως από τη θάλασσα, ακριβώς όπως μια κλασική σκηνή σε μια ταινία του Doomsday.


Στη νυχτερινή σκηνή της πόλης με τα φώτα νέον που αναβοσβήνουν, μια μικρή μαϊμού γεμάτη μηχανική ομορφιά κρατά εργαλεία υψηλής τεχνολογίας και επισκευάζει τον ίδιο, υπερφουτουριστικό ηλεκτρονικό εξοπλισμό που αναβοσβήνει.


Αλλάζοντας ξανά το στυλ ζωγραφικής, το γατάκι άνοιξε διάπλατα το στόμα του, δείχνοντας μια εξανθρωπισμένη έκφραση σύγχυσης, με ερωτηματικά γραμμένα σε όλο του το πρόσωπο.


Δεν υπάρχει δράμα μάχης για το παλάτι, δεν υπάρχουν ίντριγκες, η διασταυρούμενη αγκαλιά του Τζεν Χουάν Μεϊτζουάνγκ στον χρόνο και τον χώρο, μόνο η ειλικρινής αδελφική αγάπη.


Επιπλέον, χάρη στο CogVideo, ένα μεγάλο μοντέλο παραγωγής βίντεο που αναπτύχθηκε ανεξάρτητα και κατασκευάστηκε αποτελεσματικά από τη μεγάλη ομάδα μοντέλων Zhipu, το Qingying υποστηρίζει τώρα μια ποικιλία μεθόδων παραγωγής, όπως βίντεο δημιουργίας κειμένου, βίντεο δημιουργίας εικόνας και μπορεί ακόμη και να χρησιμοποιηθεί στη διαφημιστική παραγωγή και επεξεργασία ταινιών , παραγωγή μικρού μήκους βίντεο και άλλα πεδία.

Το Qingying έχει ισχυρή ικανότητα παρακολούθησης εντολών και μπορεί να κατανοήσει και να εκτελέσει πλήρως τις οδηγίες που δίνονται από τους χρήστες.

Σύμφωνα με αναφορές, η Zhipu AI έχει αναπτύξει από μόνος του ένα μοντέλο κατανόησης βίντεο από άκρο σε άκρο για τη δημιουργία λεπτομερών και φιλικών προς το περιεχόμενο περιγραφών για τεράστια δεδομένα βίντεο, βελτιώνοντας έτσι την κατανόηση του κειμένου και τις οδηγίες του μοντέλου που ακολουθούν τις δυνατότητες και δημιουργώντας περιεχόμενο που ανταποκρίνεται στις ανάγκες των χρηστών . βίντεο.


Όσον αφορά τη συνοχή του περιεχομένου, η Zhipu AI ανέπτυξε μια αποτελεσματική τρισδιάστατη δομή αυτόματου κωδικοποιητή παραλλαγών (3D VAE), η οποία συμπιέζει τον αρχικό χώρο βίντεο στο 2% του μεγέθους Μαζί με τη μονάδα κωδικοποίησης θέσης 3D RoPE για τη λήψη καρέ στη διάσταση του χρόνου Η σχέση μεταξύ τους καθιερώνει εξάρτηση μεγάλης εμβέλειας στο βίντεο.

Για παράδειγμα, πόσα βήματα χρειάζονται για να μετατραπούν οι πατάτες σε τηγανιτές πατάτες; Δεν χρειάζεται να «φουντώσετε», μόνο μια απλή προτροπή, οι πατάτες θα μετατραπούν σε χρυσές και ελκυστικές τηγανιτές πατάτες. Οι υπεύθυνοι λένε ότι όσο άγρια ​​κι αν είναι η ιδέα σας, μπορεί να την κάνει πραγματικότητα μία προς μία.


Επιπλέον, το CogVideoX, σχεδιασμένο με αναφορά στον αλγόριθμο Sora, είναι επίσης μια αρχιτεκτονική DiT που μπορεί να ενσωματώσει τις τρεις διαστάσεις του κειμένου, του χρόνου και του χώρου Μετά από τεχνική βελτιστοποίηση, το CogVideoX αύξησε την ταχύτητα συλλογισμού του κατά 6 φορές σε σύγκριση με την προηγούμενη γενιά (CogVideo). Θεωρητικά, χρειάζονται μόνο 30 δευτερόλεπτα για να δημιουργήσει ένα βίντεο 6 δευτερολέπτων από την πλευρά του μοντέλου.

Για σύγκριση, το Keling AI, το οποίο βρίσκεται επί του παρόντος στην πρώτη βαθμίδα, χρειάζεται γενικά 2 έως 5 λεπτά για να δημιουργήσει ένα μόνο βίντεο 5s.

Στη σημερινή συνέντευξη Τύπου, ο Διευθύνων Σύμβουλος της Τεχνητής Νοημοσύνης Zhipu, Zhang Peng, ζήτησε από τον Qingying να δημιουργήσει ένα βίντεο με ένα τσιτάχ να κοιμάται στο έδαφος με το σώμα του να κυματίζει ελαφρώς.

Επιπλέον, η ανάλυση του βίντεο που δημιουργείται από το Qingying μπορεί να φτάσει τα 1440x960 (3:2) και ο ρυθμός καρέ είναι 16fps.

Το Qingying παρέχει επίσης προσεκτικά μια λειτουργία soundtrack και μπορείτε να προσθέσετε μουσική στο βίντεο που δημιουργείται και να το δημοσιεύσετε απευθείας.

Νόμιζα ότι η στατική εικόνα των αστροναυτών που παίζουν κιθάρα ήταν αρκετή για να είναι ευφάνταστη, αλλά όταν κινήθηκε και συνδυάστηκε με μια χαλαρή μελωδία, φαινόταν σαν οι αστροναύτες να κρατούσαν μια συναυλία στο διάστημα.

Διαφορετικό από το "Futures" Sora, το "Qingying" δεν ασχολείται με το μάρκετινγκ πείνας. Θα είναι πλήρως ανοιχτό μόλις βγει στο διαδίκτυο σε επόμενες εκδόσεις Η λειτουργία δημιουργίας βίντεο με υψηλότερο ρυθμό και μεγαλύτερη διάρκεια.

Ο Zhang Peng είπε επίσης στο Zhipu Open Day, «Όλοι οι χρήστες μπορούν να βιώσουν τις δυνατότητες βίντεο και εικόνας που βασίζεται σε κείμενο της τεχνητής νοημοσύνης μέσω του Ying».

Τώρα, το Qingying βρίσκεται στην αρχική του περίοδο δοκιμών και όλοι οι χρήστες μπορούν να το χρησιμοποιήσουν δωρεάν. Εάν επιδιώκετε μια πιο ομαλή εμπειρία, μπορείτε να ξεκλειδώσετε δικαιώματα πρόσβασης υψηλής ταχύτητας για μία ημέρα (24 ώρες) για 5 γιουάν.

Επιπλέον, το Ying API κυκλοφορεί ταυτόχρονα στην ανοιχτή πλατφόρμα μεγάλου μοντέλου bigmodel.cn Οι επιχειρήσεις και οι προγραμματιστές μπορούν να δοκιμάσουν και να χρησιμοποιήσουν τις δυνατότητες του μοντέλου Wensheng Video και Tusheng Video καλώντας το API.

Το όριο για να ξεκινήσετε είναι χαμηλό, αλλά εξακολουθείτε να χρειάζεται να "τραβήξετε κάρτες".

Το APPSO βίωσε επίσης το Qingying για πρώτη φορά Αφού δοκιμάσαμε ορισμένα σενάρια, συνοψίσαμε επίσης μερικές εμπειρίες σχετικά με τη χρήση του Qingying:

  • Η δημιουργία βίντεο είναι σαν "αλχημεία" και η έξοδος είναι ασταθής Συνιστάται να το δοκιμάσετε πολλές φορές.
  • Το ανώτερο όριο του εφέ εξαρτάται από τη λέξη προτροπής και η δομή της προτρεπόμενης λέξης πρέπει να είναι όσο το δυνατόν πιο σαφής
  • Το καλύτερο αποτέλεσμα του φακού είναι η κοντινή λήψη και οι άλλες λήψεις δεν είναι πολύ σταθερές.
  • Ταξινόμηση υλοποίησης τύπου οντότητας: ζώα> φυτά> αντικείμενα> κτίρια> άνθρωποι

Ένας επιστήμονας που δεν καταλαβαίνει από την τέχνη δεν είναι καλός επιστήμονας ο Αϊνστάιν έπαιζε κιθάρα σαν ψάρι στο νερό, κουνώντας το κεφάλι του στον δικό του ρυθμό και δεν φαινόταν ότι έπαιζε.


Το γιγάντιο πάντα παίζει επίσης κιθάρα με στυλ και ευελιξία.


Ο Τανγκ Σενγκ, που είναι συνήθως στωικός, σου έγνεψε ένα γεια και ταλαντεύτηκε στο ρυθμό.


Φυσικά, τα παραπάνω εξακολουθούν να είναι μερικά σχετικά καλά βίντεο.

Για παράδειγμα, ζήτησα από τον αυτοκράτορα που ήταν ξαπλωμένος στο κρεβάτι να φάει ένα μπαστούνι κοτόπουλου με το δεξί του χέρι, και ένα επιπλέον χέρι εμφανίστηκε στο τελευταίο δευτερόλεπτο του βίντεο, ένιωσα ότι ο αυτοκράτορας ήταν έτοιμος να αποκαλύψει το θηλυκό του μακιγιάζ και μαλλιά.


Ή ίσως τη στιγμή που ο Leslie Cheung με κοίταξε, ο αδερφός στην καρδιά του είχε γίνει "αυτός ο άνθρωπος".


Σε περίπλοκες σκηνές, η μετάβαση των κινήσεων των χαρακτήρων είναι αφύσικη, τα φυσικά χαρακτηριστικά των σύνθετων σκηνών δεν μπορούν να προσομοιωθούν με ακρίβεια, η ακρίβεια του παραγόμενου περιεχομένου είναι ανεπαρκής, κ.λπ. μοντέλο.

Σε πρακτικές εφαρμογές, παρόλο που οι χρήστες μπορούν να βελτιώσουν την ποιότητα του βίντεο βελτιστοποιώντας τις προτρεπτικές λέξεις, το "rollover" είναι επίσης κοινό.

Προκειμένου να φροντίσουμε ορισμένους αρχάριους παίκτες, έχουμε επίσης προετοιμάσει ειδικά μερικές συμβουλές για άμεσες λέξεις:

  • Απλή φόρμουλα: [Κίνηση κάμερας] + [Σκηνή κατασκευής] + [Περισσότερες λεπτομέρειες]
  • Πολύπλοκος τύπος: [Γλώσσα του φακού] + [Φως και σκιά] + [Θέμα (Περιγραφή θέματος)] + [Κίνηση θέματος] + [Σκηνή (Περιγραφή σκηνής)] + [Διάθεση/Ατμόσφαιρα]

Η κάμερα γυρίζει (κίνηση του φακού) για να αποκαλύψει ένα μικρό αγόρι που κάθεται σε ένα παγκάκι στο πάρκο (περιγραφή θέματος), κρατώντας ένα φλιτζάνι καφέ στον ατμό (δράση του θέματος). Φοράει ένα μπλε πουκάμισο και δείχνει χαρούμενος (λεπτομέρειες του θέματος), και το φόντο είναι ένα δεντρόφυτο πάρκο, με το φως του ήλιου να λάμπει μέσα από τα φύλλα στο αγόρι (περιγραφή του περιβάλλοντος).

Εάν εξακολουθείτε να μην έχετε ιδέα, τότε σας συνιστώ να χρησιμοποιήσετε τον έξυπνο πράκτορα που παρέχεται από τον Zhipu Qingyan για να σας βοηθήσει να γράψετε προτροπές βίντεο Ακόμα κι αν εισάγετε κοινές σκηνές στη ζωή, μπορείτε να λάβετε τρεις προτρεπτικές λέξεις υψηλής ποιότητας.


Για παράδειγμα, αν πείτε απλώς "Ο Κόργκι κάνει ηλιοθεραπεία στην παραλία", θα λάβετε τις ακόλουθες προτροπές στυλ φωτογραφίας φυσικών τοπίων στα κινέζικα και αγγλικά, ενώ υπάρχουν επίσης στυλ ζωγραφικής με ακουαρέλα, στυλ τρισδιάστατης κίνησης και άλλα στυλ που σας ζητούν να επιλέξετε από:

Ελληνικά: Σε μια ηλιόλουστη παραλία, ένα κοργκί ξαπλώνει νωχελικά σε μια πετσέτα θαλάσσης, απολαμβάνοντας τον ζεστό ήλιο. Η κάμερα έχει τραβηχτεί από χαμηλή γωνία. Το φόντο είναι ο απέραντος γαλάζιος ωκεανός και η λευκή αμμουδιά. Ελληνικά: Σε μια ηλιόλουστη παραλία, ένα Corgi ξαπλώνει νωχελικά σε μια πετσέτα θαλάσσης, απολαμβάνοντας το ζεστό φως του ήλιου Η κάμερα καταγράφει τη σκηνή από χαμηλή γωνία, προβάλλοντας τον απέραντο γαλάζιο ωκεανό και την παρθένα λευκή άμμο στο βάθος, με τα απαλά κύματα να περιτριγυρίζουν. η ακτή Η ατμόσφαιρα είναι γαλήνια, αποτυπωμένη σε εξαιρετικά υψηλή ευκρίνεια.

Βλέποντας μια τόσο ικανοποιητική προτροπή, ναι, αυτό ήθελα πραγματικά να γράψω εκείνη τη στιγμή.

Επισυνάπτεται η διεύθυνση του προτρεπτικού word agent Qingying (βίντεο Wensheng): https://chatglm.cn/main/gdetail/669911fe0bef38883947d3c6

Το ίδιο ισχύει για τη δημιουργία βίντεο από εικόνες Εισαγάγετε το θέμα της εικόνας, επιλέξτε το στυλ της εικόνας και αφήστε το Zhipu Qingyan να σας βοηθήσει να γράψετε τις αντίστοιχες προτρεπτικές λέξεις. Η εξέλιξη από το no prompt words, στο "βάλε γυαλιά", στο "Tang Monk απλώνει το χέρι του και βάζει γυαλιά", το αποτέλεσμα είναι επίσης πολύ διαφορετικό.


Επισυνάπτεται η διεύθυνση προτρεπτικού αντιπροσώπου Qingying (βίντεο Tusheng): https://chatglm.cn/main/gdetail/669fb16ffdf0683c86f7d903

Εάν θέλετε να κάνετε καλά τη δουλειά σας, πρέπει πρώτα να ακονίσετε τα εργαλεία σας και να ανοίξετε λίγο περισσότερο το μοτίβο. Μπορείτε επίσης να δοκιμάσετε περισσότερα εργαλεία δημιουργίας περιεχομένου στο Zhipu Qingyan.

Από την αρχική συλλογή θεματικών υλικών, έως τη διαδικασία γραφής σεναρίου, τη διαδικασία δημιουργίας εικόνων και βίντεο, και στη συνέχεια μέχρι τη δημιουργία κειμένων προώθησης, μπορεί σχεδόν να ανοίξει ολόκληρη την αλυσίδα της δημιουργικότητας της παραγωγής βίντεο σκεφτείτε τη δημιουργικότητα και τα υπόλοιπα αφήνονται σε εσάς.

Διαπιστώσαμε ότι τα προϊόντα βίντεο τεχνητής νοημοσύνης που κυκλοφόρησαν πρόσφατα, συμπεριλαμβανομένου του Keling, βελτιώνουν τη δυνατότητα ελέγχου μέσω του πρώτου και του τελευταίου ελέγχου καρέ.


Ο δημιουργός της τεχνητής νοημοσύνης Chen Kun είπε κάποτε στην APPSO ότι σχεδόν όλα τα βίντεο τεχνητής νοημοσύνης που μπορούν να παραδοθούν εμπορικά είναι βίντεο Tusheng, επειδή τα βίντεο Wensheng δεν μπορούν να το κάνουν ακόμα και στην πραγματικότητα είναι θέμα ελέγχου.

Το Qingying που κυκλοφόρησε σήμερα από την Zhipu AI βελτιώνει περαιτέρω τη δυνατότητα ελέγχου των βίντεο που δημιουργούνται από κείμενο Σε μια συνέντευξη με την APPSO, η Zhipu AI είπε ότι τα βίντεο που δημιουργούνται από κείμενο αντικατοπτρίζουν μεγαλύτερη δυνατότητα ελέγχου.

Τα περισσότερα από τα βίντεο που δημιουργούνται από την τεχνητή νοημοσύνη εξακολουθούν να ελέγχονται από ανθρώπους που χρησιμοποιούν γλώσσα. Επομένως, ο τρόπος αναγνώρισης κειμένου ή απλών γλωσσικών οδηγιών είναι ένα υψηλότερο επίπεδο ελέγχου.
Το βίντεο AI μετακινείται από τα παιχνίδια στα εργαλεία δημιουργών

Αν πέρυσι ήταν η πρώτη χρονιά της έκρηξης των μεγάλων μοντέλων, φέτος είναι ένας σημαντικός κόμβος για την εφαρμογή του βίντεο AI.

Παρόλο που η Sora, η οποία πυροδότησε όλα αυτά, δεν έχει συνδεθεί ακόμα, έχει φέρει κάποια έμπνευση σε βίντεο τεχνητής νοημοσύνης.

Το Sora λύνει το πρόβλημα των αλμάτων λεπτομέρειας μεταξύ των πλαισίων μέσω λογικής σχεδίασης λεπτομέρειας. Ταυτόχρονα, δημιουργούνται απευθείας εικόνες βίντεο υψηλής ανάλυσης (1080p), οι οποίες μπορούν να δημιουργήσουν σημασιολογικά πλούσια βίντεο διάρκειας έως και 60 δευτερολέπτων, υποδεικνύοντας ότι η ακολουθία εκπαίδευσης πίσω από αυτό είναι επίσης σχετικά μεγάλη.


Μόνο τους τελευταίους δύο μήνες, τουλάχιστον 10 εταιρείες κυκλοφόρησαν νέα προϊόντα βίντεο τεχνητής νοημοσύνης ή σημαντικές ενημερώσεις.


Λίγες μόλις ημέρες πριν από την κυκλοφορία του Zhipu Qingying, το Keling AI του Kuaishou άνοιξε για εσωτερικές δοκιμές σε όλο τον κόσμο και ένα άλλο PixVerse, που θεωρείται Sora, κυκλοφόρησε την έκδοση V2 του, η οποία υποστηρίζει τη δημιουργία με ένα κλικ συνεχούς περιεχομένου βίντεο 1-5.


Πριν από λίγο καιρό, το Runway Gen 3 Alpha ξεκίνησε επίσης τις δημόσιες δοκιμές beta για χρήστες επί πληρωμή και η φινέτσα και η ομαλότητα των λεπτομερειών έχουν βελτιωθεί σημαντικά. Το μοντέλο παραγωγής βίντεο σε επίπεδο ταινίας Dream Machine, το οποίο μόλις κυκλοφόρησε τον περασμένο μήνα, έχει επίσης ενημερωθεί πρόσφατα με τη λειτουργία πρώτου και τελευταίου καρέ.

Μέσα σε λίγους μόνο μήνες, η παραγωγή βίντεο με τεχνητή νοημοσύνη έχει βελτιωθεί σημαντικά όσον αφορά τη φυσική προσομοίωση, την ευχέρεια κίνησης και την κατανόηση των προτρεπόμενων λέξεων. Ο Chen Kun, ο σκηνοθέτης του δράματος φαντασίας AI, είναι πιο ευαίσθητος σε αυτό.

Τα βίντεο τεχνητής νοημοσύνης το 2023 μοιάζουν περισσότερο με δυναμικά PPT, με χαρακτήρες να εκτελούν σε αργή κίνηση και να βασίζονται στην επεξεργασία μοντάζ για να τραβούν πόντους. Αλλά τώρα, η «γεύση PPT» των βίντεο AI έχει ξεθωριάσει πολύ.

Το πρώτο εγχώριο δράμα θεάματος του σκηνοθέτη Chen Kun "Mountains and Seas: Mirrors of Mountains and Seas: Cutting the Waves" μόλις κυκλοφόρησε , χρειάστηκαν τουλάχιστον 100 άτομα για να φτιάξουν παρόμοια θέματα φαντασίας, και η ομάδα έχει μόνο περισσότερα από 10 άτομα, γεγονός που συντομεύει σημαντικά τον κύκλο παραγωγής και το κόστος.

Τους τελευταίους έξι μήνες, μπορούμε να δούμε περισσότερους επαγγελματίες δημιουργούς ταινιών και τηλεόρασης να αρχίζουν να δοκιμάζουν βίντεο AI. Η Domestic Kuaishou Douyin κυκλοφόρησε δράματα μικρού μήκους AI και η πρώτη μεγάλου μήκους ταινία AI "Our T2 Remake", μια συνεργασία μεταξύ 50 δημιουργών της AIGC, έκανε πρεμιέρα στο Λος Άντζελες.


Αν και η δημιουργία βίντεο με τεχνητή νοημοσύνη εξακολουθεί να έχει περιορισμούς όσον αφορά τη συνέπεια χαρακτήρων και σκηνής, την απόδοση χαρακτήρων, την αλληλεπίδραση δράσης κ.λπ., δεν υπάρχει αμφιβολία ότι το βίντεο με τεχνητή νοημοσύνη μετατρέπεται σιγά σιγά από ένα παιχνίδι που δοκιμάστηκε πέρυσι σε εργαλείο για δημιουργούς.

Αυτός μπορεί επίσης να είναι ένας σημαντικός λόγος για τον οποίο προϊόντα όπως τα Zhipu Qingying, Kuaishou Keling, Luma Dream Machine και άλλα προϊόντα έχουν αρχίσει να κυκλοφορούν συστήματα ιδιότητας μέλους Πρέπει να γνωρίζετε ότι τα περισσότερα από τα εγχώρια μεγάλα μοντέλα προϊόντων για το C-end είναι δωρεάν σύμφωνα με τις συνήθειες και τις προτεραιότητες πληρωμής εγχώριων συνδρομών Σε σχέση με την επιδίωξη στρατηγικών ανάπτυξης χρηστών, εκτός από τους περίεργους χρήστες, η πληρωμή για βίντεο τεχνητής νοημοσύνης πρέπει να υποστηρίζεται από περισσότερους δημιουργούς περιεχομένου.

Φυσικά, η δημιουργία βίντεο με τεχνητή νοημοσύνη είναι ακόμα σε σχετικά πρώιμο στάδιο Η λεγόμενη "δημιουργία ταινίας σε μια πρόταση" είναι απλώς ένας παραπλανητικός τίτλος Τα μοντέλα βίντεο πρέπει να έχουν καλύτερες δυνατότητες παρακολούθησης εντολών και δυνατότητα ελέγχου φυσικό κόσμο.

Ο Zhipu ανέφερε επίσης στη σημερινή συνέντευξη Τύπου ότι η εξερεύνηση πολυτροπικών μοντέλων βρίσκεται ακόμα σε πολύ πρώιμο στάδιο.

Κρίνοντας από την επίδραση των βίντεο που δημιουργούνται, υπάρχουν πολλά περιθώρια βελτίωσης όσον αφορά την κατανόηση των νόμων του φυσικού κόσμου, την υψηλή ανάλυση, τη συνέχεια των κινήσεων της κάμερας και τη διάρκεια. Από την οπτική γωνία του ίδιου του μοντέλου, απαιτείται μια νέα αρχιτεκτονική μοντέλου με περισσότερη πρωτοποριακή καινοτομία. Θα πρέπει να συμπιέζει τις πληροφορίες βίντεο πιο αποτελεσματικά, να ενσωματώνει πλήρως το περιεχόμενο κειμένου και βίντεο και να κάνει το παραγόμενο περιεχόμενο πιο ρεαλιστικό, ενώ συμμορφώνεται με τις οδηγίες του χρήστη.

«Εξερευνούμε ενεργά πιο αποτελεσματικές μεθόδους κλιμάκωσης σε επίπεδο μοντέλου, ωστόσο, ο Zhang Peng είναι επίσης σίγουρος για την ανάπτυξη πολυτροπικών μοντέλων. η ισχυρή του δύναμη».

Ο δημιουργός της τεχνητής νοημοσύνης Chen Kun πιστεύει ότι είναι θέμα χρόνου οι λήψεις που δημιουργούνται από την τεχνητή νοημοσύνη να είναι 100% κατάλληλες για τη μεγάλη οθόνη. Το πόσο θα διαρκέσει αυτός ο χρόνος δεν είναι το πιο ανησυχητικό, αλλά η συμμετοχή σε αυτή τη διαδικασία είναι πιο σημαντική, όπως ανέφερε ο Zhang Peng, Διευθύνων Σύμβουλος της Zhipu AI, σε προηγούμενη συνέντευξη στην APPSO:

Πολλά πράγματα πρέπει να διερευνηθούν το ένα μετά το άλλο, και αυτή η διαδικασία είναι πολύ σημαντική. Μην βλέπουμε μόνο τα τελικά αποτελέσματα, αλλά το πιο σημαντικό, νομίζω ότι αυτό είναι που πρέπει να προσέξουμε όλοι αυτή τη στιγμή.

Συγγραφέας: Li Chaofan, Mo Chongyu