νέα

Ποιος μπορεί να ξεπεράσει τον Sora όσον αφορά την πρακτική εμπειρία στην ανάπτυξη εγχώριων μοντέλων βίντεο τεχνητής νοημοσύνης;

2024-08-10

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

Εξώφυλλο δημοσιογράφος Xiong Yingying
Στις αρχές του τρέχοντος έτους, η αμερικανική εταιρεία OpenAI κυκλοφόρησε το μοντέλο γενιάς βίντεο με τεχνητή νοημοσύνη Sora, το οποίο ήταν σαν βροντή στο έδαφος, φέρνοντας νέες δυνατότητες σε εφαρμογές τεχνητής νοημοσύνης. Εκείνη την εποχή, πολλοί χρήστες του Διαδικτύου θρηνούσαν ότι το χάσμα μεταξύ μας και της ξένης τεχνολογίας τεχνητής νοημοσύνης γινόταν όλο και μεγαλύτερο.
Ωστόσο, μέσα σε μόλις μισό χρόνο, "εγχώρια Sora" όπως τα Keling, PixVerse V2, Qingying και Vidu έχουν κυκλοφορήσει το ένα μετά το άλλο και είναι ανοιχτά στους χρήστες δωρεάν.
Ποιο εγχώριο μοντέλο βίντεο είναι το καλύτερο; Ενώ η τεχνολογία συνεχίζει να κάνει καινοτομίες, ποιος μπορεί να πρωτοστατήσει στην εμπορευματοποίηση;
Μέσα σε αυτόν τον μήνα θα κυκλοφορήσουν 4 προϊόντα «εγχώριας Sora».
Η πραγματική εμπειρία δοκιμής του δημοσιογράφου
Ενώ ο πόλεμος τιμών μεταξύ μεγάλων εγχώριων κατασκευαστών και μεγάλων μοντέλων είναι σκληρός, ορισμένες εταιρείες επικεντρώνονται στον τομέα της δημιουργίας βίντεο AI και κάνουν μυστικές προσπάθειες. Σύμφωνα με ελλιπή στατιστικά στοιχεία, μέχρι στιγμής, υπάρχουν περισσότερα από 10 εγχώρια μοντέλα βίντεο τεχνητής νοημοσύνης, μόνο τον Ιούλιο του τρέχοντος έτους, κυκλοφόρησαν στο διαδίκτυο 4 «οικιακά Sora».
Στις 6 Ιουλίου, κυκλοφόρησε επίσημα η ιστοσελίδα Kuaishou Keling AI, παρέχοντας λειτουργίες βίντεο Wensheng και Tusheng, οι οποίες μπορούν να δημιουργήσουν βίντεο έως και 10 δευτερολέπτων.
Στις 24 Ιουλίου, η Aishi Technology κυκλοφόρησε επίσημα το PixVerse V2, το οποίο θα είναι ανοιχτό στον κόσμο ταυτόχρονα. Αυτό το μοντέλο μπορεί να δημιουργήσει πολλά βίντεο κλιπ ταυτόχρονα και μπορεί να επιτύχει παραγωγή βίντεο 8 δευτερολέπτων για ένα μόνο κλιπ και 40 δευτερολέπτων για πολλά κλιπ.
Στη συνέχεια, το Qingying, που δημιουργήθηκε από την Zhipu AI Company, και το Vidu, που αναπτύχθηκε ανεξάρτητα από την Shengshu Technology, κυκλοφόρησαν επίσης το ένα μετά το άλλο. Μεταξύ αυτών, το Qingying εστιάζει στην ταχεία παραγωγή εντός 30 δευτερολέπτων, το Vidu προσθέτει τη δημιουργία βίντεο κλιπ σε στυλ κινουμένων σχεδίων, εκτός από το κοινό ρεαλιστικό στυλ.
Τα μοντέλα παραγωγής βίντεο μεγάλης κλίμακας των παραπάνω τεσσάρων εταιρειών είναι επί του παρόντος ανοιχτά για δοκιμή Μετά από γρήγορη εγγραφή μέσω τηλεφώνου, email κ.λπ., οι δημοσιογράφοι είχαν επίσης πραγματική εμπειρία.
Προκειμένου να δοκιμάσει τη λειτουργία "Βίντεο εικόνας", ο ρεπόρτερ ανέβασε την ίδια εικόνα ενός τριαντάφυλλου που δεν έχει ανθίσει ακόμη σε τέσσερις μεγάλες ιστοσελίδες μοντέλων και εισήγαγε τη λέξη "άνθιση λουλουδιών". βίντεο με λουλούδια που ανθίζουν. Στο βίντεο που δημιούργησαν οι PixVerse και Keling, μπορείτε να δείτε τα λουλούδια να αιωρούνται, αλλά δεν υπάρχει δυναμική επίδραση του "ανθίσματος". Αλλά όταν ο ρεπόρτερ άλλαξε την προτρεπόμενη λέξη σε "ένα λουλούδι που ανθίζει αργά", ο Keling δημιούργησε επίσης με επιτυχία ένα βίντεο με ένα τριαντάφυλλο να ανθίζει. Μπορεί να φανεί ότι διαφορετικά μεγάλα μοντέλα έχουν διαφορές στην ικανότητά τους να επεξεργάζονται και να κατανοούν τη γλώσσα.
Στιγμιότυπα οθόνης βίντεο που δημιουργούνται από τέσσερα εγχώρια μεγάλα μοντέλα
Κρίνοντας από την ταχύτητα δημιουργίας βίντεο, το Vidu πήρε τον ταχύτερο χρόνο, δημιουργώντας ένα βίντεο 3 δευτερολέπτων σε λιγότερο από 1 λεπτό. Τα άλλα τρία μεγάλα μοντέλα ολοκλήρωσαν όλα τη δημιουργία βίντεο μέσα σε 5 λεπτά. Παρόλο που το Qingying διαφημίζει "γρήγορη παραγωγή σε 30 δευτερόλεπτα", ίσως επειδή υπάρχουν πάρα πολλοί άνθρωποι που το δοκιμάζουν, η σελίδα γενιάς δείχνει "αναμένεται ουρά για 3 λεπτά".
Κρίνοντας από τα σχόλια της εμπειρίας από χρήστες του Διαδικτύου στις πλατφόρμες κοινωνικής δικτύωσης, όλα τα μεγάλα μοντέλα έχουν περισσότερο ή λιγότερα προβλήματα, όπως παραμόρφωση χαρακτήρων και ελλείψεις εικόνων.
«Υπάρχουν πολλοί που περιμένουν και βλέπουν, αλλά λίγοι αναλαμβάνουν δράση».
Οι επενδύσεις στον τομέα των μεγάλων μοντέλων τείνουν να είναι επιφυλακτικές
Όταν γεννήθηκε ο Sora στις αρχές του έτους, υπήρχαν ακόμα απαισιόδοξες φωνές στο Διαδίκτυο, που πίστευαν ότι η Κίνα ήταν πολύ πίσω από τις Ηνωμένες Πολιτείες στον τομέα της τεχνητής νοημοσύνης. Μόλις μισό χρόνο αργότερα, μια σειρά από μεγάλα μοντέλα βίντεο AI που συγκρίνουν το Sora εμφανίστηκαν στην Κίνα.
Η Tianyancha δείχνει ότι η Zhipu AI, που ιδρύθηκε το 2019, έχει ολοκληρώσει τη χρηματοδότηση της Series C και επί του παρόντος αποτιμάται σε περισσότερα από 10 δισεκατομμύρια. Αν και η Aishi Technology και η Shengshu Technology ιδρύθηκαν μόλις το 2023, έχουν ολοκληρώσει τρεις και τέσσερις γύρους χρηματοδότησης αντίστοιχα. Σημαίνει αυτό ότι ο επενδυτικός κύκλος εξακολουθεί να είναι πολύ ενθουσιώδης με την επένδυση σε μεγάλες πίστες αγώνων μοντέλων;
«Βασικά, εξακολουθούμε να βλέπουμε περισσότερα και να επενδύουμε πολύ λίγα, ο Guo Tao, ένας επενδυτής άγγελος και ειδικός στον τομέα της τεχνητής νοημοσύνης, είπε ότι επί του παρόντος, οι μεγαλύτεροι επενδυτές είναι αρκετές μεγάλες εταιρείες του Διαδικτύου, οι οποίες έχουν επενδύσει εκτενώς σε πολλά μεγάλα μοντέλα». έργα. Αφενός, οι μεγάλοι κατασκευαστές μπορούν να βρουν κάποια σενάρια εφαρμογής για μεγάλα μοντέλα βίντεο στις υπάρχουσες επιχειρήσεις τους, αφετέρου, εάν αυτά τα μεγάλα μοντέλα έχουν κάποιο βαθμό επικάλυψης με την επιχείρηση της εταιρείας, μπορούν να χρησιμοποιηθούν ως συμπλήρωμα. η σειρά προϊόντων μπορούν επίσης Μέσω των υπαρχόντων οικολογικών πόρων, αυτές οι μεγάλες εταιρείες μοντέλων να εξουσιοδοτηθούν σε κάποιο βαθμό.
Η εταιρεία Zhipu AI έχει συγκεντρώσει πάνω από 100 εκατομμύρια γιουάν σε πολλούς γύρους χρηματοδότησης
Συνολικά, τα εγχώρια επενδυτικά ιδρύματα εξακολουθούν να διατηρούν μια συντηρητική και προσεκτική στάση απέναντι σε μεγάλα μοντέλα όπως το Vincent Video και το Tush Video. Ο κύριος λόγος πίσω από αυτό είναι ότι η εμπορευματοποίησή τους αντιμετωπίζει πολλές προκλήσεις.
Κατά την άποψη του Guo Tao, είτε πρόκειται για Sora είτε για μεγάλο εγχώριο μοντέλο, τα βίντεο που δημιουργούνται εξακολουθούν να έχουν ορισμένα ελαττώματα. Για παράδειγμα, οι χαρακτήρες που δημιουργούνται από την τεχνητή νοημοσύνη έχουν μερικές φορές ένα επιπλέον δάχτυλο, δεν μπορούν να χτυπήσουν το καλάθι κατά τη λήψη κ.λπ. Αυτό δείχνει ότι το μεγάλο μοντέλο δεν κατανοεί επαρκώς τη χωρική σχέση μεταξύ των αντικειμένων και το μοντέλο αλγορίθμου πρέπει επίσης να βελτιωθεί περαιτέρω.
Εκτός από τα τεχνικά ζητήματα που πρέπει ακόμη να ξεπεραστούν, ο μεγαλύτερος πόνος στην εμπορευματοποίηση μεγάλων μοντέλων βίντεο τεχνητής νοημοσύνης είναι η έλλειψη ώριμων σεναρίων εφαρμογών.
"Για παράδειγμα, το ίδιο το Kuaishou έχει μια πλατφόρμα και περιεχόμενο και, σχετικά, έχει ορισμένα σενάρια εφαρμογής. Πολλές εταιρείες αυτοδιαδικτύου μπορεί να το χρησιμοποιήσουν, αλλά για ορισμένες καθαρά τεχνικές εταιρείες, είναι ακόμα δύσκολο να τα βρουν." Ένα ιδιαίτερα καλό και άκαμπτο σενάριο ζήτησης όπου οι χρήστες είναι πρόθυμοι να πληρώσουν.
Η πλατφόρμα επιταχύνει την εξερεύνηση εμπορευματοποίησης
Η αγορά μικρού μήκους δράματος αναμένεται να πάρει το προβάδισμα στην προσγείωση
Παρόλο που υπάρχουν προκλήσεις στην εμπορευματοποίηση, μεγάλες πλατφόρμες μοντέλων στο εσωτερικό και στο εξωτερικό διερευνούν ενεργά και προσπαθούν να εμπορευματοποιήσουν.
Ο δημοσιογράφος παρατήρησε ότι επί του παρόντος, μεγάλα εγχώρια μοντέλα βίντεο τεχνητής νοημοσύνης έχουν αρχίσει να πληρώνουν και από την πλευρά των καταναλωτών. Στις 24 Ιουλίου, η επίσημη ανάρτηση του Keling AI στο WeChat αποκάλυψε ότι ο αριθμός των χρηστών που έχουν υποβάλει αίτηση για άδειες έχει ξεπεράσει το 1 εκατομμύριο. Η ετήσια τιμή συνδρομής κυμαίνεται από περισσότερα από 500 γιουάν έως κυμαίνεται από περισσότερα από 5.000 γιουάν.
Το PixVerse υιοθετεί ένα μοντέλο πληρωμής συνδρομής, που περιλαμβάνει βασική έκδοση, τυπική έκδοση και απεριόριστη έκδοση, με τιμές μονάδας που κυμαίνονται από 5 γιουάν έως 60 γιουάν.
Ωστόσο, πολλοί γνώστες του κλάδου είπαν ότι επί του παρόντος, τα μεγάλα μοντέλα τεχνητής νοημοσύνης έχουν πολύ υψηλό κόστος υπολογιστικής ισχύος και ότι οι συνήθειες πληρωμής των χρηστών δεν έχουν ακόμη διαμορφωθεί και ο ανταγωνισμός στην αγορά είναι εξαιρετικά έντονος για πληρωμή από την πλευρά Γ.
Σύμφωνα με δημοσιεύματα των μέσων ενημέρωσης, τον Ιούνιο του τρέχοντος έτους, η παγκοσμίου φήμης μάρκα παιδικών παιχνιδιών "Toys R Us" συνεργάστηκε με την OpenAI για να χρησιμοποιήσει την εμπορική ταινία διάρκειας 1 λεπτού "The Origin of Toys R Us" σε παραγωγή της Sora Δημιουργήστε εφικτές εμπορικές διαφημίσεις.
Τον Ιούλιο, το πρώτο εγχώριο δράμα μικρού μήκους φαντασίας "Mountains and Seas Strange Mirror: Breaking the Waves" κυκλοφόρησε επίσημα. Το δράμα έχει 5 επεισόδια και διάρκεια 15 λεπτών στο δράμα , το φανταστικό Kunpeng και το παράξενο τέρας κ.λπ., είναι όλα Generated by AI.
Καθώς όλο και περισσότερες εταιρείες παραγωγής και πλατφόρμες αρχίζουν να εξερευνούν την πορεία ολοκλήρωσης του "AI + micro-short drama", τα μεγάλα μοντέλα βίντεο AI μπορεί να είναι τα πρώτα που θα διατεθούν στο εμπόριο στην αγορά μικρού μήκους δράματος.
Αναφορά/Σχόλια