Νέα

Το "Keling" του Kuaishou έγινε απροσδόκητα δημοφιλές, ο Byte ήταν πρόθυμος να προλάβει και ο ανταγωνισμός στο κομμάτι βίντεο AI ​​Wensheng εντάθηκε

2024-07-31

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina



Τον Φεβρουάριο του 2024, η εμφάνιση του Sora εμπόδισε πολλές μεγάλες εταιρείες μοντέλων να έχουν ένα καλό Φεστιβάλ Άνοιξης.

«Το Γκαλά του Ανοιξιάτικου Φεστιβάλ συνεχίζει να παίζεται, γι' αυτό οργανώνουμε επειγόντως ομαδικές συζητήσεις», είπε με ανυπομονησία ένας υπάλληλος μιας κορυφαίας εταιρείας τεχνητής νοημοσύνης στο «City Circle». Βλέποντας τη μεταξένια-ομαλή εμπειρία της Sora, ακόμη και οι μπλόγκερ που πωλούν μαθήματα σπεύδουν να ξεκινήσουν διαδικτυακά σεμινάρια και να κερδίσουν πολλά χρήματα.

Ποιος μπορεί να «αντιγράψει» την εγχώρια έκδοση του Sora στον πιο γρήγορο χρόνο. Κανείς όμως δεν πίστευε ότι ο νικητής θα ήταν ένας γρήγορος παίκτης με σχετικά «Βούδα» τεχνικές επιδόσεις.

Στις 7 Ιουνίου, ο Kuaishou παρουσίασε ξαφνικά το μοντέλο βίντεο Wensheng "Kling", το οποίο μπορεί να υποστηρίξει τη δημιουργία βίντεο έως και 2 λεπτών. Επιπλέον, σε σύγκριση με το Sora, το οποίο βρίσκεται ακόμα στο στάδιο των «μελλοντικών», το Keling άνοιξε για δοκιμή αμέσως μόλις ανακοινώθηκε και τα αποτελέσματα που προέκυψαν είναι επίσης αξιοσημείωτα.

«Το Keling είναι το θέμα που έχει συζητηθεί περισσότερο στον κλάδο πρόσφατα», δήλωσε στο City Circle ένα άτομο από τη βιομηχανία επιχειρηματικών κεφαλαίων. Σύμφωνα με επίσημα στοιχεία, περισσότερα από 500.000 άτομα υπέβαλαν αίτηση για το Keling μέσα σε ένα μήνα από την κυκλοφορία του. Έχει ανοίξει σε περισσότερους από 300.000 χρήστες και έχει δημιουργήσει περισσότερα από 7 εκατομμύρια σύντομα βίντεο.

Η απροσδόκητη δημοτικότητα του Ke Ling έκανε αναπόφευκτα τον Byte να ντροπιαστεί. Τον Μάιο του τρέχοντος έτους, η Byte άνοιξε επίσης τη δοκιμή μοντέλου Wensheng Video "Jimeng", αλλά το αποτέλεσμα δεν είναι ακόμη εμφανές στο δημοφιλές κομμάτι Wensheng Video.

Ξαφνικά πετάχτηκε από έναν αντίπαλο που είχε «αγνοηθεί», ο Byte χρειάστηκε να προλάβει. Σύμφωνα με το TMTPost, η ByteDance έθεσε πρόσφατα το μεγάλο μοντέλο AI ως την κατεύθυνση «P0 υψηλότερου επιπέδου» της ομάδας. Πολλές ομάδες όπως οι Douyin και Jianying εργάζονται επίσης σκληρά για την ανάπτυξη εφαρμογών μοντέλων βίντεο AI, οι οποίες αναμένεται να ανακοινωθούν στο εγγύς μέλλον.

1. Μπορεί να γίνει γρήγορα, τραχιά και άγρια.

Πολλοί προγραμματιστές είπαν στο «City» ότι η κυκλοφορία και η εξαιρετική απόδοση του Keling αποτελούν έκπληξη στον κλάδο.

Πρόσφατα, το "City Boundary" χρησιμοποίησε μια παράγραφο "μαύρη γάτα" ως λέξη-κλειδί και εισήγαγε την ίδια προτροπή στα Keling, Jimeng και "Qingying" που μόλις είχε ξεκινήσει από τον Zhipu AI: "Οι δρόμοι της πόλης μια βροχερή μέρα είναι άδειοι Ένα άτομο, μια χαριτωμένη μαύρη γάτα, έχει πράσινα μάτια, ένα κίτρινο γιακά και ένα κουδούνι στο λαιμό της, και μακριά μαύρα μαλλιά στο σώμα της Το έδαφος το αντικατοπτρίζει η φιγούρα της μαύρης γάτας.»

Μεταξύ των τριών βίντεο που δημιουργήθηκαν, αν και η έκδοση Keling απέτυχε να επιτύχει το αποτέλεσμα της γρήγορης λειτουργίας, τα βίντεο γενικά συμμορφώνονταν με τους αντικειμενικούς κανόνες.

Αντίθετα, στην έκδοση «Jimeng» δεν υπήρχε νερό στο έδαφος και η μαύρη γάτα δεν προχώρησε. Αν και η έκδοση "Qingying" έχει συσσώρευση νερού, η μαύρη γάτα έχει ένα περίεργο βάδισμα όταν περπατά και η ουρά χάνει επίσης τα πλαίσια.

▲ (Τα βίντεο δημιουργούνται από τους Ke Ling, Ji Meng και Qing Ying με τη σειρά)

Σύμφωνα με το "Silicon Star", ο Keling χρειάστηκε τρεις μήνες για να φτιάξει την ομάδα, με μόνο περισσότερα από 20 άτομα. Οι κατευθύνσεις περιλαμβάνουν επεξεργασία σήματος εικόνας/βίντεο, υπολογιστική φωτογραφία και όραση υπολογιστή, μείωση λειτουργιών απώλειας, δημιουργία όρασης κ.λπ.

Ο προκάτοχος του Keling προέρχεται από ένα δυσδιάκριτο έργο "Puji" που επανεκκίνησε ο Kuaishou τον Οκτώβριο του 2023. Αυτό είναι ένα λογισμικό εργαλείο που χρησιμοποιεί AI για τη δημιουργία emoticons 2s Gif από στατικές εικόνες. Στις αρχές Μαρτίου του τρέχοντος έτους, ο Kuaishou πραγματοποίησε μια μικρή εσωτερική συνάντηση, η ιδέα του Wan Pengfei επιβεβαιώθηκε από τον Gai Kun (Yu Yue), τον ανώτερο αντιπρόεδρο του Kuaishou, και ο Puchi αποφάσισε γρήγορα να αποτελέσει προϊόν για προανάκριση.

Σύμφωνα με το "Silicon Star People", "Όταν κάνεις Keling, υπάρχει συναίνεση σε επίπεδο εκτέλεσης ότι είναι γρήγορο, τραχύ και άγριο."

Λιγότερο από ένα μήνα μετά την έναρξη του έργου Keling, έλαβε υποστήριξη από τον ιδρυτή της Kuaishou, Cheng Yixiao, ο οποίος το θεώρησε ως στρατηγικό έργο για την εταιρεία. Ο Gai Kun λέει επίσης συχνά: Οι κάρτες της εταιρείας είναι όλες για να τις χρησιμοποιήσετε και η εταιρεία το υποστηρίζει πλήρως.

Ο Ke Ran, ένας επιχειρηματίας στο ψηφιακό ανθρώπινο κομμάτι, ανέλυσε το "City": "Η επιτυχία του Keling οφείλεται σε μεγάλο βαθμό στο υλικό δεδομένων βίντεο που έχει συσσωρεύσει ο Kuaishou. Κοιτάζοντας τη χώρα, ο μόνος που μπορεί να την ανταγωνιστεί σε αυτήν την πτυχή είναι ο ήχος Douishu ."

Αλλά ενώ το τοπίο είναι όμορφο, το Byte φαίνεται λίγο μοναχικό.

Αν και το "Jimeng" ανακοινώθηκε επίσημα στις 9 Μαΐου, στις 17 Ιουνίου, ο Jimeng εμφανίστηκε επίσης ως ο επικεφαλής τεχνικός υποστηρικτής της τεχνητής νοημοσύνης στη σύντομη σειρά του AIGC "Sanxingdui: Future Apocalypse". Ωστόσο, είτε πρόκειται για την απόδοσή του στην C-side είτε σε σύγκριση με το σύντομο δράμα AIGC του Kuaishou «Mountains and Seas», το οποίο κυκλοφόρησε στις 13 Ιουλίου, η φωνή του Ji Meng δεν είναι πολύ δυνατή.

Στις 17 Ιουλίου, υπήρχαν νέα στην αγορά ότι η Byte θα ανακοινώσει την πρόοδο της τεχνολογίας βίντεο Vincent τύπου Sora. Ο εξωτερικός κόσμος το ερμηνεύει επίσης ως ότι το Byte πρόκειται να φτάσει και να ανταγωνιστεί μετωπικά τον Keling.

Ωστόσο, ο Byte δήλωσε αργότερα στο «City Circle» ότι η είδηση ​​δεν ήταν ακριβής. Στις 17 Ιουλίου, το "City Circle" παρατήρησε ότι η εκδήλωση έμοιαζε περισσότερο με μια συνεδρία ανταλλαγής τεχνολογίας. Η συνάντηση φιλοξενήθηκε κυρίως από τον Feng Jiashi, τον αρχηγό της ομάδας βασικής οπτικής έρευνας του Doubao large model, και όλη η συνεδρία μοιράστηκε από ερευνητές Byte, θεσμικούς μελετητές κ.λπ. στα αγγλικά.

Φαίνεται ότι η «μεγάλη κίνηση» του Byte μπορεί να χρειαστεί να περιμένει ακόμα για λίγο.

2. Το Byte δεν έχει ανακτηθεί ακόμα

Λοιπόν, γιατί ο Byte έχασε τη γιορτή στο κομμάτι του Vincent Video που ήταν σε πλήρη εξέλιξη πρόσφατα;

Σε ένα βαθμό, ίσως γιατί σε σύγκριση με το Kuaishou που στοιχηματίζει στο "Ke Ling", μπορεί να "νικήσει δέκα δεξιότητες με μία προσπάθεια". Η διάταξη μοντέλων μεγάλης κλίμακας της Byte είναι πιο περίπλοκη - και κατά το πρώτο εξάμηνο του τρέχοντος έτους, οι πιο σημαντικοί αντίπαλοι της Byte είναι η Tencent και η Alibaba.

Απέναντι στα μεγάλα μοντέλα, ο ρυθμός της Byte δεν είναι πλέον «ριζοσπαστικός». Εξάλλου, ήταν η Byte που πρωτοστάτησε στην έναρξη ενός μεγάλου πολέμου τιμών μοντέλων στον κλάδο πριν από περισσότερους από 2 μήνες.

Στις 15 Μαΐου, στο «FORCE Motive Power Conference» της ByteDance, η Byte κυκλοφόρησε μια υπηρεσία API βασισμένη στο μοντέλο φασολιών που δημιούργησε η ίδια. Ταυτόχρονα, ο Tan Dai, Πρόεδρος της Volcano Engine, έκανε ένα βήμα και αποκάλυψε την πιο πρόσφατη τιμή του «Doubao»: 0,0008 γιουάν/χίλια Tokens, ανακοινώνοντας ότι αυτή ήταν η «κατώτατη τιμή» χαμηλότερη από το 99,3% του κλάδου.

Τότε η «επίθεση» του Μπάιτ είχε πάρει προβάδισμα. Σύμφωνα με "κύκλους της αγοράς" από πολλές πηγές, οι κορυφαίοι παίκτες ήταν απροετοίμαστοι για την επίθεση του Byte, αν και όλα τα μέρη ένιωθαν αβοήθητα, μπορούσαν μόνο παθητικά να ακολουθήσουν.

Τις επόμενες ημέρες, το Alibaba Cloud, το Baidu Wenxin Model και το Tencent Cloud ανακοίνωσαν διαδοχικά ότι θα μείωναν σημαντικά τις τιμές των μεγάλων διακριτικών εισόδου συμπερασμάτων μοντέλων και των API. Κάτω από αυτήν την επιρροή, οι κλήσεις από την πλευρά C για μοντέλα κεφαλών μεγάλης κλίμακας είναι πλέον σχεδόν δωρεάν και η βιομηχανία έχει αρχίσει να κινείται προς το επόμενο οικολογικό επίπεδο.

Σύμφωνα με τον ιδρυτή μιας νόμιμης εταιρείας εφαρμογών τεχνητής νοημοσύνης, δεν υπήρχε σχεδόν καμία χρονική καθυστέρηση μετά το άνοιγμα της υπηρεσίας API και το προσωπικό πωλήσεων της Volcano Engine άρχισε να επικοινωνεί ενεργά με τους πελάτες και να προωθεί προϊόντα. Αυτό επιβεβαιώνει επίσης την εικασία που κυκλοφορεί στην αγορά ότι η Byte έχει χαρακτηρίσει το μεγάλο μοντέλο ως τη στρατηγική υψηλότερου επιπέδου.



▲ (Ο Ταν Ντάι στο "Συνέδριο FOECE" του 2024. Πηγή/Ηφαιστειακή μηχανή)

Πρόσφατα, οι σακούλες φασολιών «κορυφαίων προϊόντων» της Byte έχουν αυξηθεί σημαντικά.

Σύμφωνα με τα στοιχεία της Questmobile, από τον Ιούνιο του 2024, μεταξύ των εγχώριων εφαρμογών AIGC, οι Doubao, Tiangong, Kimi Smart Assistant και Cat Box σημείωσαν εντυπωσιακή ανάπτυξη—με το Doubao να κατατάσσεται πρώτη στην επισκεψιμότητα.



▲(Πηγή φωτογραφίας/QuestMobile)

Σε σύγκριση με τον Kuaishou, αυτό που ανησυχεί περισσότερο η Byte τώρα μπορεί να είναι ο πλήρης οικολογικός ανταγωνισμός από τα βασικά μεγάλα μοντέλα μέχρι το επίπεδο εφαρμογής AI. Επιπλέον, λαμβάνοντας υπόψη ότι το Volcano Engine θα γίνει επίσημα σύννεφο μόλις το 2021, είναι το «νεότερο» μεταξύ των γιγαντιαίων πωλητών cloud. Για περισσότερα από τρία χρόνια, το Huoshan Cloud θεωρείται ως αμφισβητίας στην αγορά cloud. Ο τρόπος συνεργασίας του Byte με το βασικό μεγάλο μοντέλο, το επίπεδο εφαρμογής και την αγορά cloud είναι μια ολοκληρωμένη πρόταση.

Πρόσφατα, το «Photon Planet» ανέφερε ότι μεγάλος αριθμός χρηστών της πλατφόρμας «Kouzi» της Byte αναζητούν τρόπους να συνδέσουν τους δημιουργούς τους πράκτορες και bots με επίσημους λογαριασμούς ή μίνι προγράμματα του WeChat και οι συζητήσεις είναι πολύ ενεργές.

Τον Δεκέμβριο του περασμένου έτους, η Byte ξεκίνησε την πλατφόρμα ανάπτυξης εφαρμογών AI "coze" στο εξωτερικό. Τον Φεβρουάριο του τρέχοντος έτους, η εγχώρια έκδοση του "Button" κυκλοφόρησε διαδικτυακά. Ένας μεγάλος αριθμός εμπόρων Douyin ελπίζουν επίσης να φτιάξουν γρήγορα ένα δοχείο χρυσού από αυτό.

Λαμβάνοντας υπόψη ότι η Tencent κυκλοφόρησε καθυστερημένα την πλατφόρμα δημιουργίας και διανομής πρακτόρων AI "Tencent Yuanqi" τον Μάιο του τρέχοντος έτους. Εκείνη την εποχή, ο αριθμός των επισκέψεων στο Button είχε φτάσει τις 2,33 εκατομμύρια φορές. Προς το παρόν, η Tencent Yuanqi δεν έχει ακόμη ανοίξει το οικοσύστημα της σειράς WeChat με μίνι προγράμματα, επίσημους λογαριασμούς και συνδρομητικούς λογαριασμούς εξυπηρέτησης πελατών.

Εξάλλου, η ανάπτυξη της τεχνητής νοημοσύνης βρίσκεται ακόμα στα αρχικά της στάδια. Το Byte, όπως και η Tencent, χρειάζεται ακόμα να αφιερώσει πολύ χρόνο στην εκπαίδευση των χρηστών. Ο ανταγωνισμός για τα δικαιώματα διανομής στην εποχή της AI και η απόκτηση πρωτοπορίας μπορεί να είναι ένα μεγαλύτερο μάθημα που πρέπει να κάνει η Byte για να στοχεύσει την Tencent.

3. Χτυπήστε αργότερα, υπάρχει ακόμη χρόνος

Σε επίπεδο βιομηχανίας, στο σημερινό Διαδίκτυο, δεν υπάρχει έλλειψη επισκεψιμότητας περιεχομένου, επισκεψιμότητας ηλεκτρονικού εμπορίου και byte οικονομικών πυρομαχικών, ακόμα κι αν είναι "ένα βήμα πίσω" στο Vincent Video βραχυπρόθεσμα, μακροπρόθεσμα. έχει ακόμα τη δυνατότητα να καλύψει τη διαφορά.

Η χρήση ενεργών στρατηγικών αγοράς για να καλύψει τις καθυστερημένες θέσεις και να επιτύχει δυναμικά θαύματα είναι επίσης η ειδικότητα της Byte.

Πρόσφατα, στοχεύοντας την Alibaba, η Byte εργάζεται επίσης για την ενσωμάτωση μεγάλων μοντέλων. Στο συνέδριο DingTalk Ecosystem Conference που μόλις πέρασε στις 26 Ιουνίου, ο Πρόεδρος Ye Jun ανακοίνωσε ότι εκτός από το Tongyi της Alibaba, μεγάλα μοντέλα τρίτων από τις άλλες έξι εταιρείες θα συμπεριληφθούν επίσης στο DingTalk. Αυτά περιλαμβάνουν το MiniMax, το Dark Side of the Moon, το Zhipu AI, το Orion Star, το Zero One Thing και το Baichuan Intelligence, που καλύπτουν σχεδόν όλες τις γνωστές startups μεγάλης κλίμακας στην Κίνα Είναι αυτονόητο να «χτίσουμε το πιο ανοιχτό οικοσύστημα AI της Κίνας ".

Παρόμοια με το gameplay του DingTalk, εκτός από την υποστήριξη του δικού της "Doubao", η πλατφόρμα Kouzi της Byte έχει επίσης πρόσβαση σε μεγάλα εξωτερικά μοντέλα όπως το Tongyi Qianwen, το Dark Side of the Moon και το MiniMax. Στις 14 Ιουνίου, η Kouzi κυκλοφόρησε επίσης τη λειτουργία «Model Square», η οποία επιτρέπει στους χρήστες να επιλέξουν δύο ανώνυμα μοντέλα και να τα βαθμολογήσουν με βάση την απόδοση του παραγόμενου περιεχομένου.



Επιπλέον, η Byte εκτέθηκε πρόσφατα και η εξερεύνηση του «AI + hardware» επιταχύνεται και δεν διστάζει να στρατολογήσει ταλέντα μέσω εξαγορών.

Σύμφωνα με το "Tech Planet", η PICO, θυγατρική της Byte, έχει αναπτύξει πολλές φορητές συσκευές από το δεύτερο εξάμηνο του περασμένου έτους, συμπεριλαμβανομένων ακουστικών και ηχείων, και αυτές οι συσκευές θα είναι επίσης εξοπλισμένες με AI. Η ομάδα του Byte Doubao διερεύνησε επίσης τον συνδυασμό λογισμικού και υλικού μοντέλων μεγάλης κλίμακας Ο συνδυασμός λογισμικού και υλικού μοντέλων μεγάλης κλίμακας εφαρμόστηκε σταδιακά σε συσκευές υλικού, όπως μηχανές εκμάθησης, σκυλιά ρομπότ και ρομπότ.

Σύμφωνα με άλλη αναφορά από το 36Kr, ο υπεύθυνος της «γραμμής D» του υλικού Byte AI είναι ο Li Haoqian. Ο τελευταίος είναι ο ιδρυτής της Oladance, της επωνυμίας ακουστικών OWS (Open Wearable Stereo) που εξαγοράστηκε από την Byte τον Μάρτιο του τρέχοντος έτους. Ο υπεύθυνος της «O Line», μιας άλλης γραμμής υλικού AI, είναι επίσης ο ιδρυτής της εταιρείας που εξαγοράστηκε από την Byte.

Στην κατεύθυνση του Vincent Video, αντιμετωπίζοντας την πρόσφατη δημοτικότητα του κομματιού, οι διώκτες, συμπεριλαμβανομένου του Byte, έχουν ακόμα χρόνο.

Πρόσφατα, ένας προγραμματιστής είπε στο "City World": "Προς το παρόν, χρησιμοποιώ το Keling για τη σύνθεση εικόνων και τη μείωση του φόρτου εργασίας της ροής εργασίας. Δεν το χρησιμοποιώ ακόμη πλήρως για τη δημιουργία, επομένως δεν έχω ακόμη μεγάλη εξάρτηση από αυτό."

Στα μάτια ενός άλλου προγραμματιστή και σύντομου βίντεο blogger AIGC, ο Keling έχει ακόμα πολλά περιθώρια βελτιστοποίησης: "Το να βασίζεσαι στο Keling Wensheng Video δεν μπορεί να εγγυηθεί τη συνέπεια της εικονικής ανθρώπινης IP. Συνήθως χρησιμοποιώ το Kelingtu για την παραγωγή βίντεο. Η λειτουργία είναι ισοδύναμη να δώσει στον Ke Ling μια εικόνα, επιτρέποντάς του να δημιουργήσει δυναμικά βίντεο από διαφορετικές οπτικές γωνίες και στη συνέχεια να τα ενώσει για να προσομοιώσει το αποτέλεσμα της κίνησης της κάμερας.

Ένα μέλος της ομάδας Έρευνας και Ανάπτυξης ενός εγχώριου προϊόντος γνωριμιών προσομοίωσης τεχνητής νοημοσύνης είπε: "Στην τρέχουσα αγορά εφαρμογών μοντέλων μεγάλης κλίμακας, όλοι διασχίζουν το ποτάμι νιώθοντας τις πέτρες. Πώς να το εμπορευματοποιήσετε είναι ένα ερώτημα που είναι πολύ μακριά και επίσης ασαφές, όμως, το σίγουρο είναι ότι όσο περισσότεροι άνθρωποι το χρησιμοποιούν και το παίζουν, τόσο περισσότερο μπορεί να διασφαλίσει τη βελτιστοποίηση και την επανάληψη του προϊόντος.

(Το Ke Ran είναι ψευδώνυμο)

Συγγραφέας | Dong Wenshu

Επεξεργασία | Λι Γιουάν

Λειτουργίες | Λιου Σαν