νέα

επίθεση beanbao, η έκδοση byte του sora είναι "καθυστέρηση αλλά έφτασε" πρόεδρος volcano engine tan dai: αρχίστε να εξετάζετε το ενδεχόμενο εμπορευματοποίησης αμέσως μόλις κυκλοφορήσει

2024-09-26

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

«η πορεία ανάπτυξης του μεγάλου μοντέλου της byte είναι να πάει πρώτα στο c για να γυαλίσει το προϊόν και μετά να πάει στο b για να επεκτείνει την αγορά αφού οι δυνατότητες του μοντέλου αποκτήσουν ανταγωνιστικό πλεονέκτημα, στις 25 σεπτεμβρίου, ο tan daizai, πρόεδρος της volcano engine. δέχτηκε μια συνέντευξη με την "daily economic news" είπε κατά τη διάρκεια μιας ομαδικής συνέντευξης στα μέσα ενημέρωσης, συμπεριλαμβανομένων των δημοσιογράφων.

με βάση αυτήν την αναπτυξιακή πορεία, μετά την εφαρμογή μιας πρώιμης έκδοσης στην πλατφόρμα δημιουργίας τεχνητής νοημοσύνης "ji meng" που αναπτύχθηκε από την ομάδα επεξεργασίας τον μάιο του τρέχοντος έτους, το μοντέλο παραγωγής βίντεο bean bag αποκαλύφθηκε επίσημα στο 2024 volcano engine ai innovation tour στις 24 σεπτεμβρίου, και έχει ως στόχο η αγορά των επιχειρήσεων είναι ανοιχτή για beta testing.

από τότε που η sora ξεκίνησε την «εποχή του βίντεο chatgpt», οι εγχώριοι παίκτες μεγάλων μοντέλων όπως οι kuaishou, zhipu ai, minimax και alibaba έχουν κυκλοφορήσει διαδοχικά παρόμοια προϊόντα τώρα που το bytedance μπήκε στο παιχνίδι, μπορεί να αλλάξει το υπάρχον ανταγωνιστικό τοπίο των μεγάλων μοντέλων βίντεο ?

μέσω της επίδειξης των αποτελεσμάτων των δύο μοντέλων παραγωγής βίντεο στη συνέντευξη τύπου, ο tan dai πιστεύει ότι είτε πρόκειται για ικανότητα σημασιολογικής κατανόησης, περίπλοκες διαδραστικές εικόνες πολλαπλών κινήσεων θέματος ή συνέπεια περιεχομένου της εναλλαγής πολλαπλών φακών, η μεγάλη γενιά βίντεο doubao μοντέλο έχει φτάσει σε κορυφαίο επίπεδο στον κλάδο.

ταυτόχρονα, το "music generation model" και το "simultaneous interpretation model" κυκλοφόρησαν στο συνέδριο, επεκτείνοντας περαιτέρω την περιοχή byte ai.

ως ο πρώτος παίκτης στον κλάδο που μείωσε την τιμή των μεγάλων μοντέλων, η volcano engine έχει επιταχύνει σημαντικά την εμπορευματοποίησή της. ο ταν ντάι είπε στον δημοσιογράφο της «daily economic news» ότι ο αριθμός των κλήσεων προς τον β αυξάνεται ραγδαία. "δεν είμαι τόσο ξεκάθαρος για την επιχείρηση προς c, αλλά αισθάνομαι ότι πηγαίνει πολύ ομαλά. νομίζω ότι η τεχνητή νοημοσύνη μπορεί να λύσει προβλήματα από άκρο σε άκρο και τα όρια μεταξύ των επιχειρήσεων β και γ δεν είναι τόσο προφανή."

ένας δημοσιογράφος της «daily economic news» έμαθε από τη συνέντευξη τύπου ότι από τον σεπτέμβριο του τρέχοντος έτους, η μέση ημερήσια χρήση των tokens στο μοντέλο doubao έχει ξεπεράσει τα 1,3 τρισεκατομμύρια, παράγονται κατά μέσο όρο 50 εκατομμύρια φωτογραφίες κάθε μέρα και ο μέσος όρος η ημερήσια επεξεργασία φωνής είναι 850.000 ώρες.

το byte εισέρχεται σε βίντεο τεχνητής νοημοσύνης, "αρχίζει να εξετάζει το ενδεχόμενο εμπορευματοποίησης μόλις προσγειωθεί"

στις 31 αυγούστου, το minimax, ένας από τους "έξι μικρούς δράκους της τεχνητής νοημοσύνης", κυκλοφόρησε το μοντέλο της γενιάς βίντεο-1 στις 19 σεπτεμβρίου, η keling ai ολοκλήρωσε την 9η επανάληψη του και κυκλοφόρησε το "keling 1.5 model". yunqi στο συνέδριο, το alibaba cloud παρουσίασε ένα νέο μοντέλο παραγωγής βίντεο σε λιγότερο από ένα μήνα, το ήδη ταραχώδες πεδίο μοντέλων παραγωγής βίντεο καλωσόρισε έναν νέο παίκτη.

στο volcano engine ai innovation tour στις 24 σεπτεμβρίου, κυκλοφόρησαν μαζί δύο μεγάλα μοντέλα doubao video generation-pixeldance και doubao video generation-seaweed.

ο δημοσιογράφος της "daily economic news" παρατήρησε ότι η μέγιστη διάρκεια παραγωγής περιεχομένου βίντεο που υποστηρίζεται από αυτά τα δύο μεγάλα μοντέλα δεν έχει ανακοινωθεί ακόμη, δείχνει ότι υποστηρίζει τη δημιουργία περιεχομένου βίντεο 3 δευτερολέπτων, 6 δευτερολέπτων, 9 δευτερολέπτων και 12 δευτερολέπτων. . αντίθετα, ο keling ξεκίνησε μια λειτουργία συνέχειας βίντεο στις 21 ιουνίου, η οποία μπορεί να επεκτείνει το βίντεο για περίπου 5 δευτερόλεπτα και να δημιουργήσει ένα βίντεο διάρκειας περίπου 3 λεπτών το πολύ.

πηγή φωτογραφίας της συνέντευξης τύπου: φωτογραφία από τον yang xinyi, δημοσιογράφο της daily news

«τα διαφορετικά σενάρια έχουν διαφορετικές απαιτήσεις για τη διάρκεια του βίντεο και δίνουμε μεγαλύτερη προσοχή σε λύσεις για διαφορετικές βιομηχανίες, δήλωσε ο tan dai σε μια συνέντευξη με έναν δημοσιογράφο από την «daily economic news» ότι το πλεονέκτημα του μεγάλου μοντέλου παραγωγής βίντεο doubao. η βιομηχανία έγκειται κυρίως στην ικανότητα να ακολουθείτε τις οδηγίες, τη συνέπεια της εναλλαγής πολλαπλών φακών και την ικανότητα γενίκευσης της παραγωγής βίντεο.

στη συνέντευξη τύπου, πολλές επίσημες επιδείξεις βίντεο κατέδειξαν τις παραπάνω δυνατότητες: για παράδειγμα, σε ένα βίντεο επίδειξης ενός άνδρα και μιας γυναίκας που καλπάζουν έφιπποι, στην οθόνη 10 δευτερολέπτων, τα δύο άτομα είχαν διαφορετικές εκφράσεις και κινήσεις, αλλά και οι δύο απέδωσε καλά και φυσικά.

αξίζει να σημειωθεί ότι το μεγάλο μοντέλο της γενιάς βίντεο doubao υποστηρίζει τη γενιά ασπρόμαυρων, 3d animation, 2d animation, κινέζικη ζωγραφική, χοντρή βαφή και άλλα στυλ περιεχομένου.

"για τα μοντέλα παραγωγής βίντεο, είναι δύσκολο να δημιουργηθούν διαφορετικά στυλ (παραγωγής περιεχομένου). εκτός από την τεχνολογία, εξαρτάται κυρίως από τον πλούτο της πηγής δεδομένων ένας μεγάλος τεχνικός μοντέλων είπε στον δημοσιογράφο της "daily economic news". ο tan dai απέδωσε αυτό στα «πλεονεκτήματα των δυνατοτήτων full-stack, στις τεχνολογικές ανακαλύψεις και στην κατανόηση του βίντεο από τους douyin και jianying».

τηρώντας την αρχή του πραγματισμού, ο tan dai είπε ότι το νέο μοντέλο παραγωγής βίντεο bean bag "εξετάζει το ενδεχόμενο εμπορευματοποίησης από την κυκλοφορία του" και τα πεδία εφαρμογής του περιλαμβάνουν το μάρκετινγκ ηλεκτρονικού εμπορίου, την εκπαίδευση κινούμενων σχεδίων, τον αστικό πολιτιστικό τουρισμό και τα μικροσενάρια.

ο keling είναι επίσης «ανήσυχος» όσον αφορά την εμπορευματοποίηση. στην τηλεδιάσκεψη των αποτελεσμάτων του δεύτερου τριμήνου το απόγευμα της 20ης αυγούστου, ο cheng yixiao, συνιδρυτής, πρόεδρος και διευθύνων σύμβουλος της kuaishou, θεώρησε την εμπορευματοποίηση του keling ως κορυφαία προτεραιότητα και «προσπαθεί να επιτύχει μια σημαντική κλίμακα εμπορικής υλοποίησης το συντομότερο δυνατό ."

μιλώντας για τη στρατηγική τιμολόγησης, ο tan dai αποκάλυψε ότι η τιμή του μοντέλου γενιάς βίντεο doubao δεν έχει ακόμη καθοριστεί. "τα σενάρια εφαρμογής των μοντέλων βίντεο και των μοντέλων γλώσσας είναι διαφορετικά και η λογική τιμολόγησης είναι επίσης διαφορετική. η αξία του προϊόντος πρέπει να μετρηθεί μέσω νέων εμπειριών, κόστους μετανάστευσης κ.λπ. αν (το προϊόν) μπορεί τελικά να χρησιμοποιηθεί ευρέως εξαρτάται επίσης από το αν έχει καλύτερη παραγωγικότητα roi (απόδοση επένδυσης) από πριν ) .

"η τιμή δεν είναι πλέον το κατώφλι για την καινοτομία".

εκτός από το μοντέλο της νέας γενιάς βίντεο, αυτή η εκδήλωση κυκλοφόρησε επίσης μοντέλα μουσικής beanbag και μοντέλα ταυτόχρονης διερμηνείας. μέχρι τώρα, η οικογένεια μεγάλων μοντέλων doubao έχει καλύψει τις τρεις κατηγορίες μεγάλων μοντέλων γλώσσας, μεγάλα οπτικά μοντέλα και μεγάλα μοντέλα ομιλίας, και έχουν κυκλοφορήσει συνολικά 13 μεγάλα μοντέλα.

αλλά τα μοντέλα από μόνα τους δεν αρκούν πολλοί άνθρωποι του κλάδου λένε ότι η τρέχουσα εφαρμογή των μεγάλων κατασκευαστών μοντέλων «ψάχνει καρφιά με ένα σφυρί». έτσι, το πώς να βρείτε καρφιά και πώς να χρησιμοποιήσετε ένα κατάλληλο σφυρί για να σφυρηλατήσετε τα καρφιά με λιγότερη προσπάθεια μπορεί να γίνουν νέες προκλήσεις για τους προμηθευτές cloud στην εποχή της τεχνητής νοημοσύνης.

το πρώτο είναι το ζήτημα κόστους που βρίσκεται μεταξύ των μεγάλων κατασκευαστών μοντέλων και των επιχειρήσεων.

στη συνέντευξη τύπου τον μάιο, ο tan dai ανακοίνωσε ότι η τιμή εισόδου συμπερασμάτων του κύριου μοντέλου της doubao είναι μόνο 0,0008 γιουάν/χίλια tokens, που είναι 99,3% φθηνότερα από τη βιομηχανία, ξεκινώντας έναν πόλεμο τιμών στον τομέα των μεγάλων μοντέλων.

"το κόστος είναι το κλειδί. εάν η τιμή πέσει κατά ένα δέκατο, ο όγκος μπορεί να δεκαπλασιαστεί." πιστεύουμε ότι το ξεκλείδωμα νέων σεναρίων είναι πιο πολύτιμο, όπως οι αναβαθμίσεις σεναρίων στη συνομιλία, η συντροφικότητα, η παραγωγικότητα και η επέκταση των σεναρίων εταιρικών εφαρμογών».

ωστόσο, επέμεινε επίσης ότι η επιχειρηματική βάση για την αγορά b-end πρέπει να είναι βιώσιμη αυτοπεποίθηση για να το κάνω».

αφού το μεγάλο μοντέλο doubao πρωτοστάτησε στη μείωση της τιμής του, οι alibaba tongyi qianwen, baidu wenxin yiyan και άλλα μοντέλα μείωσαν επίσης διαδοχικά τις τιμές τους. στο φετινό συνέδριο yunqi, οι τιμές των τριών κύριων μοντέλων του tongyi qianwen στην πλατφόρμα alibaba cloud bailian μειώθηκαν και πάλι, ο τεχνικός διευθυντής του alibaba, zhou jingren, μάλιστα, δήλωσε ότι «σε σύγκριση με τις τεράστιες εφαρμογές στο μέλλον, εξακολουθούν να είναι πολύ ακριβές».

σχετικά με την τρέχουσα κατάσταση αυτού του κλάδου, ο tan dai είπε ότι μετά τη μείωση της τιμής, κρίνοντας από τον αριθμό των κλήσεων, το κόστος δεν αποτελεί πλέον εμπόδιο στην καινοτομία «το επόμενο πράγμα που πρέπει να κάνουμε είναι να βελτιώσουμε την ποιότητα και την απόδοση του μοντέλου σε αυτή την τιμή ο δείκτης ποιότητας ο σκοπός είναι να γίνει το μοντέλο πιο ισχυρό και διαφορετικό.

μετά από έναν γύρο «γενικών μειώσεων», η μεγάλη βιομηχανία μοντέλων δεν θα «μειώνει» πλέον τυφλά τις τιμές σε αυτό το στάδιο, ο ανταγωνισμός είναι η απόδοση του μοντέλου, η οποία υποστηρίζεται και από τη ζήτηση των πελατών.

σύμφωνα με την παρατήρηση του tan, για την υλοποίηση μεγάλων μοντέλων, η ζήτηση στην αγορά β αλλάζει αργά και η βασική ζήτηση είναι η μείωση του κόστους και η αύξηση της αποδοτικότητας. "όταν οι επιχειρήσεις εφαρμόζουν την τεχνητή νοημοσύνη, συνήθιζαν να σχεδιάζουν από πάνω προς τα κάτω, κάτι που έχει μεγάλη πιθανότητα αποτυχίας. τώρα πρέπει να καινοτομούν από κάτω προς τα πάνω."

ο ρεπόρτερ της «daily economic news» παρατήρησε ότι στη διαδικασία παροχής βοήθειας στις επιχειρήσεις στον ψηφιακό μετασχηματισμό, η volcano engine ένωσε τις δυνάμεις της με όλα τα μέρη για να ιδρύσει την smart terminal large model alliance, την automobile large model ecological alliance και την retail large model ecological alliance , και εξωτερικοί πελάτες έχουν ήδη καλύψει περισσότερους από 30 κλάδους όπως κινητά τηλέφωνα, αυτοκίνητα, χρηματοοικονομικά, κατανάλωση και διαδραστική ψυχαγωγία.

τώρα, το byte έχει μερικά ακόμα εύχρηστα «σφυριά» στα χέρια του πώς να βρεις περισσότερα «καρφιά» που να ταιριάζουν με αυτά σε όλους τους τομείς της ζωής θα είναι η επόμενη δοκιμή του volcano engine.

καθημερινά οικονομικά νέα

αναφορά/σχόλια