νέα

ο πόλεμος τιμών για τα μεγάλα μοντέλα είχε ως αποτέλεσμα αρνητικό μικτό κέρδος

2024-09-24

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina


ο εγχώριος διαγωνισμός εξάλειψης μεγάλων μοντέλων επιταχύνεται. αυτός ο γύρος εξάλειψης θα διαρκέσει για ένα ή δύο χρόνια και μόνο μερικές βασικές εταιρείες μοντέλων με πραγματική δύναμη μπορούν να συνεχίσουν να επιβιώνουν.

άρθρο |. wu junyu, ειδικός συγγραφέας του "finance"

συντάκτης |. xie lilong

ο πόλεμος τιμών για τα μεγάλα μοντέλα στην κινεζική αγορά συνεχίζεται εδώ και σχεδόν μισό χρόνο. αυτός ο γύρος πολέμου τιμών έχει φτάσει σε αρνητικά ακαθάριστα κέρδη και δεν δείχνει σημάδια διακοπής προς το παρόν. οι κορυφαίοι πωλητές cloud εξακολουθούν να σχεδιάζουν έναν νέο γύρο περικοπών τιμών. αυτός ο γύρος περικοπών τιμών θα εφαρμοστεί στα τέλη σεπτεμβρίου του τρέχοντος έτους.

τον μάιο του τρέχοντος έτους, οι κινέζοι πωλητές cloud ξεκίνησαν έναν πόλεμο τιμών για την υπολογιστική ισχύ μεγάλων μοντέλων. οι υπηρεσίες cloud της bytedance, το volcano engine, το alibaba cloud, το baidu smart cloud και το tencent cloud έχουν μειώσει διαδοχικά την τιμή της υπολογιστικής ισχύος συμπερασμάτων μεγάλων μοντέλων κατά περισσότερο από 90%.

για να χρησιμοποιήσετε ένα μεγάλο μοντέλο, πρέπει να εισαγάγετε τη γλώσσα προτροπής και να λάβετε την έξοδο περιεχομένου μέσω συλλογισμού. αυτή η διαδικασία θα καλέσει ένα api (διασύνδεση προγραμματισμού εφαρμογών, όπως ακριβώς ένας διακόπτης νερού και ηλεκτρικού ρεύματος) και θα πληρώσει ανάλογα με τον αριθμό των διακριτικών που καταναλώθηκαν (το token είναι μια μονάδα κειμένου ενός μεγάλου μοντέλου, ένα token μπορεί να είναι λέξη, σημεία στίξης, αριθμός, σύμβολο κ.λπ.). είναι σαν να πληρώνεις τέλος χρήσης για νερό και ρεύμα.

μετά τη μείωση της τιμής, η κατανάλωση υπολογιστικής ισχύος συμπερασμάτων αυξάνεται πράγματι ταχέως. τον αύγουστο του τρέχοντος έτους, η τηλεδιάσκεψη για τα κέρδη του δεύτερου τριμήνου της baidu αποκάλυψε ότι οι μέσες ημερήσιες κλήσεις api του baidu wenxin big model τον μάιο ήταν 200 εκατομμύρια, τα οποία αυξήθηκαν σε 600 εκατομμύρια τον αύγουστο η μέση ημερήσια κατανάλωση token τον μάιο ήταν 250 δισεκατομμύρια αύγουστος έχει αυξηθεί στο 1 τρισ. η bytedance ανακοίνωσε τον αύγουστο του τρέχοντος έτους ότι από τον ιούλιο, η μέση ημερήσια χρήση token του μοντέλου bytedance doubao ξεπέρασε τα 500 δισεκατομμύρια. σε σύγκριση με τον μάιο, η μέση ημερήσια χρήση διακριτικών ανά εταιρεία αυξήθηκε κατά 22 φορές.

οι τιμές token μειώθηκαν περισσότερο από 90%. αυτό θα μειώσει τα έσοδα συμπερασμάτων των προμηθευτών cloud βραχυπρόθεσμα. ωστόσο, οι προμηθευτές cloud ελπίζουν να χρησιμοποιήσουν αυτή τη μέθοδο για να μειώσουν το όριο δοκιμής και σφάλματος για εταιρικούς πελάτες, με αποτέλεσμα πάνω από 10 φορές την εκθετική υπολογιστική κατανάλωση ενέργειας και τελικά να επιτύχουν μακροπρόθεσμη αύξηση εσόδων.

ο πόλεμος τιμών για την υπολογιστική ισχύ στην εγχώρια αγορά μεγάλων μοντέλων έχει διαρκέσει επί μισό χρόνο. υπάρχουν τρία βασικά δεδομένα.

πρώτον, ο συναγόμενος πόλεμος τιμών υπολογιστικής ισχύος έχει ήδη φτάσει σε αρνητικά ακαθάριστα κέρδη. πρόσφατα, επικεφαλής πολλών προμηθευτών cloud, συμπεριλαμβανομένων των alibaba cloud και baidu smart cloud, μας αποκάλυψαν ότι πριν από τον μάιο του τρέχοντος έτους, το μεικτό περιθώριο κέρδους της υπολογιστικής ισχύος συμπερασμάτων εγχώριων μοντέλων μεγάλης κλίμακας ήταν υψηλότερο από 60%, που ήταν βασικά το ίδιο με αυτή των διεθνών ομολόγων. αφού οι μεγάλοι κατασκευαστές μείωσαν διαδοχικά τις τιμές τον μάιο του τρέχοντος έτους, το μικτό περιθώριο κέρδους της υπολογιστικής ισχύος συμπερασμάτων μειώθηκε σε αρνητικά νούμερα.

δεύτερον, σε σύγκριση με τα μοντέλα της openai των ίδιων προδιαγραφών, η τιμή των εγχώριων μοντέλων είναι γενικά μόνο 20%-50%. το μεικτό περιθώριο κέρδους των εγχώριων μεγάλων μοντέλων είναι πολύ χαμηλότερο από αυτό του openai. μια ερευνητική έκθεση του futuresearch, ενός διεθνούς οργανισμού έρευνας αγοράς, τον αύγουστο του τρέχοντος έτους ανέφερε ότι το μεικτό περιθώριο κέρδους του εμβληματικού μοντέλου της σειράς gpt-4 της openai είναι περίπου 75%, και το μεικτό περιθώριο κέρδους του κύριου μοντέλου της σειράς gpt-4o είναι περίπου 55%. το συνολικό μικτό περιθώριο κέρδους του openai είναι τουλάχιστον πάνω από 40%.

τρίτον, οι ανεπαρκείς δυνατότητες του μοντέλου είναι μια σημαντική αιτία πολέμων τιμών. ένας βασικός υπεύθυνος της μεγάλης επιχείρησης μοντέλων ενός προμηθευτή cloud πιστεύει ότι επί του παρόντος υπάρχει ένα χάσμα μεταξύ των δυνατοτήτων των εγχώριων εμβληματικών μοντέλων και των ναυαρχίδων της σειράς gpt-4 της openai, επομένως οι πελάτες θα πρέπει να ενθαρρύνονται να προσπαθούν και να κάνουν λάθη μέσω μειώσεων τιμών . καθώς οι τιμές των μοντέλων συνεχίζουν να πέφτουν, η τιμή δεν είναι πλέον η κύρια ανησυχία για τους εταιρικούς πελάτες. οι δυνατότητες και τα αποτελέσματα του μοντέλου είναι αυτό που ενδιαφέρει περισσότερο τους εταιρικούς πελάτες.

πρέπει να γίνει πόλεμος τιμών

ελέγξαμε τις μεγάλες τιμές συμπερασμάτων μοντέλων που ανακοινώθηκαν από τον επίσημο ιστότοπο alibaba cloud, volcano engine, baidu smart cloud, tencent cloud και openai. σε σύγκριση με τα μοντέλα της openai ίδιας προδιαγραφής, η τιμή των εγχώριων μοντέλων είναι γενικά μόνο 20%-50%.

πάρτε για παράδειγμα το tongyi qianwen-max της alibaba, το ernie-4.0-8k της baidu και το hunyuan-pro της tencent οι τιμές παραγωγής των τριών μοντέλων ανά εκατομμύριο tokens είναι 120 γιουάν, 120 γιουάν και 100 γιουάν αντίστοιχα. η τιμή παραγωγής του βασικού μοντέλου openai gpt-4-turbo αναφοράς τους είναι 210 γιουάν ανά εκατομμύριο tokens (η τιμή που αναφέρεται στον επίσημο ιστότοπο του openai είναι 30 δολάρια ηπα, η οποία έχει μετατραπεί με βάση το δολάριο ηπα και την ισοτιμία rmb 1: 7). η τιμή αυτών των τριών μεγάλων εγχώριων μοντέλων είναι μόνο περίπου το 50% αυτής του gpt-4-turbo.

πάρτε τα qwen-long της alibaba, τα ernie-speed-pro-128k της baidu και την ενσωμάτωση hunyuan της tencent οι τιμές παραγωγής των τριών μοντέλων ανά εκατομμύριο tokens είναι 2 γιουάν, 0,8 γιουάν και 5 γιουάν αντίστοιχα. η τιμή παραγωγής του φθηνού μοντέλου openai gpt-4o-mini εκατομμυρίων tokens του openai είναι 4,2 γιουάν (η τιμή που αναφέρεται στον επίσημο ιστότοπο του openai είναι 0,6 δολάρια ηπα, η οποία έχει μετατραπεί με βάση τη συναλλαγματική ισοτιμία δολαρίων ηπα και rmb 1:7 ). τα βασικά μοντέλα της alibaba και της baidu είναι μόνο το 48% και το 19% της τιμής του βασικού μοντέλου του openai.

ο πόλεμος τιμών για τα μεγάλα μοντέλα έχει φτάσει σε αρνητικά μεικτά περιθώρια, αλλά αυτό δεν εμπόδισε διάφορους προμηθευτές cloud να συνεχίσουν να μειώνουν τις τιμές.

τα νέα που λάβαμε είναι ότι κορυφαίοι προμηθευτές cloud, όπως η alibaba cloud, σχεδιάζουν ακόμη έναν νέο γύρο περικοπών τιμών. αυτός ο γύρος περικοπών τιμών θα εφαρμοστεί στα τέλη σεπτεμβρίου του τρέχοντος έτους. τα κορυφαία μοντέλα υψηλών επιδόσεων βρίσκονται στο επίκεντρο αυτού του γύρου περικοπών τιμών.

ο βασικός υπεύθυνος της επιχείρησης μεγάλων μοντέλων των προαναφερθέντων πωλητών cloud πιστεύει ότι επί του παρόντος υπάρχουν λίγα περιθώρια για μειώσεις τιμών για φθηνά μοντέλα μικρού μεγέθους και ο τελευταίος γύρος μειώσεων τιμών έχει πέσει στο "ψυχολογικό κατώτατο όριο" των εταιρικών πελατών. το επόμενο βήμα στο οποίο πρέπει να εστιάσουμε είναι αν κάθε ναυαρχίδα θα συνεχίσει να μειώνει τις τιμές. το εμβληματικό μοντέλο θα υποδιαιρεθεί επίσης σε οικονομικές εκδόσεις που μπορούν να λύσουν τα περισσότερα προβλήματα, καθώς και σε εκδόσεις υψηλής ποιότητας, υψηλών τιμών που λύνουν εξαιρετικά δύσκολα προβλήματα.

η υπολογιστική ισχύς των συμπερασμάτων μεγάλων μοντέλων έχει φτάσει σε αρνητικό μικτό κέρδος, οπότε γιατί να συνεχίσουμε να μειώνουμε τις τιμές;

οι μεγάλοι κατασκευαστές cloud εξετάζουν τη μακροπρόθεσμη τάση της αγοράς - η δομή υπολογιστικής ισχύος του cloud computing υφίσταται δραστικές αλλαγές. το να αδράξεις περισσότερη υπολογιστική δύναμη συμπερασμάτων σημαίνει να αδράξεις περισσότερες αυξητικές αγορές. ο διεθνής οργανισμός έρευνας αγοράς idc προβλέπει ότι η γενική υπολογιστική ισχύς της κίνας θα έχει σύνθετο ετήσιο ρυθμό ανάπτυξης 16,6% από το 2022 έως το 2027 και η ευφυής υπολογιστική ισχύς θα έχει σύνθετο ετήσιο ρυθμό ανάπτυξης 33,9%. από το 2022 έως το 2027, στο πλαίσιο της ευφυούς υπολογιστικής ισχύος, το ποσοστό της υπολογιστικής ισχύος συμπερασμάτων θα αυξηθεί στο 72,6% και το ποσοστό της υπολογιστικής ισχύος εκπαίδευσης θα μειωθεί στο 27,4%.

οι πωλητές cloud είναι πρόθυμοι να εγκαταλείψουν τα βραχυπρόθεσμα έσοδα για την αναμενόμενη μακροπρόθεσμη ανάπτυξη. βραχυπρόθεσμα, η υπολογιστική ισχύς συμπερασμάτων δεν αποφέρει πολλά έσοδα. ένας τεχνικός από έναν κινέζο πωλητή cloud εξήγησε ότι το μοντέλο που καλεί τα έσοδα κάθε εταιρείας δεν θα υπερβαίνει το 1 δισεκατομμύριο γιουάν το 2024, το οποίο είναι περιορισμένο σε μια αγορά με δεκάδες δισεκατομμύρια έσοδα ετησίως. οι πωλητές cloud είναι πρόθυμοι να δεχτούν βραχυπρόθεσμες απώλειες εσόδων και απώλειες επιχειρήσεων τα επόμενα ένα έως δύο χρόνια. όλοι στοιχηματίζουν ότι ο αριθμός των μεγάλων κλήσεων μοντέλου θα αυξηθεί εκθετικά κατά τουλάχιστον 10 φορές τα επόμενα ένα έως δύο χρόνια. τελικά, η μακροπρόθεσμη αύξηση των εσόδων μπορεί να αντισταθμίσει τις βραχυπρόθεσμες απώλειες εσόδων.

εξήγησε περαιτέρω ότι σε αυτή τη διαδικασία, το κόστος της υπολογιστικής ισχύος θα μειωθεί σταδιακά καθώς αυξάνεται η ζήτηση των πελατών. η μεγάλη επιχείρηση μοντέλου εξακολουθεί να έχει την ευκαιρία να επιτύχει θετικά κέρδη τελικά. ακόμα κι αν το στοίχημα δεν ισχύει, μια ομάδα κατασκευαστών μοντέλων θα πεθάνει στον πόλεμο τιμών και οι επιζώντες κατασκευαστές θα μαζέψουν τα κομμάτια.

διαφορετικοί προμηθευτές cloud έχουν επίσης διαφορετικές εκτιμήσεις ανταγωνισμού όταν αντιμετωπίζουν πολέμους τιμών - το volcano engine, το alibaba cloud και το baidu smart cloud συμμετέχουν όλοι σε έναν πόλεμο τιμών που πρέπει να γίνει.

η volcano engine δεν κατατάσσεται επί του παρόντος μεταξύ των πέντε κορυφαίων στην αγορά δημόσιου cloud της κίνας, αλλά τα έσοδά της θα αυξηθούν περισσότερο από 150% το 2023. τα μεγάλα μοντέλα είναι μια σημαντική ευκαιρία για να φτάσει στην αγορά cloud. ο tan dai, πρόεδρος της volcano engine, μας ανέφερε τον μάιο του τρέχοντος έτους ότι τον μάρτιο του τρέχοντος έτους ανακάλυψε στη silicon valley ότι η επιχειρηματικότητα εφαρμογών ai στις ηνωμένες πολιτείες έδειξε την τάση του πρώιμου σταδίου του κινεζικού διαδικτύου για κινητά από το 2012 έως το 2014. "μια μικρή ομάδα εκκίνησης εφαρμογών τεχνητής νοημοσύνης πέτυχε γρήγορα έσοδα και χρηματοδότηση. η κινεζική αγορά μπορεί να δείξει αυτή την τάση στο μέλλον. αλλά η προϋπόθεση είναι ότι η τιμή του συμπερασμάτων πρέπει να μειωθεί και το όριο για δοκιμή και λάθος πρέπει να μειωθεί."

το alibaba cloud κατέχει την πρώτη θέση στην αγορά δημόσιου cloud της κίνας. αντιμέτωπη με περικοπές τιμών από τους ανταγωνιστές, το alibaba cloud πρέπει να δώσει συνέχεια. ο liu weiguang, γενικός διευθυντής του τμήματος public cloud του alibaba cloud, μας ανέλυσε τον ιούνιο του τρέχοντος έτους ότι το alibaba cloud έχει περάσει από πολλούς γύρους εσωτερικών αφαιρέσεων και υπολογισμών και βρήκε δύο αντιφάσεις:

  • πρώτον, μετά τη μείωση της τιμής, το υπάρχον εισόδημα θα μειωθεί και το πρόσθετο εισόδημα θα αυξηθεί. στην ιδανική περίπτωση, τα πρόσθετα έσοδα μπορούν να καλύψουν τα υπάρχοντα έσοδα.

  • το δεύτερο είναι πώς να αντιδράσετε εάν οι όμοιοι μειώνουν τις τιμές πιο επιθετικά. το τελικό συμπέρασμα είναι ότι η κλίμακα είναι πλέον πιο σημαντική από τα κέρδη. η alibaba cloud θέλει να χρησιμοποιήσει μεγάλα μοντέλα για να αυξήσει τη διείσδυση του cloud computing σε ολόκληρο τον κλάδο.

το baidu intelligent cloud θεωρεί το ai ως τη βασική του στρατηγική. ένας τεχνικός διευθυντής μεγάλων μοντέλων της baidu μας είπε ωμά τον ιούλιο του τρέχοντος έτους ότι τα μεγάλα μοντέλα είναι μια μάχη που πρέπει να κερδηθεί και ότι ο πόλεμος τιμών πρέπει να γίνει με κάθε κόστος. αυτή η στρατηγική έχει επιτύχει πραγματικά αποτελέσματα. ο ρυθμός αύξησης των εσόδων του baidu smart cloud το δεύτερο τρίμηνο του 2024 ανέκαμψε στο 14%, το υψηλότερο σημείο των δύο τελευταίων ετών. η διοίκηση της baidu αποκάλυψε τα κέρδη του δεύτερου τριμήνου του 2024 ότι το μεγάλο ποσοστό εσόδων του baidu intelligent cloud αυξήθηκε από 4,8% το τέταρτο τρίμηνο του 2023 σε 9% το δεύτερο τρίμηνο του 2024.

ένας στρατηγικός σχεδιαστής ai από την κορυφαία εταιρεία τεχνολογίας της κίνας ανέλυσε ότι το volcano engine υποστηρίζεται από την bytedance και ότι η διαφημιστική δραστηριότητα της μητρικής εταιρείας μπορεί να είναι μια μετάγγιση αίματος. η volcano engine δεν κατατάσσεται μεταξύ των πέντε κορυφαίων στην αγορά cloud και ελπίζει να κατακτήσει περισσότερο μερίδιο αγοράς μέσω πολέμων τιμών. το alibaba cloud προέρχεται κυρίως από τα τέσσερα κύρια στοιχεία του δημόσιου νέφους (υπολογισμός, αποθήκευση, δίκτυο, βάση δεδομένων). τα μεγάλα μοντέλα είναι η βασική στρατηγική της baidu.

η τιμή δεν είναι ο καθοριστικός παράγοντας

η άλλη όψη των πολέμων τιμών συμπερασμάτων μεγάλων μοντέλων και των αρνητικών μικτών περιθωρίων είναι ότι η χαμηλή τιμή δεν είναι ο κύριος παράγοντας για το εάν οι εταιρικοί πελάτες χρησιμοποιούν μεγάλα μοντέλα.

ο βασικός υπεύθυνος της μεγάλης επιχείρησης μοντέλων των προαναφερθέντων προμηθευτών cloud πιστεύει ότι οι προμηθευτές cloud δεν μπορούν να βασίζονται στη μακροπρόθεσμη καύση χρημάτων και ζημίες για την προώθηση της υλοποίησης της μεγάλης βιομηχανίας μοντέλων. ένα μοντέλο χαμηλών επιδόσεων και χαμηλής τιμής δεν έχει νόημα. οι ανεπαρκείς δυνατότητες του μοντέλου είναι ένας σημαντικός λόγος για αρνητικούς πολέμους τιμών μικτού κέρδους. καθώς οι τιμές κλήσεων εγχώριων μοντέλων έχουν μειωθεί σημαντικά, η τιμή δεν είναι πλέον ο σημαντικότερος παράγοντας για τους εταιρικούς πελάτες. οι δυνατότητες και τα αποτελέσματα του μοντέλου είναι αυτό που ενδιαφέρει περισσότερο τους εταιρικούς πελάτες.

ένας διευθυντής πληροφορικής σε μια ασφαλιστική εταιρεία συμφώνησε. είπε ωμά ότι το τρέχον ποσοστό των δαπανών πληροφορικής στον χρηματοοικονομικό και ασφαλιστικό κλάδο στα έσοδα της εταιρείας είναι περίπου 3%-5%. όταν χρησιμοποιείτε μια νέα τεχνολογία όπως μεγάλα μοντέλα, πρέπει να υπολογίζεται η αναλογία εισόδου-εξόδου. εκτός από το ρητό κόστος μοντέλων, πρέπει επίσης να ληφθεί υπόψη το έμμεσο κόστος - τα μεγάλα μοντέλα πρέπει να είναι συμβατά με τα υπάρχοντα συστήματα πληροφορικής, απαιτείται διακυβέρνηση δεδομένων για την προετοιμασία επιχειρηματικών δεδομένων για μεγάλα μοντέλα και πρέπει να προσληφθεί μια ομάδα διαχειριστών προϊόντων που κατανοούν την τεχνητή νοημοσύνη. αυτό που τον απασχολεί περισσότερο είναι οι δυνατότητες του μοντέλου και τα πρακτικά αποτελέσματα.

το κέντρο έρευνας για τα θεμελιώδη μοντέλα (crfm) στο πανεπιστήμιο του στάνφορντ διεξάγει μακροπρόθεσμες παγκόσμιες κατατάξεις δοκιμών μεγάλων μοντέλων. η κατάταξη των μεγάλης κλίμακας δοκιμών κατανόησης γλώσσας πολλαπλών εργασιών (mmlu) στις 17 σεπτεμβρίου δείχνει ότι οι δέκα κορυφαίοι κατασκευαστές μοντέλων περιλαμβάνουν τη σειρά claude 3.5 της startup τεχνητής νοημοσύνης anthropic (επένδυση από την amazon), τη σειρά llama3.1 της meta και openai (σειρά gpt-4 που ανήκει στη microsoft investment) και σειρά gemini 1.5 που ανήκει στην google. επί του παρόντος, μόνο το tongyi qianwen 2 instruct (72b) που ανήκει στην alibaba μεταξύ των κινεζικών μεγάλων μοντέλων βρίσκεται στην πρώτη δεκάδα.

το μεγάλο τεχνικό προσωπικό μοντέλων πολλών κινέζων πωλητών cloud εξέφρασε την ίδια άποψη στην caijing: στη μεγάλη αγορά μοντέλων, η στρατηγική χαμηλής απόδοσης και χαμηλής τιμής είναι μη βιώσιμη. η ιδανική κατάσταση είναι να δημιουργήσετε έναν υγιή και διαρκή επιχειρηματικό κλειστό βρόχο βασισμένο σε υψηλές επιδόσεις και λογικές τιμές.

ένα πιο πολύτιμο σημείο αναφοράς είναι το openai. από τον σεπτέμβριο του τρέχοντος έτους, το openai έχει 1 δισεκατομμύριο ενεργούς χρήστες μηνιαίως και 11 εκατομμύρια χρήστες επί πληρωμή (συμπεριλαμβανομένων 10 εκατομμυρίων μεμονωμένων συνδρομητών επί πληρωμή και 1 εκατομμυρίου εταιρικών συνδρομητών). τον μάιο του τρέχοντος έτους, η διοίκηση του openai ανακοίνωσε τα ετήσια έσοδα της εταιρείας (τα ετήσια έσοδα είναι τα έσοδα του τρέχοντος μήνα × 12. οι εταιρείες λογισμικού που βασίζονται σε συνδρομές λαμβάνουν ανανεώσεις συνδρομών χρηστών κάθε μήνα και έχουν σταθερές προσδοκίες εσόδων, επομένως χρησιμοποιούν συχνά το ετήσιο διαμέτρημα εσόδων) 3,4 δισεκατομμύρια δολάρια ηπα (μετατροπή με βάση το δολάριο ηπα και τη συναλλαγματική ισοτιμία rmb 1:7, περίπου 24,1 δισεκατομμύρια γιουάν).

η τελευταία ερευνητική έκθεση του futuresearch, ενός διεθνούς οργανισμού έρευνας αγοράς, υπολογίζει τη δομή εσόδων της εταιρείας με βάση τα ετήσια έσοδα και τη δομή πληρωμένων χρηστών που ανακοινώθηκε από το openai - 10 εκατομμύρια μεμονωμένοι συνδρομητές απέφεραν έσοδα 1,9 δισεκατομμυρίων δολαρίων, που αντιστοιχούν στο 1 εκατομμύριο επιχειρήσεις οι συνδρομητές απέφεραν έσοδα 710 εκατομμυρίων δολαρίων, που αντιπροσωπεύουν το 21% των κλήσεων api, 510 εκατομμύρια δολάρια σε έσοδα, αντιπροσωπεύοντας το 15%.

ακόμη και μετά από πολλαπλούς γύρους περικοπών τιμών, το openai μπορεί να διατηρήσει ένα σχετικά υγιές περιθώριο μικτού κέρδους. τον απρίλιο του τρέχοντος έτους, η τιμή εξόδου του κορυφαίου μοντέλου gpt-4-turbo του openai μειώθηκε κατά 67%. τον αύγουστο του τρέχοντος έτους, η τιμή παραγωγής του κύριου μοντέλου gpt-4o του openai μειώθηκε κατά 30%. μια ερευνητική έκθεση που κυκλοφόρησε από το futuresearch τον αύγουστο του τρέχοντος έτους ανέφερε ότι το μικτό περιθώριο κέρδους του κορυφαίου μοντέλου της σειράς gpt-4 της openai είναι περίπου 75%, και το μεικτό περιθώριο κέρδους του κύριου μοντέλου της σειράς gpt-4o είναι περίπου 55%. το συνολικό μικτό περιθώριο κέρδους του openai είναι τουλάχιστον 40%.

το openai έχει ένα μοναδικό περιβάλλον ανάπτυξης. όχι μόνο διαθέτει επαρκή υπολογιστική τροφοδοσία, αλλά έχει επίσης τεράστιους χρήστες to c (για πελάτες καταναλωτές) και βρίσκεται επίσης στη μεγαλύτερη αγορά λογισμικού to b (για εταιρικούς πελάτες) στον κόσμο.

η επιτυχημένη εμπειρία του openai τα τελευταία δύο χρόνια είναι ότι στηρίζεται σε μεγάλη υπολογιστική ισχύ για την «ωμή βία για τη δημιουργία θαυμάτων». οι κινεζικές εταιρείες δεν διαθέτουν τις συνθήκες υπολογιστικής ισχύος και το περιβάλλον χρηματοδότησης όπως το openai. η υπολογιστική ισχύς είναι ένα βασικό μειονέκτημα των κινέζων κατασκευαστών μοντέλων.

ένας τεχνικός μοντέλων από έναν κινέζο προμηθευτή cloud εξήγησε ότι τον περασμένο χρόνο, οι κινέζοι προμηθευτές cloud έχουν πληρώσει περισσότερο από 1,5 φορές το κόστος αγοράς για τα τσιπ ai της nvidia, γεγονός που έχει διατηρήσει το κόστος της υπολογιστικής ισχύος του μοντέλου υψηλό. αυτό θα επηρεάσει το ανώτατο όριο απόδοσης των μεγάλων μοντέλων και επίσης θα εμποδίσει τη βιομηχανική εφαρμογή μεγάλων μοντέλων. σύμφωνα με έναν αντιπρόσωπο διακομιστών, οι διακομιστές οκτώ καρτών εξοπλισμένοι με τσιπ ai σειράς nvidia h100/h800 στην κινεζική αγορά το 2023 ξεπέρασαν κάποτε τα 3 εκατομμύρια γιουάν/μονάδα, που είναι περισσότερο από 1,5 φορές την επίσημη τιμολόγηση της nvidia.

πώς μπορούν οι κινεζικές εταιρείες να βρουν μια πορεία ανάπτυξης που τους ταιριάζει όταν οι υπολογιστικοί πόροι είναι περιορισμένοι και το κόστος υπολογισμού είναι υψηλό; αυτό απαιτεί προσεκτικό σχεδιασμό και προσαρμογή.

τα τελευταία δύο χρόνια, η ανάπτυξη μεγάλων μοντέλων ακολούθησε τον νόμο κλιμάκωσης (ο νόμος που προτάθηκε από το openai το 2020, κυριολεκτικά μεταφράζεται ως «νόμος κλιμάκωσης») - η απόδοση του μοντέλου σχετίζεται κυρίως με τον όγκο του υπολογισμού, την ποσότητα των παραμέτρων του μοντέλου και ο όγκος των δεδομένων εκπαίδευσης.

ο βασικός υπεύθυνος της επιχείρησης μεγάλων μοντέλων των προαναφερθέντων προμηθευτών cloud ανέφερε ότι η βασική αρχή είναι η βελτίωση της ποιότητας και της ποσότητας δεδομένων υπό τους περιορισμούς του νόμου κλιμάκωσης και η κατάλληλη μείωση των παραμέτρων του μοντέλου (μείγμα εμπειρογνωμόνων). στρατηγική σχεδίασης, μπορεί επίσης να χρησιμοποιηθεί για τη μίξη πολλαπλών μοντέλων (ένα επαγγελματικό μοντέλο για καλύτερη απόδοση) η αρχιτεκτονική βελτιώνει την απόδοση του μοντέλου και μειώνει το κόστος συμπερασμάτων. όταν πρόκειται για την εφαρμογή συγκεκριμένων επιχειρηματικών στρατηγικών, υπάρχουν δύο επιλογές.

  • πρώτον, βελτιώστε την απόδοση του μοντέλου και μειώστε το μέγεθος του μοντέλου αυξάνοντας την ποιότητα/ποσότητα δεδομένων, βελτιστοποιώντας τους αλγόριθμους και την αρχιτεκτονική. αυτό μπορεί να μειώσει αποτελεσματικά την κατανάλωση υπολογιστικής ισχύος, να βελτιώσει τα κύρια αποτελέσματα της εφαρμογής και να προσαρμοστεί στην κύρια ζήτηση της αγοράς.

  • δεύτερον, υιοθετήστε μια πιο ακριβή και τμηματοποιημένη στρατηγική προϊόντος μοντέλου. αντί να βασίζεστε σε λίγα μοντέλα για την επίλυση όλων των προβλημάτων, αφήστε διαφορετικά μοντέλα να λύσουν διαφορετικά προβλήματα. για παράδειγμα, αφήστε το οικονομικό μοντέλο να φτάσει στην οικονομική αγορά και αφήστε το μοντέλο υψηλής ποιότητας να φτάσει στην αγορά υψηλής τεχνολογίας.

τα τρία μοντέλα του openai φέτος, τα gpt-4, gpt-4turbo και gpt-4o, έχουν εξελιχθεί σε αυτήν τη γραμμή σκέψης. οι παράμετροι του μοντέλου του gpt-4o είναι μικρότερες από το gpt-4, αλλά μπορεί να λύσει με ακρίβεια τα περισσότερα καθημερινά προβλήματα. το gpt-4 turbo χρησιμοποιείται για την επίλυση πιο δύσκολων προβλημάτων. η πιο πρόσφατη προεπισκόπηση του openai έχει την πιο ισχυρή απόδοση και δεν είναι πλέον ούτε ένα μεμονωμένο μοντέλο. οι τιμές παραγωγής ενός εκατομμυρίου tokens για αυτά τα τρία μοντέλα είναι αντίστοιχα 70 γιουάν, 210 γιουάν και 420 γιουάν (οι τιμές που αναφέρονται στον επίσημο ιστότοπο openai είναι 10 δολάρια ηπα, 30 δολάρια ηπα και 60 δολάρια ηπα, οι οποίες έχουν μετατραπεί βάσει στη συναλλαγματική ισοτιμία του δολαρίου ηπα και του rmb 1:7).

νοκ άουτ επιτάχυνση

ο πόλεμος τιμών με αρνητικό μικτό κέρδος επιταχύνει την εξάλειψη της μεγάλης αγοράς μοντέλων. πολλοί γνώστες του κλάδου εξέφρασαν την ίδια άποψη στην caijing αυτός ο γύρος εξάλειψης θα διαρκέσει για ένα ή δύο χρόνια και μόνο 3-5 εταιρείες βασικού μοντέλου μπορούν να συνεχίσουν να επιβιώνουν.

ένα xiaopeng, εκτελεστικό μέλος της china informatization committee of 100 και διευθυντής του alibaba cloud intelligent technology research center, είπε στο caijing τον ιούλιο του τρέχοντος έτους ότι τα μεγάλα μοντέλα απαιτούν συνεχείς επενδύσεις, τη δυνατότητα να έχουν 10.000 ή ακόμα και 100.000 κάρτες και εμπορικές αποδόσεις. πολλές εταιρείες δεν έχουν τέτοιες δυνατότητες. στο μέλλον, θα υπάρχουν μόνο τρεις ή πέντε βασικοί κατασκευαστές μοντέλων στην κινεζική αγορά.

η ανάπτυξη μεγάλων μοντέλων απαιτεί την αγορά τσιπ και διακομιστών και μίσθωση γης για την κατασκευή κέντρων δεδομένων. αυτή η επένδυση μπορεί να φτάσει ακόμη και τα δεκάδες δισεκατομμύρια γιουάν ετησίως. το κόστος αυτό θα αντικατοπτρίζεται στις κεφαλαιουχικές δαπάνες των εταιρειών τεχνολογίας. η πρόσκληση κερδών του τέταρτου τριμήνου της microsoft για το οικονομικό έτος 2024 αποκάλυψε ότι σχεδόν το σύνολο των κεφαλαιουχικών δαπανών των 19 δισεκατομμυρίων δολαρίων ηπα για αυτόν τον μήνα δαπανήθηκε για υπολογιστική ισχύ. το περασμένο έτος (από το τρίτο τρίμηνο του 2023 έως το δεύτερο τρίμηνο του 2024), οι κεφαλαιουχικές δαπάνες των alibaba, tencent και baidu έφτασαν τα 23,2 δισεκατομμύρια γιουάν, 23,1 δισεκατομμύρια γιουάν και 11,3 δισεκατομμύρια γιουάν αντίστοιχα, σημειώνοντας αύξηση 77,1%. 154,1% και 46,9% αντίστοιχα.

εκτός από τα δεκάδες δισεκατομμύρια γιουάν σε συνεχείς επενδύσεις στην υπολογιστική ισχύ, η μεγάλη επιχείρηση συμπερασμάτων μοντέλων απαιτεί επίσης επιδοτήσεις ενός δισεκατομμυρίου γιουάν ετησίως. ένα στέλεχος από έναν κινέζο προμηθευτή cloud ανέλυσε ότι το αρνητικό μικτό περιθώριο κέρδους για μεγάλες κλήσεις μοντέλου σημαίνει ότι όσο περισσότερες κλήσεις γίνονται βραχυπρόθεσμα, τόσο μεγαλύτερες θα είναι οι απώλειες. σύμφωνα με την τρέχουσα κατανάλωση υπολογιστικής ισχύος συμπερασμάτων, αρκετοί κορυφαίοι προμηθευτές cloud που συμμετέχουν στον πόλεμο τιμών θα επιδοτήσουν την κατανάλωση υπολογιστικής ισχύος συμπερασμάτων μεγάλων μοντέλων κατά περισσότερο από ένα δισεκατομμύριο γιουάν το 2024.

το alibaba cloud, το volcano engine, το baidu smart cloud και το tencent cloud μπορούν να βασιστούν στο μεγάλο μοντέλο του ομίλου για την καταπολέμηση των πολέμων τιμών, αλλά είναι δύσκολο για μεγάλες νεοσύστατες εταιρείες μοντέλων να επιμείνουν. οι προαναφερθέντες στρατηγικοί σχεδιαστές τεχνητής νοημοσύνης των κορυφαίων εταιρειών τεχνολογίας της κίνας πιστεύουν ότι η alibaba cloud και η volcano engine έχουν το ισχυρότερο αίμα σε αυτόν τον γύρο των πολέμων τιμών. η alibaba μπορεί να κερδίσει χρήματα από το cloud και η volcano engine έχει τη διαφημιστική επιχείρηση της bytedance ως μετάγγιση αίματος. σε έναν πόλεμο τιμών, το baidu δεν είναι τόσο καλό όσο το alibaba και το bytedance. ωστόσο, το μεγάλο μοντέλο wenxin της baidu διαθέτει ισχυρή τεχνολογία και θα έχει μια ομάδα πελατών πρόθυμων να πληρώσουν για την τεχνολογία. αυτό θα βοηθήσει την baidu να επιβιώσει από τον πόλεμο τιμών.

οι μεγάλες νεοσύστατες εταιρείες πρέπει να βασίζονται σε μεγάλους κατασκευαστές και χρηματοδότηση για να επιβιώσουν βραχυπρόθεσμα. ένα τεχνικό πρόσωπο από μια μεγάλη εταιρεία εκκίνησης μοντέλων είπε στην caijing τον σεπτέμβριο του τρέχοντος έτους ότι οι zhipu ai, baichuan intelligence, dark side of the moon, zero one thing και minimax, οι "πέντε μικροί τίγρηδες" των εγχώριων μεγάλων μοντέλων, είναι όλα επενδυμένα. από την alibaba. μία από τις επενδυτικές μεθόδους είναι ότι το ποσό της επένδυσης καταβάλλεται με τη μορφή υπολογιστικής ισχύος και η επενδυμένη εταιρεία χρησιμοποιεί την υπολογιστική ισχύ του alibaba cloud. το αν οι «πέντε μικρές τίγρεις» μπορούν να συνεχίσουν να επιβιώνουν εξαρτάται σε κάποιο βαθμό από το αν ο αλί θα συνεχίσει να επενδύει.

το τεχνικό προσωπικό των προαναφερθέντων κορυφαίων προμηθευτών cloud και το τεχνικό προσωπικό των προαναφερθέντων μεγάλων εταιρειών εκκίνησης πιστεύουν επίσης ότι οι νεοσύστατες εταιρείες μεγάλων μοντέλων στην κινεζική αγορά θα αντιμετωπίσουν δοκιμές τα επόμενα δύο χρόνια μπορεί να υπάρχουν τρεις διέξοδοι στο μέλλον - είτε για να γίνετε μια εταιρεία ανάπτυξης μοντέλων κυβερνητικών και επιχειρηματικών έργων, πρέπει είτε να στραφείτε στο μοντέλο της κάθετης βιομηχανίας to b είτε στην αγορά εφαρμογών to. ντο. στην πραγματικότητα, η διαφοροποίηση της αγοράς έχει ήδη αρχίσει. το zhipu ai κερδίζει μεγάλο αριθμό προσφορών για κυβερνητικά και επιχειρηματικά έργα, ενώ το dark side of the moon εστιάζει μόνο στην αγορά to c.

συντάκτης |. qin lixin