νέα

Το Llama3.1 δεν μπορεί να πωληθεί καθόλου! Industry Industry: Το κόστος των μοντέλων ανοιχτού κώδικα είναι υψηλότερο

2024-08-27

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

Ο Yunzhong καταγόταν από τον ναό Aofei
Qubits | Δημόσιος λογαριασμός QbitAI

Το μεγάλο μοντέλο ανοιχτού κώδικα Llama 3 της Meta ήταν υποτονικό στην αγορά, εντείνοντας περαιτέρω την εστίαση στη συζήτηση μεταξύ ανοιχτού κώδικα και κλειστού κώδικα για μεγάλα μοντέλα.

Σύμφωνα με τα ξένα μέσα ενημέρωσης The Information, το μεγάλο μοντέλο ανοιχτού κώδικα Llama 3 της Meta ήταν δύσκολο να κερδίσει την προσοχή από το AWS της Amazon, τον μεγαλύτερο προμηθευτή cloud στον κόσμοΠροτιμήστε να χρησιμοποιήσετε το μεγάλο μοντέλο Claude κλειστού κώδικα της Anthropic

Σύμφωνα με τα μέλη της Microsoft,Το Llama δεν είναι επίσης η κορυφαία επιλογή πωλήσεων της Microsoft, είναι πιο πιθανό να συστήσουν το Llama σε εταιρείες με εξειδίκευση στα δεδομένα, όπως εταιρείες με μηχανικούς και επιστήμονες δεδομένων εσωτερικού.

Η Meta αντιμετωπίζει τώρα προκλήσεις, οι οποίες μπορεί να εμπνεύσουν τη Meta να δημιουργήσει τη δική της ομάδα πωλήσεων για προϊόντα τεχνητής νοημοσύνης για να καλύψει τις ανάγκες των επιχειρήσεων. Αυτή η σειρά προβλημάτων υπογραμμίζει επίσης τις δυσκολίες στη διαδικασία εμπορευματοποίησης μεγάλων μοντέλων ανοιχτού κώδικα. Από την άποψη της επιλογής της αγοράς, τα πραγματικά αποτελέσματα και οι εμπορικές αποδόσεις του μοντέλου ανοιχτού κώδικα ενδέχεται να μην ανταποκρίνονται στις προσδοκίες των εταιρικών πελατών.

πρόσωπο"Ανοιχτού κώδικα ή κλειστού κώδικα" Για το θέμα, οι μεγάλοι εγχώριοι κατασκευαστές μοντέλων έχουν διαμορφώσει εντελώς διαφορετικές θέσεις με βάση τις δικές τους τεχνικές διαδρομές και επιχειρηματικές στρατηγικές. Λοιπόν, πώς πρέπει οι εταιρείες να επιλέγουν μεγάλα μοντέλα και πώς να βρουν την καλύτερη ισορροπία μεταξύ των δύο;

Στο πλαίσιο αυτό,Xin Zhou, Γενικός Διευθυντής Baidu Intelligent Cloud AI και Large Model PlatformΠήρε συνέντευξη από τα μέσα ενημέρωσης και ανέλυσε λεπτομερώς την υποκείμενη λογική, τις επιχειρηματικές στρατηγικές και τις προβλέψεις της μελλοντικής αγοράς στη συζήτηση μεταξύ ανοιχτού κώδικα και κλειστού κώδικα.

Ο Xinzhou πιστεύει ότι,Υπάρχει μια ουσιαστική διαφορά μεταξύ ανοιχτού κώδικα μεγάλων μοντέλων και λογισμικού ανοιχτού κώδικα——Επειδή το μοντέλο ανοιχτού κώδικα δεν ανοίγει τον πηγαίο κώδικα εκπαίδευσης, τα δεδομένα προεκπαίδευσης και λεπτομέρειας και άλλες βασικές πληροφορίες που επηρεάζουν το αποτέλεσμα του μοντέλου, δεν μπορεί να βασίζεται στη συμμετοχή προγραμματιστών κοινότητας για τη βελτίωση του εφέ και της απόδοσης όπως το λογισμικό ανοιχτού κώδικα Ωστόσο, η εκπαίδευση του βασικού μοντέλου μπορεί να είναι μόνο στα χέρια των ίδιων των κατασκευαστών.

Μιλώντας για το "ποιος είναι πιο ακριβός, το μοντέλο ανοιχτού κώδικα ή το μοντέλο κλειστού κώδικα, ο Xin Zhou είπε ότι το μοντέλο ανοιχτού κώδικα είναι δωρεάν και δίνει στους ανθρώπους την εντύπωση χαμηλού κόστους, αλλάΗ εφαρμογή μεγάλων μοντέλων δεν είναι απλώς μια ενιαία τεχνολογία, αλλά μια ολοκληρωμένη λύση που καλύπτει «τεχνολογία + υπηρεσίες», και οι επιχειρήσεις πρέπει να υπολογίζουν το «γενικό καθολικό». Όταν η επιχείρηση υλοποιηθεί πραγματικά, εάν το μοντέλο ανοιχτού κώδικα θέλει να επιτύχει το ίδιο αποτέλεσμα με το μοντέλο κλειστού κώδικα, θα απαιτήσει μεγάλο ποσό μετέπειτα επένδυσης σε ανθρώπινο δυναμικό, χρήματα και χρόνο και το συνολικό κόστος θα είναι υψηλότερο.

Για ποια σενάρια είναι κατάλληλα τα μοντέλα ανοιχτού κώδικα και κλειστού κώδικα; Ο Xinzhou πιστεύει ότι,Το μοντέλο ανοιχτού κώδικα είναι πιο κατάλληλο για ακαδημαϊκή έρευνα, αλλά δεν είναι κατάλληλο για μεγάλης κλίμακας εμπορικά έργα που παρέχουν υπηρεσίες στον έξω κόσμο ο πρωταγωνιστής.

"Το μοντέλο ανοιχτού κώδικα δεν είναι φθηνό"

Ακολουθεί το επιμελημένο πλήρες κείμενο της συνέντευξης:

1. Στη μεγάλη αγορά μοντέλων, τι ρόλο παίζει κάθε κατασκευαστής μοντέλων; Ποιο είναι το επιχειρηματικό μοντέλο;

Σιν Ζου: Σε αυτή τη γιορτή μεγάλων μοντέλων, η τοποθέτηση και το επιχειρηματικό μοντέλο κάθε κατασκευαστή είναι διαφορετικά και μπορούν να χωριστούν χονδρικά σε τρεις κατηγορίες:

Για τον πρώτο τύπο ρόλου, για τους προμηθευτές cloud, το επιχειρηματικό μοντέλο είναι στην πραγματικότητα πουλά υπολογιστικούς πόρους. Μειώστε το κόστος και βελτιώστε την ελαστικότητα των πόρων μέσω κλίμακας για την επίτευξη κερδοφορίας Αυτό είναι το διαρκές μοντέλο των προμηθευτών cloud. Ανεξάρτητα από το αν είναι μοντέλο ανοιχτού κώδικα ή μοντέλο κλειστού κώδικα, εφόσον φιλοξενείται από τον προμηθευτή του cloud, ο προμηθευτής cloud μπορεί να κερδίσει χρήματα.

Ο δεύτερος τύπος ρόλου είναι τόσο ένας προμηθευτής cloud όσο και ένας προμηθευτής μοντέλου. Ελπίζουν να οδηγήσουν τις επιχειρήσεις στο cloud μέσω της χρήσης μοντέλων. Προς το παρόν, το κέρδος από το να βασίζονται αποκλειστικά σε κλήσεις API μοντέλων είναι ακόμα πολύ χαμηλό. Επί του παρόντος, ελπίζουν να καταλάβουν ένα ευνοϊκό μερίδιο της αγοράς και να συνεχίσουν να αναζητούν νέες ευκαιρίες επέκτασης στο μεγάλο τραπέζι μοντέλων.

Ο τρίτος τύπος ρόλου, για τους κατασκευαστές επιχειρηματικών μοντέλων, αφού οι μεγάλοι προμηθευτές cloud ανακοίνωσαν περικοπές στις τιμές των μοντέλων, ο όγκος των κλήσεών τους μειώθηκε απότομα. Το πεδίο των μεγάλων μοντέλων θα μετατραπεί σύντομα σε μια μάχη μεταξύ πολλών μεγάλων προμηθευτών cloud.

2. Γιατί λέγεται ότι «το μοντέλο ανοιχτού κώδικα δεν είναι φθηνό και η τεχνολογία θα γίνεται όλο και πιο πίσω»;

Σιν Ζου: Ας μιλήσουμε πρώτα για το πρόβλημα της καθυστερημένης τεχνολογίας.

Πρώτον, τα μεγάλα μοντέλα ανοιχτού κώδικα δεν μπορούν να βελτιώσουν την απόδοση του μοντέλου.

αντίθεσηλογισμικό ανοιχτού κώδικα, όπως το λειτουργικό σύστημα για κινητά Android και το λογισμικό βάσης δεδομένων MySQL Όλοι οι πηγαίοι κώδικες αυτού του λογισμικού ανοιχτού κώδικα είναι ανοιχτοί και προγραμματιστές από όλη την κοινωνία μπορούν να συμμετέχουν στην ανάπτυξη του κώδικα. Αυτό μπορεί όχι μόνο να μειώσει το κόστος ανάπτυξης λογισμικού, αλλά και να επιταχύνει την επανάληψη λογισμικού και να βελτιώσει την ασφάλεια του λογισμικού Αυτή είναι η αξία του λογισμικού ανοιχτού κώδικα.

Το μοντέλο ανοιχτού κώδικα είναι πολύ πιο περίπλοκο, το οποίο μπορεί να είναι ανοιχτού κώδικα, συμπεριλαμβανομένου του πηγαίου κώδικα εκπαίδευσης μοντέλου, βαρών παραμέτρων, δεδομένων εκπαίδευσης κ.λπ.Ωστόσο, επί του παρόντος, οι κατασκευαστές μοντέλων συνήθως βαραίνουν μόνο τις παραμέτρους ανοιχτού κώδικα, αλλά ο πηγαίος κώδικας εκπαίδευσης, τα δεδομένα εκπαίδευσης κ.λπ. δεν είναι ανοιχτού κώδικα. Αυτό κάνει τους προγραμματιστές να μην μπορούν να το βελτιώσουν και να συμβάλλουν στην αποτελεσματικότητα του μοντέλου ανοιχτού κώδικα.

Για παράδειγμα, για τον Llama, κάθε βελτίωση στην απόδοση του μοντέλου είναι στην πραγματικότητα το αποτέλεσμα της εκπαίδευσης του ίδιου του Meta, όχι το αποτέλεσμα της συμμετοχής του προγραμματιστή. Δεν υπάρχει μεγάλη διαφορά μεταξύ του Llama2 και του Llama3 όσον αφορά τη δομή του δικτύου Τι βελτιστοποιεί; Από τη μια πλευρά, η διαδικασία της προπόνησης είναι βελτιστοποιημένη, όπως η εκπαίδευση σε πολλά στάδια, από την άλλη, προστίθενται πολλά δεδομένα ο χρόνος φέρνει καλύτερα αποτελέσματα στο μοντέλο.

Αλλά όλα αυτά τα καλά εφέ δημιουργούνται από την ίδια τη Meta και δεν υπάρχει τρόπος να χρησιμοποιήσετε τη δύναμη των προγραμματιστών, πόσο μάλλον τη διαδικασία ανατροφοδότησης της κοινότητας όπως το λογισμικό ανοιχτού κώδικα.

Δεύτερον, το μοντέλο ανοιχτού κώδικα θα υστερεί όλο και περισσότερο επειδή δεν υπάρχει καλό επιχειρηματικό μοντέλο που να διασφαλίζει τη συνεχή επανάληψη του μοντέλου.

Η εκπαίδευση μοντέλων και ο σχολιασμός δεδομένων είναι πολύ δαπανηροί, εκτός εάν υπάρχουν ισχυροί εταιρικοί πόροι όπως η Meta για την υποστήριξη της βιώσιμης ανάπτυξης μοντέλων ανοιχτού κώδικα, εάν είναι μια νεοσύστατη εταιρεία με μοντέλα ανοιχτού κώδικα, δεν θα είναι σε θέση να δημιουργήσει μια κλειστή επιχείρηση. βρόχος. Ταυτόχρονα, οι προγραμματιστές δεν μπορούν να συμβάλουν στην αποτελεσματικότητα του μοντέλου σας, επομένως οι νεοφυείς επιχειρήσεις πρέπει να μένουν πίσω όλο και περισσότερο όταν το κάνουν αυτό. Κρίνοντας από τα αποτελέσματα, το καλύτερο μοντέλο είναι στην πραγματικότητα το Open AI και τα μοντέλα στην κορυφή της τρέχουσας λίστας αξιολόγησης είναι όλα μοντέλα κλειστού κώδικα.

Ας μιλήσουμε για το γιατί το μοντέλο ανοιχτού κώδικα δεν είναι φθηνό.Η εφαρμογή μεγάλων μοντέλων είναι μια ολοκληρωμένη λύση που καλύπτει "τεχνολογία + υπηρεσίες".. Πώς να υπολογίσετε το γενικό καθολικό;

Το πρώτο επίπεδο είναι ο υπολογισμός του κόστους των πόρων υλικού.. Επειδή τα επιχειρηματικά μοντέλα κλειστού κώδικα θα είναι εξοπλισμένα με αντίστοιχες αλυσίδες εργαλείων, συμπεριλαμβανομένων αλυσίδων εργαλείων εκπαίδευσης και αλυσίδων εργαλείων συμπερασμάτων, η απόδοση αυτών των αλυσίδων εργαλείων είναι καλύτερη από εκείνες ανοιχτού κώδικα Για τους πελάτες, η εκπαίδευση μπορεί να εξοικονομήσει περίπου 10~20% του κόστους υλικού. , εξοικονομείτε περισσότερα όταν συλλογίζεστε και όσο μεγαλύτερη είναι η επιχειρηματική κλίμακα, τόσο περισσότερο εξοικονομείτε.

Το δεύτερο επίπεδο είναι να εξετάσουμε τα επιχειρηματικά οφέλη που προσφέρει το μοντέλο. Για μοντέλα με την ίδια κλίμακα παραμέτρων, τα αποτελέσματα κλειστού κώδικα είναι καλύτερα. Ορισμένοι πελάτες δεν είναι τόσο ευαίσθητοι στην ακρίβεια 90% ή 95%. Ωστόσο, υπάρχουν ορισμένες επιχειρήσεις, όπως η εμπορική διαφήμιση, όπου το CPM και το CTR απέχουν μόνο ένα σημείο μεταξύ τους πιο πρόθυμοι να πάω Αγοράστε ένα μοντέλο κλειστού κώδικα που λειτουργεί καλύτερα.

Το τρίτο επίπεδο περιλαμβάνει το κόστος ευκαιρίας και το κόστος εργασίας.. Εάν χρησιμοποιείτε ένα επιχειρηματικό μοντέλο κλειστού κώδικα για να συγκλίνετε πιο γρήγορα, μπορείτε να λανσάρετε νέα προϊόντα πιο γρήγορα από τους ανταγωνιστές σας. Σε ένα επιχειρηματικό μοντέλο κλειστού κώδικα, ο κατασκευαστής έχει προσαρμόσει το μοντέλο και το υλικό στη βέλτιστη κατάσταση και οι πελάτες μπορούν απλώς να αντιγράψουν την ώριμη εμπειρία. Αλλά αν χρησιμοποιείτε ανοιχτό κώδικα, πρέπει να το προσαρμόσετε μόνοι σας και το κόστος της υπολογιστικής ισχύος και των μηχανικών θα είναι υψηλότερο.

Επομένως, λέμε ότι τα μοντέλα εταιρικών εφαρμογών πρέπει να "υπολογίσουν το γενικό καθολικό" και ο υπολογισμός αυτού του γενικού καθολικού θα είναι πολύ διαφορετικός.

3. Γιατί ο ανοιχτός κώδικας είναι τόσο πιο ακριβός από τον κλειστό κώδικα όσον αφορά το κόστος υλικού;
Σιν Ζου: Οι περισσότεροι εταιρικοί πελάτες θα αγοράσουν δύο ή περισσότερους τύπους υλικού, επειδή πρέπει να λάβουν υπόψη την ασφάλεια και την ευελιξία της αλυσίδας εφοδιασμού Εάν το μοντέλο ανοιχτού κώδικα πρέπει να προσαρμοστεί σε κάθε κομμάτι υλικού, το κόστος θα είναι πολύ υψηλό.

Αυτό αντανακλά τα πλεονεκτήματα του επιχειρηματικού μοντέλου κλειστού κώδικα, επειδή μπορεί να μοιραστεί το κόστος προσαρμογής λογισμικού και υλικού μέσω πωλήσεων μεγάλης κλίμακας. Επιπλέον, η προσαρμογή πολλαπλών πυρήνων είναι ένα πολύ τεχνικό θέμα της BaiduBaige Heterogeneous Computing PlatformΠολλές βελτιστοποιήσεις έχουν γίνει ειδικά για την ετερογένεια πολλαπλών πυρήνων και είναι κατάλληλο για διάφορα υλικά. Το ίδιο το Baige μπορεί να καλύψει διάφορες διαφορές στο επίπεδο υλικού. Υπάρχουν πολλές βιβλιοθήκες επιτάχυνσης, βιβλιοθήκες συμπερασμάτων και βιβλιοθήκες εκπαίδευσης.

Το πλεονέκτημα αυτού για τους πελάτες είναι ότι μπορούν να λειτουργούν γρήγορα ανεξάρτητα από το υλικό που χρησιμοποιούν και ο χρόνος και το κόστος εργασίας που εξοικονομείται είναι πολύ υψηλά.

4. Σε ποια σενάρια είναι κατάλληλα το μοντέλο ανοιχτού κώδικα και το μοντέλο κλειστού κώδικα αντίστοιχα;

Σιν Ζου: Η γενική ιδέα είναι: εάν θέλετε να δοκιμάσετε και να επαληθεύσετε σε μεμονωμένα επιχειρηματικά σενάρια, μπορείτε πρώτα να το εκτελέσετε με ένα μοντέλο κλειστού κώδικα, να το εκτελέσετε και να το επαληθεύσετε γρήγορα σε ορισμένες σοβαρές επιχειρήσεις που κοστίζουν εκατομμύρια ή δεκάδων εκατομμυρίων δολαρίων, Σε έργα που απαιτούν υψηλή κλίμακα και ακρίβεια, τα επιχειρηματικά μοντέλα κλειστού κώδικα εξακολουθούν να είναι η καλύτερη επιλογή για τις επιχειρήσεις. Μόνο σε ορισμένα επιχειρηματικά σενάρια που δεν έχουν υψηλές απαιτήσεις σε εφέ και απόδοση, αλλά απαιτούν ιδιωτική ανάπτυξη και είναι ιδιαίτερα ευαίσθητα στις τιμές, εξετάστε το ενδεχόμενο να χρησιμοποιήσετε το μοντέλο ανοιχτού κώδικα.

Ο ανοιχτός κώδικας είναι πολύτιμος για την προώθηση της ακαδημαϊκής και της έρευνας, όπως η βελτιστοποίηση της απόδοσης των μηχανικών συμπερασμάτων, ο αντίκτυπος των δεδομένων προεκπαίδευσης και λεπτομέρειας στα αποτελέσματα, κ.λπ. και τελειοποίηση των οδηγιών Τα δεδομένα και ούτω καθεξής είναι επίσης ανοιχτά και η αξία τους για την ακαδημαϊκή έρευνα και την τεχνολογική ανάπτυξη θα είναι μεγαλύτερη. Ακόμα κι αν ανοίξουν μόνο τα βάρη του μοντέλου, παρέχει στους ερευνητές ένα καλό βασικό μοντέλο.

5. Μερικοί κατασκευαστές ελπίζουν ότι μπορούν να επιδιωχθούν ταυτόχρονα και ανοιχτού κώδικα και κλειστού κώδικα, δηλαδή, το μοντέλο ανοιχτού κώδικα προσελκύει τους χρήστες να επεκτείνουν το οικοσύστημα, ενώ το μοντέλο κλειστού κώδικα είναι υπεύθυνο για την εμπορευματοποίηση;

Σιν Ζου: Αν δεν το έχετε εξασκήσει, φαίνεται εφικτό. Η πραγματικότητα όμως είναι:

Στο δημόσιο νέφος, μεταξύ των κλήσεων που ανακοινώθηκαν από διάφορους κατασκευαστές, ο όγκος κλήσεων του μοντέλου κλειστού κώδικα είναι πολύ υψηλότερος από αυτόν του μοντέλου ανοιχτού κώδικα, γεγονός που δείχνει ότι το μοντέλο ανοιχτού κώδικα δεν παίζει πραγματικά ρόλο στην προσέλκυση χρήστες να επεκτείνουν το οικοσύστημα στο δημόσιο cloud.. Επιπλέον, για τη λεπτομέρεια στο δημόσιο cloud, μπορούν να εφαρμοστούν μοντέλα ανοιχτού και κλειστού κώδικα, έτσι οι πελάτες θα επιλέξουν απευθείας το καλύτερο μοντέλο στο δημόσιο cloud.

Όσον αφορά την ιδιωτικοποιημένη ανάπτυξη, αυτή η λογική έχει νόημα ως ένα βαθμό.. Πολλές εταιρείες ξεκινούν πρώτα με μοντέλα ανοιχτού κώδικα για δοκιμή. Αργότερα βρίσκουν ότι τα αποτελέσματα είναι καλά και θέλουν να τα αγοράσουν Σε αυτή την περίπτωση, αυτή η λογική ισχύει.Αλλά αυτή η τιμή σταδιακά συρρικνώνεται. Επειδή οι γενικές δυνατότητες των μοντέλων κάθε κατασκευαστή βελτιώνονται γρήγορα, το κόστος μεταγωγής γίνεται όλο και χαμηλότερο, εξαλείφοντας σταδιακά την κληρονομιά αυτού του μοντέλου.

Υπάρχουν επίσης ορισμένοι κατασκευαστές που λανσάρουν μοντέλα ανοιχτού κώδικα για να προωθήσουν το υλικό. Για παράδειγμα, η Nvidia λανσάρει ένα μοντέλο ανοιχτού κώδικα.

6. Γιατί η Baidu δεν κυκλοφόρησε ένα μοντέλο ανοιχτού κώδικα;

Xin Zhou: Έχει φανεί ξεκάθαρα από τον όγκο ανάπτυξης διαφόρων κατασκευαστών ότι τα εμπορικά μοντέλα κλειστού κώδικα με τον μεγαλύτερο όγκο ανάπτυξης στο δημόσιο cloud δεν έχουν μεγάλη επίδραση στο δημόσιο cloud.

Στην ιδιωτικοποιημένη αγορά, καθώς η ευαισθητοποίηση των πελατών για τα μεγάλα μοντέλα συνεχίζει να βελτιώνεται, ο ανοιχτός κώδικας και ο κλειστός κώδικας σταδιακά δεν αποτελούν πλέον βασικό παράγοντα.. Μετά την επικοινωνία με πολλούς πελάτες μεγάλων επιχειρήσεων, διαπίστωσα ότι υπάρχουν πολλοί παράγοντες που καθορίζουν εάν οι ηγέτες των επιχειρήσεων πρέπει να χρησιμοποιούν ένα μοντέλο Η σειρά προτεραιότητας είναι συνήθως: αποτέλεσμα, απόδοση, ασφάλεια και τιμή. Το αν ένα μοντέλο είναι ανοιχτού κώδικα ή κλειστού κώδικα δεν είναι καθοριστικός παράγοντας.

7. Αναφέρατε ότι τα πιο σημαντικά πράγματα για τις επιχειρήσεις κατά την επιλογή μοντέλων είναι το αποτέλεσμα, η απόδοση, η ασφάλεια και η τιμή. μηχανήματα υπολογιστών;

Σιν Ζου: Προς το παρόν, η χρήση μεγάλων μοντέλων από επιχειρήσεις βρίσκεται ακόμη στο στάδιο της διερεύνησης και υπάρχει έντονη ανάγκη για προϊόντα χαμηλού κόστους, εκτός συσκευασίας, για την ταχεία επαλήθευση των σεναρίων χρήσης και των επιπτώσεων μεγάλων μοντέλων. Το "Qianfan Large Model All-in-one Machine" είναι πολύ κατάλληλο για το τρέχον στάδιο, επειδή υπάρχουν πολλές απαιτήσεις για ιδιωτικοποιημένη εγκατάσταση στην Κίνα Όλα τα κύρια προϊόντα της αγοράς. Το μεγάλο μοντέλο all-in-one μηχάνημα Qianfan της Baidu Smart Cloud παρέχει δύο δυνατότητες:

Πρώτον, παρέχετε μια ολοκληρωμένη πλατφόρμα για προσαρμογή λογισμικού και υλικού, αυτή η πλατφόρμα έχει ενσωματωμένα μεγάλα μοντέλα Wenxin και τα μεγάλα μοντέλα ανοιχτού κώδικα του κλάδου και τα δείγματα εφαρμογών σεναρίων. Τα δημοφιλή μοντέλα ανοιχτού κώδικα έχουν επίσης προσαρμοστεί και βελτιστοποιηθεί. Οι χρήστες μπορούν να τα εκτελούν απευθείας στο μηχάνημα all-in-one χωρίς να χρειάζεται να προσαρμόσουν τα ίδια τα μοντέλα. Ταυτόχρονα, το μεγάλο μοντέλο all-in-one μηχάνημα της Qianfan μπορεί να παρέχει ολοκληρωμένες λύσεις λογισμικού και υλικού μεγάλου μοντέλου από βασική διαχείριση και έλεγχο, πλαίσιο AI, εκπαίδευση μοντέλων, προγνωστική λογική και εφαρμογή σεναρίων, παρέχοντας στους πελάτες λογισμικό πλήρους διαδικασίας και υπηρεσίες υλικού.

δεύτεροςΤο μηχάνημα όλα-σε-ένα μεγάλου μοντέλου Qianfan είναι πολύ οικονομικό λόγω της βελτιστοποίησης της απόδοσης από άκρο σε άκρο και της ικανότητας να συμπιέζει όλη την απόδοση του υλικού. Οι πελάτες μπορούν να το χρησιμοποιήσουν γρήγορα και με χαμηλότερο κόστος.

Όσον αφορά τη συνολική τιμή, η τιμή του μηχανήματος όλα σε ένα Qianfan είναι πολύ χαμηλότερη από την αγορά του διακομιστή, του μεγάλου μοντέλου και της πλατφόρμας για τους πελάτες, μπορεί να χρησιμοποιηθεί αμέσως.

8. Σήμερα, πολλοί άνθρωποι πιστεύουν ότι δεν αρκεί να χρησιμοποιούμε απλώς βασικά μεγάλα μοντέλα Χρειάζεται ακόμα να κατασκευάζουμε βιομηχανικά μοντέλα για να πραγματοποιήσουμε πραγματικά τη βιομηχανική εφαρμογή μεγάλων μοντέλων. Πόσο κοστίζει λοιπόν αυτή τη στιγμή για μια επιχείρηση να εκπαιδεύσει από μόνη της ένα μοντέλο βιομηχανίας;

Σιν Ζου: Το κόστος είναι πολύ υψηλό. Πρώτον, αυτό το κόστος αυξάνεται γραμμικά ανάλογα με το μέγεθος της παραμέτρου του μοντέλου που πρόκειται να εκπαιδευτεί. Δεύτερον, εξαρτάται από το πόσο μεγάλος είναι ο όγκος δεδομένων. Τέλος, υπάρχει το κόστος επισήμανσης των δεδομένων σας.

Εάν θέλετε να εκπαιδεύσετε ένα μοντέλο 70b από την αρχή, μπορεί να χρειαστείτε 30 εκατομμύρια πόρους ελαστικού νέφους. Εάν θέλετε να εκπαιδεύσετε ένα μοντέλο με μεγαλύτερο αριθμό παραμέτρων, το κόστος μπορεί να είναι εκατοντάδες εκατομμύρια. Αυτό θα πρέπει να εκπαιδεύεται από έμπειρους ανθρώπους.

9. Με τόσο υψηλό κόστος, πώς μπορεί μια εταιρεία να καθορίσει εάν χρειάζεται να δημιουργήσει ένα μοντέλο βιομηχανίας;

Σιν Ζου: Δεν συνιστούμε στους πελάτες να κατασκευάζουν ένα βασικό μοντέλο βιομηχανίας από την αρχή ανεξάρτητα από το κέρδος Το κόστος πρέπει να είναι πολύ υψηλό ανεξάρτητα από τα οφέλη. Θα βοηθήσουμε τους πελάτες να αναλύσουν πρώτα τις ανάγκες τους.

Για παράδειγμα, αν σχεδιάσετε ένα σύστημα συντεταγμένων, η τετμημένη είναι η ευαισθησία της εργασίας και η τεταγμένη είναι η ζήτηση για δεδομένα του κλάδου. Η λεγόμενη ευαισθησία της εργασίας αναφέρεται στο αν το σενάριο σχετίζεται στενά με τον κλάδο και τις επιχειρήσεις. Για παράδειγμα, στον ιατρικό τομέα, αυτά είναι αρκετά επαγγελματικά ζητήματα. Ο κάθετος άξονας είναι η ζήτηση για δεδομένα του κλάδου Όσο πιο κλειστός είναι ο κλάδος και όσο λιγότερα δεδομένα υπάρχουν στο δημόσιο δίκτυο, τόσο περισσότερη προεκπαίδευση απαιτείται. Για παράδειγμα, στον ιατρικό τομέα, ορισμένες απευαισθητοποιημένες πληροφορίες ιατρικού φακέλου πρέπει να είναι προεκπαιδευμένες στο μοντέλο.

Μέσω της ανάλυσης, σε αυτόν τον άξονα συντεταγμένων, η κάτω αριστερή γωνία δεν έχει χαρακτηριστικά κλάδου και δεν απαιτεί δεδομένα του κλάδου, επομένως το γενικό μοντέλο μπορεί να χρησιμοποιηθεί απευθείας, αλλά η επάνω δεξιά γωνία είναι ευαίσθητη στα επιχειρηματικά χαρακτηριστικά αυτού του κλάδου και απαιτεί πολλά των δεδομένων του κλάδου Αυτή είναι η ώρα να οικοδομήσουμε ένα μοντέλο του κλάδου.

Συνήθως συνιστούμε στις εταιρείες να κάνουν τρία βήματα.

Το πρώτο βήμα είναι η επαλήθευση αξίας. Κατασκευάστε προκαταρκτικά υποδομή λογισμικού και υλικού μοντέλων μεγάλης κλίμακας και δημιουργήστε ένα προκαταρκτικό βιομηχανικό μοντέλο μεγάλης κλίμακας. Σε συνδυασμό με την εφαρμογή μιας σχετικά ώριμης γενετικής τεχνητής νοημοσύνης, τα αποτελέσματα μπορούν να φανούν γρήγορα. Για παράδειγμα, μέσω της ελαφριάς έκδοσης της πλατφόρμας μεγάλων μοντέλων Qianfan, προστίθενται ώριμες εφαρμογές όπως η έξυπνη εξυπηρέτηση πελατών, η διαχείριση επιχειρηματικής γνώσης και οι ψηφιακοί άνθρωποι.

Το δεύτερο βήμα είναι η βαθιά σύνδεση διαφόρων εφαρμογών της επιχείρησης. Η μεγάλη υποδομή μοντέλων έχει βελτιωθεί περαιτέρω και αναβαθμιστεί σε Qianfan Large Model Ultimate Edition Εκτός από την εκπαίδευση και τη ρύθμιση που σχετίζεται με μεγάλα μοντέλα, περιλαμβάνει επίσης μια πλατφόρμα για την κατασκευή εφαρμογών. Η Baidu και οι οικολογικοί εταίροι της ασχολούνται βαθιά με την εκπαίδευση και τη λειτουργία μοντέλων μεγάλης κλίμακας εντός της εταιρείας, τη δημιουργία τεχνικής ατμόσφαιρας, την εκπαίδευση σχετικών ταλέντων και τη συνεργασία με την εταιρεία για την επίλυση δύσκολων επιχειρηματικών προβλημάτων και την αύξηση της αξίας στην εταιρεία.

Το τρίτο βήμα είναι η ολοκληρωμένη καινοτομία και η ανεξάρτητη δυνατότητα ελέγχου. Οι επιχειρήσεις έχουν κατακτήσει τις σχετικές τεχνολογίες ανάπτυξης μεγάλων μοντέλων και εφαρμογών και έχουν επίσης αντίστοιχα κλιμάκια ταλέντων, τα οποία μπορούν να επιτρέψουν καλύτερα την ανεξάρτητη και ελεγχόμενη ανάπτυξη και να ξεκινήσουν ολοκληρωμένη καινοτομία. Η Baidu θα χρησιμεύσει ως μακροπρόθεσμη τεχνική υποστήριξη και σύμβουλος για να βοηθήσει στην ανάπτυξη και να συνεχίσει να φέρνει νέες τεχνολογίες και λύσεις στην επιχείρηση.

10. Πώς κρίνετε τη μεγάλη αγορά μοντέλων την επόμενη χρονιά;

Σιν Ζου: Έχω τρεις κρίσεις για την αναπτυξιακή τάση τον επόμενο χρόνο:

Πρώτον, η πολυτροπικότητα θα γίνει ένα νέο hot spot στην αγορά.

Δεύτερον, θα γίνει μεγάλη έκρηξη σε εφαρμογές που βασίζονται σε μεγάλα μοντέλα, και πολύ σημαντική κατεύθυνση είναι το Agent.. Εάν ένα μεγάλο μοντέλο εκτελεί μόνο τις προδιαγεγραμμένες ενέργειες "εισόδου και εξόδου", θα περιορίσει πολύ την αξία του, θα πρέπει να μοιάζει περισσότερο με ένα ανθρώπινο ον, να μπορεί να χρησιμοποιεί εργαλεία, να συνεργάζεται μεταξύ τους, να σχεδιάζει και να σκέφτεται και να στοχάζεται και να επαναλαμβάνει. . Πρέπει να συνδυαστεί με μια ποικιλία εξαρτημάτων και πρόσθετων για να καλύψει τις ανάγκες συγκεκριμένων επιχειρηματικών σεναρίων, έτσι η Agent θα γίνει το κλειδί για την παραγωγή κάθε κατασκευαστή μοντέλου στο μέλλον.

Τρίτον, θα υπάρξουν περισσότερες ευκαιρίες για εταιρικές εφαρμογές, όπως βάση γνώσεων, εξυπηρέτηση πελατών, ψηφιακά άτομα, βοηθητική σύνταξη κώδικα και άλλα σενάρια.Για παράδειγμα, χρησιμοποιώντας μεγάλα μοντέλα για τη σύνταξη κώδικα, η Baidu έχει ένα προϊόν που ονομάζεται "Wenxin Quick Code", το οποίο έχει χρησιμοποιηθεί ευρέως στο Baidu μπορεί να βοηθήσει τις επιχειρήσεις να έχουν βελτιώσει σημαντικά την αποδοτικότητα της ανάπτυξης. Ταυτόχρονα, θα εμφανιστεί ένας μεγάλος αριθμός εταιρειών που ασχολούνται με την ανάπτυξη εφαρμογών τεχνητής νοημοσύνης. Αυτές οι εταιρείες μπορούν να μειώσουν το κόστος εγκατάστασης και αντιγραφής των εφαρμογών σε αρκετά χαμηλό επίπεδο.