Νέα

Τι μένει από ένα μεγάλο μοντέλο που προσγειώνεται στην άκρη;

2024-08-07

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

Καθώς τα μεγάλα μοντέλα ξεκινούν τη διαδικασία ενδυνάμωσης της βιομηχανίας, η μεγάλης κλίμακας ανάπτυξή τους στην άκρη/πλευρά έχει γίνει κορυφαία προτεραιότητα για περαιτέρω ανάπτυξη. Ωστόσο, η ανάπτυξη στην άκρη/πλευρά είναι σίγουρα πιο ευνοϊκή για την επίτευξη άμεσης απόκρισης και προστασίας της ιδιωτικής ζωής για μεγάλα μοντέλα, αλλά θα αντιμετωπίσει επίσης προκλήσεις όσον αφορά τον κατακερματισμό της υπολογιστικής ισχύος, τα ζητήματα ενεργειακής απόδοσης και τα σενάρια υλοποίησης. Για τις επιχειρήσεις, αυτό είναι και μια δυσκολία και μια ευκαιρία.

Με γνώμονα τις ανάγκες εφαρμογών της βιομηχανίας, τα μεγάλα μοντέλα αναπτύσσονται προς τα άκρα.

Επί του παρόντος, η μεγάλη βιομηχανία μοντέλων της χώρας μου γνωρίζει ταχεία ανάπτυξη. Οι στατιστικές δείχνουν ότι από τα τέλη Μαρτίου, ο αριθμός των μεγάλων μοντέλων που κυκλοφόρησαν στην Κίνα έφτασε τα 117. Ωστόσο, στη διαδικασία ανάπτυξης, σε αντίθεση με τις Ηνωμένες Πολιτείες, οι οποίες επικεντρώνονται σε πρωτότυπες ανακαλύψεις, οι μεγάλες εταιρείες μοντέλων της Κίνας δίνουν μεγαλύτερη έμφαση στην εφαρμογή εφαρμογών. Ο Zhou Hongyi, ιδρυτής και πρόεδρος του Ομίλου 360, είπε σε προηγούμενη ομιλία ότι τα μοντέλα όγκου, η υπολογιστική ισχύς και τα δεδομένα δεν είναι οι μόνες επιλογές για την ανάπτυξη μοντέλων προς τρισεκατομμύρια παραμέτρους. Τα μεγάλα μοντέλα τεχνητής νοημοσύνης έχουν πιο διαφοροποιημένες διαδρομές ανάπτυξης. Ο Li Dahai, συνιδρυτής και Διευθύνων Σύμβουλος της Face Wall Intelligence, τόνισε επίσης τη σημασία των μοντέλων του κλάδου, τα οποία έχουν γίνει πλέον μία από τις σημαντικές τάσεις στην ανάπτυξη.

Εάν θέλετε να ενδυναμώσετε χιλιάδες βιομηχανίες πιο αποτελεσματικά, τα μεγάλα μοντέλα και η σχετική υπολογιστική ισχύς δεν μπορούν να αναπτυχθούν μόνο στο cloud και τα μοντέλα τελικής πλευράς έχουν συγκριτικά πλεονεκτήματα που δεν έχει το cloud. Το πρώτο είναι ότι το μοντέλο της τελικής πλευράς έχει μεγαλύτερη αξιοπιστία. Τα μοντέλα που αναπτύσσονται σε τερματικά μπορούν να αλληλεπιδρούν με το περιβάλλον σε πραγματικό χρόνο και συνεχώς, αλλά είναι δύσκολο για τα μοντέλα cloud να διατηρήσουν αυτή τη συνέχεια. Δεύτερον, το μοντέλο από την πλευρά του πελάτη μπορεί να διασφαλίσει καλύτερα το απόρρητο των χρηστών. Αυτό το ζήτημα έχει προσελκύσει ολοένα και περισσότερους ανθρώπους Εάν τα ρομπότ εισέλθουν ευρέως στο σπίτι στο μέλλον, τα ζητήματα απορρήτου θα γίνουν πιο σοβαρά. Τα πλεονεκτήματα του μοντέλου από την πλευρά του πελάτη στη διασφάλιση του απορρήτου των δεδομένων είναι ακόμη πιο προφανή.



Με βάση αυτή την κατανόηση, ορισμένες εταιρείες υπολογιστών αιχμής έχουν αναλάβει ηγετικό ρόλο στην εφαρμογή σεναρίων γύρω από την τεχνητή νοημοσύνη αιχμής και έχουν εισαγάγει με επιτυχία την τεχνητή νοημοσύνη αιχμής σε πολλαπλά πεδία. Για παράδειγμα, στον τομέα της έξυπνης κατασκευής, η υπολογιστική πλατφόρμα Jetson edge της NVIDIA μπορεί να φέρει τις δυνατότητες υπολογισμού συμπερασμάτων AI σε βιομηχανικά σενάρια και να λύσει προβλήματα όπως ο εντοπισμός ελαττωμάτων και η ευέλικτη κατασκευή στη γραμμή συναρμολόγησης χρησιμοποιώντας οπτική συλλογιστική τεχνητής νοημοσύνης με επιτάχυνση GPU. Οι λύσεις της Intel χρησιμοποιούνται επίσης σε τομείς όπως η έξυπνη παρακολούθηση, η εκπαίδευση και η διδασκαλία και η έξυπνη ιατρική περίθαλψη Μέσω της διαχείρισης διαφόρων συσκευών αιχμής, βοηθούν τις υπηρεσίες πληροφοριών αιχμής να γίνουν πιο ευέλικτες, αποτελεσματικές και ακριβείς.

Η ανάπτυξη μοντέλων αιχμής και τελικής πλευράς οδήγησε επίσης την ανάπτυξη της υπολογιστικής τεχνητής νοημοσύνης αιχμής και η σχετική υπολογιστική ισχύς, τα τσιπ και άλλοι κρίκοι αλυσίδας της βιομηχανίας οδήγησαν σε ένα κύμα ανάπτυξης μεγάλης κλίμακας. Ο Qiu Xiaoxin, ιδρυτής και πρόεδρος της Aixin Yuanzhi, επεσήμανε ότι η πραγματική μεγάλης κλίμακας υλοποίηση μεγάλων μοντέλων απαιτεί τη στενή ενσωμάτωση του cloud, του edge και του end σε τρία επίπεδα υπολογισμού και αντίληψης. Ο Qiu Xiaoxin πιστεύει ότι τα έξυπνα τσιπ και τα πολυτροπικά μεγάλα μοντέλα έχουν γίνει ο «χρυσός συνδυασμός» στην εποχή της τεχνητής νοημοσύνης Όταν τα μεγάλα μοντέλα χρησιμοποιούνται όλο και περισσότερο σε εφαρμογές, πιο οικονομικά, πιο αποτελεσματικά και πιο φιλικά προς το περιβάλλον θα γίνουν οι λέξεις-κλειδιά. έξυπνα τσιπ και εξοπλισμένα με τεχνητή νοημοσύνη Το αποτελεσματικό τσιπ συμπερασμάτων του επεξεργαστή θα είναι μια πιο λογική επιλογή για την υλοποίηση μεγάλων μοντέλων, η οποία είναι επίσης το κλειδί για την προώθηση της τεχνητής νοημοσύνης χωρίς αποκλεισμούς. Η STL Partners προβλέπει ότι έως το 2030, το παγκόσμιο μέγεθος της δυνητικής αγοράς υπολογιστών αιχμής θα αυξηθεί στα 445 δισεκατομμύρια δολάρια ΗΠΑ, με ετήσιο ρυθμό ανάπτυξης σύνθετου κλάδου έως και 48%.

Διαφοροποιημένη ανάπτυξη υπολογιστικής ισχύος για την αντιμετώπιση των προκλήσεων κατακερματισμού

Ωστόσο, η ανάπτυξη μεγάλων μοντέλων στην άκρη/τελική πλευρά δεν μπορεί να επιτευχθεί εν μία νυκτί. Λόγω των περιορισμών υπολογιστικών πόρων των συσκευών ακμής και της ποικιλομορφίας των απαιτήσεων υπολογιστικών πόρων μεγάλων μοντέλων, η ανάπτυξη ακμών θα αντιμετωπίσει πρώτα προκλήσεις όσον αφορά την υπολογιστική ισχύ. Από τη μία πλευρά, οι κατασκευαστές μοντέλων πρέπει να εκτελούν τεχνική επεξεργασία, όπως συμπίεση, κλάδεμα και ποσοτικοποίηση σε μεγάλα μοντέλα, για να μειώσουν το μέγεθος και την υπολογιστική πολυπλοκότητα του μοντέλου, ώστε να μπορεί να προσαρμοστεί στις απαιτήσεις απόδοσης των συσκευών άκρου/άκρου. Από την άλλη πλευρά, πώς να βελτιωθεί η βάση υπολογιστικής ισχύος Η ανάπτυξη των εγκαταστάσεων αποτελεί επίσης εστίαση.

Ο Zhang Yu, επικεφαλής τεχνολογίας του τμήματος Δικτύων και Edge της Intel στην Κίνα, τόνισε ότι καθώς η τεχνητή νοημοσύνη ενδυναμώνει χιλιάδες βιομηχανίες, οι διαφορετικές εφαρμογές έχουν διαφορετικές απαιτήσεις για υπολογιστική ισχύ και το εύρος είναι πολύ μεγάλο. Όσες έχουν απαιτήσεις υψηλών επιδόσεων πρέπει να φιλοξενούνται από ένα σύμπλεγμα υπολογιστικής ισχύος, ενώ μπορούν να χρησιμοποιηθούν μία ή περισσότερες συσκευές με χαμηλές απαιτήσεις υπολογιστικής ισχύος. Ο Yang Lei, διευθυντής προϊόντων της Arm Technology, είπε επίσης ότι όταν αναπτύσσει τόσο μεγάλα μοντέλα τεχνητής νοημοσύνης σε τερματικά, εξακολουθεί να αντιμετωπίζει πολλαπλές προκλήσεις όπως το κόστος, την κατανάλωση ενέργειας και το οικοσύστημα λογισμικού.



Σε ανταπόκριση σε τέτοιες τάσεις ζήτησης, οι προμηθευτές υποδομής υπολογιστικής ισχύος, όπως η Inspur και η Lenovo, έχουν δημιουργήσει διατάξεις υπολογιστικής ισχύος γύρω από την «τελική ευφυΐα-σύννεφο-δίκτυο-νέφους» τα τελευταία χρόνια. Τα προϊόντα περιλαμβάνουν έξυπνες πύλες άκρων, διακομιστές ακρών, βιομηχανικούς ελεγκτές, ενσωματωμένους υπολογιστές και άλλες συσκευές υλικού για την κάλυψη των αναγκών υπολογιστικής ισχύος διαφορετικών βιομηχανιών. Από την πλευρά του τσιπ, η ενσωμάτωση των CPU+GPU+NPU έχει γίνει η κατεύθυνση της ανάπτυξης επεξεργαστών για την αντιμετώπιση της πιο περίπλοκης υπολογιστικής ισχύος AI. Η Qualcomm λανσάρει την ολοκληρωμένη αποκλειστική μονάδα νευρωνικής επεξεργασίας Snapdragon X Elite που υποστηρίζει δεκάδες δισεκατομμύρια μοντέλα σε επίπεδο παραμέτρων. Ο επεξεργαστής Intel Meteor Lake συνδυάζει τις λειτουργίες AI του NPU με τον υπολογιστικό κινητήρα στον επεξεργαστή για να βελτιώσει την ενεργειακή απόδοση των υπολογιστών που εκτελούν λειτουργίες AI. Όσον αφορά τα εγχώρια τσιπ τεχνητής νοημοσύνης, η Aixin Yuanzhi κυκλοφόρησε επίσης πρόσφατα τον "Επεξεργαστή Aixin Tongyuan AI". Πυκνότητα, κατάλληλη για την ανάπτυξη πεδίων υπολογισμού αιχμής και συλλογιστικής τεχνητής νοημοσύνης.

Τα θέματα ενεργειακής απόδοσης στην άκρη είναι σημαντικά και η ελαφριά ανάπτυξη είναι το κλειδί

Η ενεργειακή απόδοση είναι επίσης ένα βασικό ζήτημα που πρέπει να ληφθεί υπόψη στην ανάπτυξη μοντέλων edge large. Στην πραγματικότητα, εάν τα μεγάλα μοντέλα θέλουν να αναπτυχθούν αποτελεσματικά στην άκρη/τελική πλευρά, σε σύγκριση με το cloud, τα ζητήματα ενεργειακής απόδοσης είναι πιο εμφανή. Ο Sachin Katti, ανώτερος αντιπρόεδρος της Intel και γενικός διευθυντής του τμήματος Network and Edge, είπε σε μια συνέντευξη με τον συγγραφέα ότι όταν συζητείται η υπολογιστική ισχύς, εκτός από τη βελτιστοποίηση της υπολογιστικής ισχύος, την οικολογία λογισμικού κ.λπ., ένα βασικό ζήτημα είναι η κατανάλωση ενέργειας. ειδικά όταν αναπτύσσεται στην άκρη. Η κατανάλωση ενέργειας του εξοπλισμού που αναπτύσσεται στην άκρη μπορεί να είναι περίπου 200W, η κατανάλωση ενέργειας για την ανάπτυξη του νέφους μπορεί να είναι 1k έως 2kW και η κατανάλωση ενέργειας ενός rack μονής στρώσης στο κέντρο δεδομένων μπορεί να είναι έως και 100kW. Εάν προστεθεί η κατανάλωση ενέργειας ολόκληρου του κέντρου δεδομένων, μπορεί να φτάσει σε κλίμακα από 50G έως 100GW.

Οι συσκευές Edge έχουν συχνά περιορισμένη υπολογιστική ισχύ και μνήμη, και τα μεγάλα μοντέλα απαιτούν σημαντικούς πόρους για συμπεράσματα υψηλής απόδοσης. Ως εκ τούτου, ο τρόπος βελτιστοποίησης της χρήσης των πόρων και η μείωση της κατανάλωσης ενέργειας με παράλληλη διασφάλιση της ακρίβειας του μοντέλου και της ταχύτητας απόκρισης έχει γίνει βασικό ζήτημα. Σε απάντηση σε αυτήν την τάση, οι σχετικοί κατασκευαστές έχουν προωθήσει ελαφριά πλαίσια ανάπτυξης και βιβλιοθήκες επιτάχυνσης, όπως ο κινητήρας ανάπτυξης μοντέλου Ryzen AI που κυκλοφόρησε από την AMD, η βιβλιοθήκη επιτάχυνσης συμπερασμάτων OpenVINO της Intel, η βιβλιοθήκη επιτάχυνσης συμπερασμάτων υψηλής απόδοσης TensorRT της NVIDIA, κ.λπ., σε συνδυασμό με στοχευμένες Τα ελαφριά πλαίσια ανάπτυξης για ενσωματωμένα και κινητά τερματικά (όπως τα PyTorch Mobile, ‌TensorFlow Lite, ‌Paddle Lite, κ.λπ.) μπορούν να προωθήσουν την ευρεία εφαρμογή της τεχνητής νοημοσύνης σε κινητές συσκευές, ‌Internet of Things και άλλα σενάρια υπολογιστών αιχμής.



Επιπλέον, η βιομηχανία έχει επίσης αρχίσει να υιοθετεί ευρέως την τεχνολογία υγρής ψύξης ως μέσο ψύξης διακομιστών και σταδιακά χρησιμοποιείται σε κέντρα δεδομένων και σε μεγάλες αναπτύξεις μοντέλων. Εννοείται ότι η υπάρχουσα τεχνολογία υγρής ψύξης μπορεί ήδη να ψύξει στόλο 100 kW και αναμένεται να επεκταθεί στα 300 kW στο μέλλον.

Εξερευνώντας εφαρμογές AI, ποιος θα είναι η «σταρ σκηνή» στο μέλλον;

Καθώς οι άνθρωποι τονίζουν ολοένα και περισσότερο τη δύναμη των μεγάλων μοντέλων σε βιομηχανικές εφαρμογές, η εύρεση κατάλληλων «σκηνών με αστέρια» έχει γίνει βασικό ζήτημα που καθορίζει την επιτυχία ή την αποτυχία του κλάδου. Επί του παρόντος, τα κινητά τηλέφωνα με τεχνητή νοημοσύνη, οι υπολογιστές με τεχνητή νοημοσύνη και η αυτόνομη οδήγηση έχουν γίνει οι πιο υποσχόμενες αγορές εφαρμογών για μεγάλα μοντέλα.

Η τελευταία έρευνα από την εταιρεία ερευνών αγοράς IDC δείχνει ότι η αγορά κινητών τηλεφώνων με τεχνητή νοημοσύνη θα φτάσει τις αποστολές των 234,2 εκατομμυρίων μονάδων το 2024, αύξηση 363,6% από 50,5 εκατομμύρια μονάδες που είχαν αποσταλεί το 2023 και θα αντιπροσωπεύει το 19% του συνολικού smartphone αγορά φέτος. Το 2028, οι αποστολές κινητών τηλεφώνων με τεχνητή νοημοσύνη θα φτάσουν τις 912 εκατομμύρια μονάδες το 2028, με σύνθετο ετήσιο ρυθμό αύξησης 78,4%. Ο Anthony Scarsella, διευθυντής έρευνας του Worldwide Quarterly Mobile Phone Tracking της IDC, είπε ότι το κόστος θα παραμείνει βασικός ανασταλτικός παράγοντας όταν κυκλοφορήσουν τηλέφωνα AI, καθώς πολλά ισχυρά τσιπ και NPU είναι ακριβά και πωλούνται κυρίως στην αγορά υπερυψηλών προδιαγραφών. Ωστόσο, όσο περνά ο καιρός και ο ανταγωνισμός εντείνεται, πιστεύουμε ότι αυτά τα εξαρτήματα θα βρουν τον δρόμο τους σε μοντέλα μεσαίας κατηγορίας και πιο προσιτά.

Οι υπολογιστές τεχνητής νοημοσύνης ωριμάζουν ταχύτερα από ό,τι αρχικά αναμενόταν και αναμένεται να φέρουν ένα κύμα αντικαταστάσεων στην παγκόσμια βιομηχανία υπολογιστών. Σύμφωνα με την πρόβλεψη της Canalys, ο παγκόσμιος ρυθμός διείσδυσης Η/Υ AI θα αυξηθεί από 19% σε 71% από το 2024 έως το 2028 και οι αποστολές θα αυξηθούν από 51 εκατομμύρια μονάδες σε 208 εκατομμύρια μονάδες, με σύνθετο ετήσιο ρυθμό αύξησης 42,11%. Η Morgan Stanley προβλέπει ότι οι υπολογιστές τεχνητής νοημοσύνης θα αντιπροσωπεύουν το 2% της συνολικής αγοράς υπολογιστών φέτος και θα αυξηθούν σε 16% το επόμενο έτος, 28% το 2026, 48% το 2027 και 64% το 2028.

Η χρήση των μεγάλων μοντέλων στα αυτοκίνητα είναι ακόμα στα πρώτα της στάδια. Ωστόσο, καθώς η έννοια της νοημοσύνης ριζώνει σταδιακά στις καρδιές των ανθρώπων, έχει γίνει η συναίνεση των περισσότερων ανθρώπων ότι τα αυτοκίνητα θα γίνουν τελικά "περπατητικά τερματικά". μεγάλα μοντέλα τεχνητής νοημοσύνης σε αυτοκίνητα θα «πάρουν το τρένο εξπρές». Υπάρχουν δύο βασικές κατευθύνσεις για τα μεγάλα μοντέλα που πρέπει να τοποθετηθούν στα αυτοκίνητα: η μία είναι η είσοδος στην περιοχή του πιλοτηρίου για να επιτευχθεί πιο έξυπνη αλληλεπίδραση ανθρώπου-υπολογιστή και η άλλη είναι η συνεργασία με το σύστημα αυτόνομης οδήγησης για περαιτέρω βελτίωση των έξυπνων λύσεων οδήγησης. Ο Zhang Chi, CTO της Maichi Intelligent Technology Co., Ltd., είπε ότι τα μεγάλα μοντέλα επιταχύνουν τη μετάβαση της αυτόνομης οδήγησης από τους αυτοκινητόδρομους σε πιο σύνθετα αστικά σενάρια και επίσης προάγουν το σχηματισμό της ενσωμάτωσης αντίληψης και ελέγχου από άκρο σε άκρο. Ο Liu Jianwei, συνιδρυτής και αντιπρόεδρος της Aixin Yuanzhi, είπε ότι ο Aixin Yuanzhi προέβλεψε το ξέσπασμα του Transformer το 2022 και πρωτοστάτησε στην κυκλοφορία ενός τσιπ εξοπλισμένου με επεξεργαστή Aixin Tongyuan AI. Τα έξυπνα τσιπ οδήγησης της Aixin Yuanzhi, όπως το M55H και το M76H, έχουν εγκατασταθεί σε τρέχοντα μοντέλα υψηλής πώλησης.