νέα

μια άμεση ματιά στην τρέχουσα κατάσταση των εγχώριων τσιπ τεχνητής νοημοσύνης: παραγωγή αίματος gpu, επιδρομές tpu, τα chiplet που γίνονται τάση και προβλήματα δικτύου

2024-09-06

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

συγγραφέας |

το xinxi ανέφερε στις 6 σεπτεμβρίου ότι η ετήσια παγκόσμια σύνοδος κορυφής για τα chip ai (gacs 2024) άνοιξε σήμερα στο πεκίνο. ο χώρος ήταν γεμάτος θέσεις και ο αριθμός των θεατών της ζωντανής μετάδοσης του cloud έφτασε τα 1,2 εκατομμύρια.

▲υπήρχε τεράστιο πλήθος κόσμου εντός και εκτός του χώρου.

το συνέδριο χρηματοδοτήθηκε από τον core east west της zhiyi technology και τον έξυπνο ουρακοτάγκο. clusters υπολογιστών, ai infra και άλλα πεδία οι επισκέπτες θα μοιραστούν χρήσιμες πληροφορίες στη συνάντηση.

είναι η πέμπτη επέτειος από την ίδρυση της εγχώριας gpg unicorn biren technology στο συνέδριο, η biren technology ανακοίνωσε ότι πέτυχε μια σημαντική ανακάλυψη στην τεχνολογία πολλαπλών πυρήνων εκπαίδευσης και δημιούργησε μια ετερογενή λύση συνεργασίας gpu στη βιομηχανία, μπορεί να υποστηρίξει 3 ή περισσότερους ετερογενείς τύπους gpu το ίδιο μεγάλο μοντέλο.

▲η biren technology λανσάρει εγχώρια ετερογενή λύση συνεργασίας gpu hgct

ο γκονγκ λουντσάνγκ, συνιδρυτής και διευθύνων σύμβουλος της zhiyi technology, παρέδωσε μια ομιλία ως διοργανωτής φέτος είναι η έβδομη χρονιά που πραγματοποιήθηκε η σύνοδος κορυφής για την παγκόσμια τεχνητή νοημοσύνη είναι ένα καλό μέρος για να κατανοήσετε την ανάπτυξη των τσιπ τεχνητής νοημοσύνης στο εσωτερικό και στο εξωτερικό.

▲gong lunchang, συνιδρυτής και διευθύνων σύμβουλος της zhiyi technology

το global ai chip summit διαρκεί δύο ημέρες ο κύριος χώρος περιλαμβάνει την τελετή έναρξης και τρεις μεγάλες συνεδρίες (αρχιτεκτονική τσιπ ai, τσιπ τεχνητής νοημοσύνης κέντρου δεδομένων, τσιπ τεχνητής νοημοσύνης άκρης, φόρουμ τεχνολογίας ευφυών υπολογιστών). και το φόρουμ risc-v innovation.

στην τελετή έναρξης, ο yin shouyi, καθηγητής του πανεπιστημίου tsinghua και αναπληρωτής κοσμήτορας της σχολής ολοκληρωμένων κυκλωμάτων, έδωσε μια κεντρική ομιλία με τίτλο «συζήτηση για την αναπτυξιακή πορεία των τσιπ υψηλής υπολογιστικής ισχύος: από την αρχιτεκτονική υπολογιστών στην ολοκληρωμένη αρχιτεκτονική», αναθεωρώντας συστηματικά τσιπ υψηλής υπολογιστικής ισχύος, και να αναλύσει διεξοδικά πέντε καινοτόμες τεχνολογικές διαδρομές: τσιπ ροής δεδομένων, ολοκληρωμένα τσιπ αποθήκευσης και υπολογισμού, τσιπ με δυνατότητα επαναδιαμόρφωσης, τρισδιάστατα ολοκληρωμένα τσιπ και τσιπ σε επίπεδο γκοφρέτας.

σήμερα, 21 ειδικοί, επιχειρηματίες και στελέχη από κορυφαία πανεπιστήμια, ερευνητικά ινστιτούτα και εταιρείες τσιπ τεχνητής νοημοσύνης θα μοιραστούν. μεταξύ αυτών, η σύνοδος διαλόγου high-end προσκάλεσε εκπροσώπους από τρεις νεοσύστατες τεχνολογίες τεχνητής νοημοσύνης να συζητήσουν με πάθος, συγκεκριμένα την biren technology, έναν εγχώριο μονόκερο τσιπ υψηλής ισχύος, τον aixin yuanzhi, έναν μονόκερο από τσιπ τεχνητής νοημοσύνης στο τέλος και την άκρη, και ένα εταιρεία που μόνο η lingchuan technology, μια νεαρή startup τσιπ τεχνητής νοημοσύνης ίδρυσε πριν από μισό χρόνο. επικεντρώθηκαν στη συζήτηση για την τρέχουσα κατάσταση, τις τελευταίες πρακτικές και τις προηγμένες κατευθύνσεις της βιομηχανίας τσιπ ai.

1. επίλυση των προκλήσεων προσφοράς και ζήτησης της υπολογιστικής ισχύος μοντέλων μεγάλης κλίμακας και της καινοτόμου αρχιτεκτονικής για να ξεπεραστούν τα σημεία συμφόρησης απόδοσης

ο yin shouyi, καθηγητής στο πανεπιστήμιο tsinghua και αναπληρωτής κοσμήτορας της σχολής ολοκληρωμένων κυκλωμάτων, εξήγησε τις δυσκολίες στην προσφορά και ζήτηση υπολογιστικής ισχύος στην εποχή των μεγάλων μοντέλων: η τεχνολογία τσιπ αντιμετωπίζει το όριο κλιμάκωσης, αυξάνοντας την υπολογιστική ισχύ το σύστημα αντιμετωπίζει περιορισμό, το ανεπαρκές εύρος ζώνης επικοινωνίας οδηγεί σε απώλεια απόδοσης του συστήματος.

η ευκαιρία επίλυσης αυτών των δύο μεγάλων προβλημάτων βρίσκεται στην κοινή καινοτομία της αρχιτεκτονικής υπολογιστών με τσιπ και της ολοκληρωμένης αρχιτεκτονικής: η καινοτομία στην υπολογιστική αρχιτεκτονική επιτρέπει σε κάθε τρανζίστορ να χρησιμοποιείται πλήρως και να ασκεί ισχυρότερη υπολογιστική ισχύ στην ολοκληρωμένη αρχιτεκτονική τα όρια.

υπάρχουν επί του παρόντος πέντε νέα τεχνολογικά μονοπάτια για την ανάπτυξη τσιπ υψηλής υπολογιστικής ισχύος: τσιπ ροής δεδομένων, αναδιαμορφώσιμα τσιπ, ολοκληρωμένα τσιπ αποθήκευσης και υπολογιστών, τρισδιάστατα ολοκληρωμένα τσιπ και τσιπ σε επίπεδο γκοφρέτας. κανένα από αυτά τα μονοπάτια δεν βασίζεται πλήρως στις πιο προηγμένες διαδικασίες παραγωγής, οι οποίες θα βοηθήσουν να ανοίξει νέος χώρος για την εγχώρια βιομηχανία τσιπ για τη βελτίωση της υπολογιστικής ισχύος.

▲ yin shouyi, καθηγητής στο πανεπιστήμιο tsinghua και αναπληρωτής πρύτανης του school of integrated circuits

η amd έχει δημιουργήσει μια ολοκληρωμένη σειρά προϊόντων στον τομέα της υποδομής τεχνητής νοημοσύνης από άκρο σε άκρο, που καλύπτει από διακομιστές κέντρων δεδομένων, υπολογιστές τεχνητής νοημοσύνης έως έξυπνες ενσωματωμένες και ακραίες συσκευές, και παρέχει κορυφαίο λογισμικό ανοιχτού κώδικα τεχνητής νοημοσύνης και ανοιχτό οικοσύστημα. η πλατφόρμα επεξεργαστή cpu της amd που σχεδιάστηκε με βάση την προηγμένη αρχιτεκτονική zen4 και οι επιταχυντές της σειράς mi που βασίζονται στην αρχιτεκτονική cdna3 για συλλογισμό και εκπαίδευση τεχνητής νοημοσύνης έχουν υιοθετηθεί από κολοσσούς όπως η microsoft.

σύμφωνα με τον wang hongqiang, ανώτερο διευθυντή του τμήματος τεχνητής νοημοσύνης της amd, η amd προωθεί επίσης δικτυακή υποδομή υψηλής απόδοσης (ualink, ultra ethernet) σε κέντρα δεδομένων, η οποία είναι ζωτικής σημασίας για τις δομές δικτύου ai να υποστηρίζουν γρήγορη εναλλαγή και εξαιρετικά χαμηλή καθυστέρηση και επέκταση της απόδοσης του κέντρου δεδομένων ai.

η amd πρόκειται να κυκλοφορήσει την επόμενη γενιά υπολογιστών τεχνητής νοημοσύνης υψηλής απόδοσης το ryzen ai npu που βασίζεται στην αρχιτεκτονική xdna δεύτερης γενιάς μπορεί να παρέχει υπολογιστική ισχύ 50 tops και να αυξήσει την αναλογία ενεργειακής απόδοσης σε 35 φορές αυτή της αρχιτεκτονικής γενικής χρήσης. με γνώμονα την ώθηση του ai pc για απόρρητο, ασφάλεια και αυτονομία δεδομένων, σημαντικοί φόρτοι εργασίας ai αρχίζουν να αναπτύσσονται σε υπολογιστές. ως ένας από τους κορυφαίους παρόχους υποδομών τεχνητής νοημοσύνης στον κόσμο, η amd είναι πρόθυμη να συνεργαστεί με πελάτες και προγραμματιστές για να οικοδομήσει ένα μεταμορφωτικό μέλλον.

▲ wang hongqiang, ανώτερος διευθυντής του τμήματος τεχνητής νοημοσύνης της amd

από το 2015, η qualcomm καινοτομεί συνεχώς τον σχεδιασμό υλικού npu με βάση τις αλλαγές στις περιπτώσεις χρήσης εφαρμογών ai. αντιπροσωπευόμενο από το snapdragon 8 τρίτης γενιάς, το qualcomm ai engine υιοθετεί μια ετερογενή αρχιτεκτονική υπολογιστών που ενσωματώνει πολλαπλούς επεξεργαστές όπως cpu, gpu και npu. μεταξύ αυτών, το qualcomm hexagon npu βελτιστοποιεί την απόδοση και την ενεργειακή απόδοση μέσω μνήμης μεγάλης κλίμακας, αποκλειστικής παροχής ρεύματος για επιταχυντές, αναβαθμίσεις μικροαρχιτεκτονικής και άλλα σχέδια. η τεχνητή νοημοσύνη έχει πλούσιες περιπτώσεις χρήσης και ποικίλες απαιτήσεις υπολογιστικής ισχύος, επομένως, η ζήτηση για ετερογενή υπολογιστική και ενσωμάτωση επεξεργαστή θα υπάρχει για μεγάλο χρονικό διάστημα, γεγονός που θα επιφέρει επίσης μια σειρά βελτιώσεων στην απόδοση αιχμής, την ενεργειακή απόδοση, το κόστος κ.λπ.

η σειρά προϊόντων της qualcomm καλύπτει ένα ευρύ φάσμα σεναρίων αιχμής εφαρμογών, όπως κινητά τηλέφωνα, υπολογιστές, xr, αυτοκίνητα και iot. μπορεί να υποστηρίξει τους προγραμματιστές να χρησιμοποιούν το λογισμικό τεχνητής νοημοσύνης και τις λύσεις υλικού της qualcomm για την επιτάχυνση αλγορίθμων σε διαφορετικές μορφές προϊόντων, φέρνοντας πλούτο. των πλεονεκτημάτων για τους καταναλωτές εμπειρίας και χρήσης τεχνητής νοημοσύνης στη συσκευή. τέλος, ο wan weixing, επικεφαλής της qualcomm ai product technology china, ανακοίνωσε επίσης ότι η επόμενη γενιά κινητής πλατφόρμας snapdragon εξοπλισμένη με την τελευταία qualcomm oryon cpu θα κυκλοφορήσει στο snapdragon summit που θα πραγματοποιηθεί από τις 21 έως τις 23 οκτωβρίου φέτος.

▲wan weixing, επικεφαλής της τεχνολογίας προϊόντων qualcomm ai στην κίνα

ο yang yue, συνιδρυτής και διευθύνων σύμβουλος της pingxin technology, κατέρριψε τη διαδικασία προόδου της ολοκληρωμένης τεχνολογίας αποθήκευσης και υπολογιστών. η εμφάνιση και η ανάπτυξη των mainstream τσιπ στον κλάδο σχετίζονται στενά με τα χαρακτηριστικά των τρεχουσών υπολογιστικών αναγκών γύρω στο 2015, η υπολογιστική συμφόρηση στην υπολογιστική αρχιτεκτονική μετακόμισε από την πλευρά του επεξεργαστή στην πλευρά της αποθήκευσης, ειδικά η εμφάνιση των νευρωνικών δικτύων, η οποία επιταχύνθηκε. η υπολογιστική απόδοση των τσιπ ai με το ρυθμό βελτίωσης, η τεχνολογία αποθήκευσης και υπολογιστών έχει προσελκύσει την προσοχή.

ο yang yue πιστεύει ότι στην εποχή των μεγάλων μοντέλων, η ευκαιρία για ολοκληρωμένη τεχνολογία αποθήκευσης και υπολογιστών είναι η προσθήκη υπολογιστών όπου υπάρχει αποθήκευση δεδομένων. με τη συνεχή ανάπτυξη λογισμικού, τα τσιπ από την πλευρά του τερματικού που βασίζονται σε αποθήκευση και υπολογιστές έχουν σταδιακά ωριμάσει φέτος. στο μέλλον, η επίλυση σημείων συμφόρησης εύρους ζώνης δεδομένων στο cloud μπορεί να γίνει η επόμενη δολοφονική εφαρμογή για τσιπ αποθήκευσης και υπολογιστών.

▲yang yue, συνιδρυτής και διευθύνων σύμβουλος της pingxin technology

ο tan zhanhong, cto του arctic xiongxin, είπε ότι στον τομέα των υπολογιστών υψηλής απόδοσης, υπάρχουν δύο διαφορετικά παραδείγματα στο σχεδιασμό διακομιστή: τυπική μορφή διακομιστή και προσαρμοσμένη αρχιτεκτονική διακομιστή. με τη μορφή τυπικών διακομιστών, το arctic xiongxin εστιάζει στην επίτευξη υψηλότερης απόδοσης κόστους μέσω κατάλληλων λύσεων διαχωρισμού και συσκευασίας τσιπ εντός της τυπικής περιορισμένης περιοχής, με τη μορφή μη τυπικών διακομιστών, με έμφαση στην ενοποίηση. σχεδιασμού τσιπ και συστημάτων, και συν-σχεδίαση διακομιστών και τσιπ, με στόχο την επίτευξη του στόχου του «διακομιστής ως τσιπ».

συγκεκριμένα, ο tan zhanhong τόνισε ότι τα διαφορετικά σχέδια τσιπ έχουν διαφορετικές απαιτήσεις εύρους ζώνης, για παράδειγμα, σε διαδικασίες 7 nm και άνω, σε συνδυασμό με τη βελτιστοποίηση της επικοινωνίας, συχνά δεν απαιτείται υψηλή πυκνότητα διασύνδεσης, επομένως δεν απαιτείται προηγμένη συσκευασία με βάση το 2d το πακέτο μπορεί να ικανοποιήσει τις απαιτήσεις απόδοσης και να επιτύχει μια οικονομικά αποδοτική λύση. η pb-link ip της arctic xiongxin που βασίζεται στο «πρότυπο διασύνδεσης βασικού τσιπ» πραγματοποίησε επίσημα τη διασύνδεση χαμηλού κόστους συσκευασίας και τώρα έχει αρχίσει να εξουσιοδοτεί εξωτερικά μέρη.

▲ arctic xiongxin cto tan zhanhong

2. διάλογος υψηλών προδιαγραφών: τα εγχώρια τσιπ τεχνητής νοημοσύνης έχουν βελτιωμένες αιμοποιητικές ικανότητες και τα προϊόντα της νεότερης start-up έχουν λανσαριστεί στο kuaishou

ο zhang guoren, συνιδρυτής και αρχισυντάκτης της zhiyi technology, και ο ding yunfan, αντιπρόεδρος και επικεφαλής αρχιτέκτονας λογισμικού ai της biren technology, ο liu li, συνιδρυτής και αντιπρόεδρος της lingchuan technology και ο liu jianwei, συν. -ιδρυτής και αντιπρόεδρος της aixin yuanzhi, ξεκίνησε τον διάλογο στρογγυλής τραπέζης με θέμα «συναφωνία, συν-δημιουργία και win-win για την υλοποίηση εγχώριων τσιπ ai».

ο zhang guoren είπε στην αρχή του διαλόγου στρογγυλής τραπέζης ότι η έκτη έκτη σύνοδος κορυφής για το chip ai που ξεκίνησε από τους zhidongxi, coredest και zhiangzhi είναι το μακροβιότερο επαγγελματικό συνέδριο σε αυτόν τον τομέα στην κίνα τα τελευταία χρόνια τσιπ και μεγάλα μοντέλα η ανάπτυξη γνώρισε επίσης την άνοδο μιας σειράς εγχώριων πυρήνων που δημιουργούν «νέες δυνάμεις».

▲zhang guoren, συνιδρυτής και αρχισυντάκτης της zhiyi technology

ο ding yunfan είπε ότι τα μεγάλα τσιπ υπολογιστικής ισχύος είναι μια βιομηχανία έντασης τεχνολογίας, έντασης ταλέντων και έντασης κεφαλαίου. ως το chip unicorn με τη μεγαλύτερη δημόσια χρηματοδότηση στην αγορά, η biren technology έχει κορυφαία ταλέντα. ωστόσο, η συνολική κατάσταση της εγχώριας βιομηχανίας τσιπ εξακολουθεί να μην είναι εύκολη και εξακολουθεί να υπάρχει ένα χάσμα μεταξύ των οικολογικών πτυχών και των ξένων χωρών.

πολλά εγχώρια τσιπ τεχνητής νοημοσύνης έχουν αρχίσει να αναπτύσσονται σε κέντρα δεδομένων και ευφυή υπολογιστικά κέντρα. κατά την άποψη του ding yunfan, τα εγχώρια προϊόντα της nvidia δεν είναι πολύ αποδοτικά από πλευράς κόστους. προς το παρόν, υπάρχουν όλο και περισσότερα νέα σχετικά με την έναρξη της εγχώριας βιομηχανίας τσιπ και την ενίσχυση των αιματοποιητικών δυνατοτήτων το χάσμα με τη nvidia σταδιακά θα μειωθεί.

▲ding yunfan, αντιπρόεδρος της biren technology και επικεφαλής αρχιτέκτονας λογισμικού ai

ο liu jianwei πιστεύει ότι το χαμηλό κόστος είναι ένα πολύ σημαντικό μέρος και οι εταιρείες θα πρέπει τελικά να ξεκαθαρίσουν τους λογαριασμούς και ότι η επένδυσή τους σε υποδομές πρέπει να επιστραφεί. ο liu li πιστεύει ότι στο μέλλον, στα κομμάτια όπως η ενσωματωμένη ευφυΐα και το έξυπνο βίντεο, η είσοδος περισσότερων εταιρειών θα φέρει μεγαλύτερη αξία από τα γενικά προϊόντα, γεγονός που θα συμπιέζει τα έσοδα και τα κέρδη της nvidia.

η lingchuan technology είναι μια από τις νεότερες εγχώριες εταιρείες τεχνητής νοημοσύνης που ιδρύθηκε τον μάρτιο του τρέχοντος έτους και ολοκλήρωσε έναν γύρο χρηματοδότησης. πεδίο επεξεργασίας βίντεο το τσιπ συμπερασμάτων υπολογιστικής ισχύος αναμένεται να κυκλοφορήσει στις αρχές του επόμενου έτους.

κατά την άποψη του liu li, το παράθυρο της αγοράς τσιπ τεχνητής νοημοσύνης απέχει ακόμη πολύ από το κλείσιμο. η τεχνολογία lingchuan συνδυάζει την έξυπνη επεξεργασία βίντεο και την υπολογιστική ισχύ συμπερασμάτων ai, με στόχο τη μείωση του κόστους συμπερασμάτων ανά token στο 10% του nvidia h800.

▲ liu li, συνιδρυτής και αντιπρόεδρος της lingchuan technology

η aixin yuanzhi, η οποία στοχεύει τόσο στις άκρες όσο και στις πλευρές, έχει επιτύχει αξιοσημείωτα αποτελέσματα στο μερίδιο αγοράς. ο liu jianwei πιστεύει ότι αυτά τα δύο πεδία θα πραγματοποιήσουν τον εμπορικό κλειστό βρόχο πιο γρήγορα. πρόσθεσε ότι η κατασκευή τσιπ τεχνητής νοημοσύνης θα αποφέρει τελικά χρήματα, αλλά το πραγματικό πρόγραμμα κερδών θα επηρεαστεί από παράγοντες όπως το κόστος ανάπτυξης της τεχνητής νοημοσύνης και οι εταιρείες θα πρέπει να επιτύχουν αυτοπαραγωγή και κλειστό βρόχο το συντομότερο δυνατό. στο μέλλον, η aixin yuanzhi θα εξερευνήσει τα σενάρια υλοποίησης μεγάλων μοντέλων στην ακραία πλευρά και στην άκρη.

οι αποστολές προϊόντων της aixin yuanzhi στον τομέα της αυτοκινητοβιομηχανίας είναι πολύ εντυπωσιακές, επειδή η βασική τεχνολογία τσιπ των έξυπνων πόλεων και των αυτοκινήτων είναι παρόμοια επιτεύχθηκε σύντομα. ταυτόχρονα, ο πόλεμος τιμών στον τομέα της αυτοκινητοβιομηχανίας θα προωθήσει τον βιομηχανικό καταμερισμό εργασίας, που είναι μια περίοδος ευκαιριών.

▲ liu jianwei, συνιδρυτής και αντιπρόεδρος της aixin yuanzhi

όσο για το πώς τα εγχώρια τσιπ τεχνητής νοημοσύνης μπορούν να βρουν γρήγορα μια οικολογική θέση, ο liu jianwei πήρε ως παράδειγμα τη βαθιά σκηνή ανάπτυξης του aixin yuanzhi δεν υπάρχουν βασικά ξένες εταιρείες στον τομέα της έξυπνης οδήγησης, η nvidia αναπτύσσεται από το 0 έως το 1, και από το 1 έως το 100, το στάδιο που δίνει μεγαλύτερη προσοχή στο κόστος είναι οι εγχώριες επιχειρηματικές ευκαιρίες. ο ding yunfan ανέφερε τέσσερα στοιχεία: σταθερή και αξιόπιστη εγγύηση εφοδιασμού, οικονομική αποδοτικότητα, αποτελεσματικές υπηρεσίες υποστήριξης με βάση τις ανάγκες των πελατών και αποτελεσματικότητα και ευκολία χρήσης. ο liu li πιστεύει ότι πρέπει να εμβαθύνουμε σε κάθετα πεδία και να δημιουργήσουμε πιο αποτελεσματικές και βελτιστοποιημένες λύσεις από τα τσιπ γενικής χρήσης.

προσβλέποντας στο μέλλον, ο liu jianwei προβλέπει ότι τα επόμενα 4-5 χρόνια θα υπάρξουν μεγάλες ευκαιρίες ανάπτυξης τόσο από την πλευρά της συσκευής όσο και από την πλευρά του cloud αφού μειωθεί το κόστος εφαρμογής στον κλάδο, τα δεδομένα μπορούν να αποκτήσουν μεγαλύτερη αξία . ο liu li πιστεύει ότι καθώς οι εφαρμογές τεχνητής νοημοσύνης εγκαινιάζουν μια εκρηκτική περίοδο, θα υπάρχει μεγάλη ζήτηση συλλογισμού από την πλευρά του cloud. ο ding yunfan είπε ότι η υπολογιστική ισχύς υψηλής τεχνολογίας εξακολουθεί να είναι σπάνια στην κίνα, αλλά η συνεργασία της βιομηχανικής αλυσίδας μπορεί να επιτύχει σταθερή ανάπτυξη.

3. η κατασκευή έξυπνων κέντρων υπολογιστών βρίσκεται σε άνοδο: νέες ανακαλύψεις σε gpu, εγχώρια tpu, chiplet κερδίζουν

στη συνεδρία τσιπ τεχνητής νοημοσύνης του κέντρου δεδομένων που πραγματοποιήθηκε το απόγευμα, ο yu mingyang, επικεφαλής της habana china, είπε ότι τα τελευταία τρία χρόνια, περίπου 50+ κυβερνητικά κέντρα έξυπνων υπολογιστών έχουν κατασκευαστεί το ένα μετά το άλλο και 60+ βρίσκονται στο στάδιο του σχεδιασμού. και κατασκευές η κατασκευή κέντρων έξυπνων υπολογιστών έχει σταδιακά αυξηθεί από πόλεις πρώτης βαθμίδας σε πόλεις δεύτερης και τρίτης βαθμίδας, και από τις κυβερνητικές σε επιχειρήσεις, οι απαιτήσεις για μείωση του κόστους και τον κύκλο απόδοσης των επενδύσεων.

σύμφωνα με την παρατήρησή του, η τρέχουσα ανάπτυξη μεγάλων μοντέλων γίνεται ολοένα και πιο ώριμη και η ζήτηση για συμπεράσματα συνεχίζει να αυξάνεται στην πλευρά του συμπεράσματος.

η ζήτηση για εκπαίδευση μεγάλων μοντέλων στο εξωτερικό θα εξακολουθεί να είναι ισχυρή, και η ζήτηση για υπολογιστική ισχύ για εγχώρια εκπαίδευση μοντέλων είναι βασικά κορεσμένη, κυρίως από τις επιχειρήσεις τελειοποίησης. για να υποστηριχθεί η μελλοντική ανάπτυξη της τεχνητής νοημοσύνης, η ενσωμάτωση chiplet, υψηλής ταχύτητας μνήμης μεγάλης χωρητικότητας και ιδιωτικών/γενικών τεχνολογιών διασύνδεσης υψηλής ταχύτητας θα διαδραματίσει βασικό ρόλο.

▲ yu mingyang, επικεφαλής της habana china

προκειμένου να λυθεί το πρόβλημα των ετερογενών σιλό υπολογιστικής ισχύος για μεγάλα μοντέλα, ο ding yunfan, αντιπρόεδρος της biren technology και επικεφαλής αρχιτέκτονας λογισμικού τεχνητής νοημοσύνης, ανακοίνωσε την κυκλοφορία της αρχικής ετερογενούς λύσης συνεργασίας εκπαίδευσης με gpu της biren, hgct. αυτή είναι η πρώτη φορά στον κλάδο που υποστηρίζει τρεις ή περισσότερες ετερογενείς gpu για να εκπαιδεύει από κοινού το ίδιο μεγάλο μοντέλο, δηλαδή υποστηρίζει μικτή εκπαίδευση με "nvidia + biren + gpu άλλες επωνυμίας η απόδοση επικοινωνίας είναι μεγαλύτερη από 98%. και η αποτελεσματικότητα της εκπαίδευσης από άκρο σε άκρο φτάνει το 90~ 95%.

η bi ren συνεργάζεται με πελάτες και συνεργάτες για την από κοινού προώθηση του ετερογενούς οικοσυστήματος συνεργασίας gpu, συμπεριλαμβανομένων των china telecom, zte, sensetime, state grid intelligence research institute, shanghai intelligent computing technology co., ltd., shanghai artificial intelligence laboratory, china institute of τεχνολογίες πληροφορικής και επικοινωνιών κ.λπ.

τα προϊόντα της έχουν αναπτυχθεί εμπορικά σε συστάδες gpu πολλαπλών καρτών κιλών. η biren έχει αναπτύξει ένα μεγάλο μοντέλο συνολικής λύσης που ενσωματώνει λογισμικό και υλικό, βελτιστοποίηση πλήρους στοίβας, ετερογενή συνεργασία και ανοιχτό κώδικα. για πρώτη φορά, η biren πραγματοποίησε την αυτόματη ελαστική διαστολή και συστολή 3d παράλληλων εργασιών μεγάλου μοντέλου, διατηρώντας το ποσοστό χρήσης συμπλέγματος σε σχεδόν 100%. , χωρίς αποτυχίες για 4 ημέρες και χωρίς διακοπή για 15 ημέρες.

▲ding yunfan, αντιπρόεδρος της biren technology και επικεφαλής αρχιτέκτονας λογισμικού ai

ο zheng hanxun, συνιδρυτής και cto της zhonghao xinying, είπε ότι τα σημερινά μεγάλα μοντέλα τεχνητής νοημοσύνης υπερβαίνουν κατά πολύ την υπολογιστική πολυπλοκότητα και τις απαιτήσεις υπολογιστικής ισχύος ανά πάσα στιγμή στην ιστορία των υπολογιστών και απαιτούν εξειδικευμένα τσιπ που είναι καλύτερα στους υπολογισμούς της τεχνητής νοημοσύνης. σε σύγκριση με την gpu, η οποία σχεδιάστηκε αρχικά για απόδοση σε πραγματικό χρόνο και επεξεργασία εικόνας, η tpu έχει σχεδιαστεί κυρίως για μηχανική μάθηση, μοντέλα βαθιάς μάθησης και υπολογισμούς νευρωνικών δικτύων η απόδοση επεξεργασίας έχει βελτιωθεί σημαντικά σε σύγκριση με την gpu.

το τσιπ "snap" της zhonghao xinying είναι το πρώτο τσιπ τεχνητής νοημοσύνης της αρχιτεκτονικής tpu υψηλής απόδοσης μαζικής παραγωγής της κίνας. . ο zheng hanxun πιστεύει ότι στα μεταγενέστερα στάδια ανάπτυξης μοντέλων μεγάλης κλίμακας, η καλύτερη σχέση κόστους-αποτελεσματικότητας των συστάδων των κιλών και των 10.000 ka θα είναι κρίσιμη. κρίσιμος παράγοντας για τη δημιουργία συμπλεγμάτων υπολογιστών μεγάλης κλίμακας η απόδοση μπορεί να υπερβεί κατά πολύ αυτή της παραδοσιακής gpu.

▲ zheng hanxun, συνιδρυτής και cto της zhonghao xinying

σύμφωνα με τον stephen feng, επικεφαλής προϊόντων ανοιχτής επιτάχυνσης υπολογιστών στην inspur information, καθώς αυξάνεται η κλίμακα παραμέτρων των μεγάλων μοντέλων, η ανάπτυξη της γενετικής τεχνητής νοημοσύνης αντιμετωπίζει τέσσερις μεγάλες προκλήσεις: ανεπαρκής επεκτασιμότητα συμπλέγματος, υψηλή κατανάλωση ενέργειας τσιπ, δύσκολη ανάπτυξη συμπλέγματος και χαμηλό σύστημα αξιοπιστία. το inspur information ήταν πάντα προσανατολισμένο στις εφαρμογές και με επίκεντρο το σύστημα, διεγείροντας τη ζωτικότητα της παραγωγικής καινοτομίας τεχνητής νοημοσύνης μέσω του ανοιχτού συστήματος της kaiyuan.

όσον αφορά το άνοιγμα του υλικού, έχουμε καθιερώσει προδιαγραφές oam (open acceleration module) για να επιταχύνουμε την online ανάπτυξη προηγμένης υπολογιστικής ισχύος και να υποστηρίξουμε την επαναληπτική επιτάχυνση μεγάλων μοντέλων και εφαρμογών ai. όσον αφορά το άνοιγμα του λογισμικού, μέσω της μεγάλης πλατφόρμας ανάπτυξης μοντέλων "yuannao qizhi" epai, δημιουργούμε μια πλατφόρμα υποστήριξης ανάπτυξης εφαρμογών πλήρους διαδικασίας για επιχειρήσεις μέσω λύσεων από άκρο σε άκρο, λύνουμε τα προβλήματα ψευδαίσθησης που υπάρχουν στον τομέα των βασικών μεγάλα μοντέλα και επίλυση προβλημάτων ανάπτυξης εφαρμογών.

▲stephen feng, επικεφαλής της inspur information open accelerated computing products

η qingcheng jizhi ιδρύθηκε το 2023, με επίκεντρο την τεχνητή νοημοσύνη infra.

ο shi tianhui, συνιδρυτής του qingcheng jizhi, μοιράστηκε ότι τα εγχώρια υπολογιστικά συστήματα υψηλής απόδοσης αντιμετωπίζουν προκλήσεις όπως η δυσκολία στην ανάκτηση σφαλμάτων και οι υπο-υγιές επιδόσεις, και το qingcheng jizhi είναι ήδη μεταξύ περισσότεροι από τους μισούς αγρούς έχουν αυτοαναπτυγμένα προϊόντα.

προς το παρόν, ο qingcheng jizhi έχει κατακτήσει τη συσσώρευση τεχνολογίας πλήρους στοίβας από τον μεταγλωττιστή κατώτερου επιπέδου στο σύστημα παράλληλων υπολογιστών ανώτερου επιπέδου, έχει επιτύχει κάλυψη πλήρους στοίβας της οικολογίας της μεγάλης βιομηχανίας μοντέλων και έχει ολοκληρώσει πολλαπλές βελτιστοποιήσεις συμπερασμάτων υψηλής απόδοσης εγχώρια τσιπ και mainstream μεγάλης κλίμακας το μοντέλο μεταμοσχεύεται και βελτιστοποιείται γρήγορα και το αποτέλεσμα υπολογισμού βελτιώνεται σημαντικά. μεταξύ αυτών, το μεγάλο σύστημα εκπαίδευσης μοντέλων "bagua furnace" που αναπτύχθηκε για εξαιρετικά μεγάλης κλίμακας οικιακά συμπλέγματα υπολογιστικής ισχύος μπορεί να επεκταθεί στην κλίμακα των 100.000 διακομιστών και χρησιμοποιείται για την εκπαίδευση μοντέλων με 174 τρισεκατομμύρια παραμέτρους.

▲ shi tianhui, συνιδρυτής του qingcheng jizhi

ο huang xiaobo, διευθυντής μάρκετινγκ τεχνολογίας της xinhe semiconductor, είπε ότι η ζήτηση για υπολογιστική ισχύ έχει αυξηθεί κατά 60.000 φορές τα τελευταία 20 χρόνια και μπορεί να φτάσει τις 100.000 φορές τα επόμενα 10 χρόνια. τα ολοκληρωμένα συστήματα τσιπετ έχουν γίνει σημαντική κατεύθυνση για καινοτομίες σε προηγμένους περιορισμούς διεργασιών και βελτιώσεις υπολογιστικής ισχύος υψηλής απόδοσης στην εποχή μετά το moore. έχουν χρησιμοποιηθεί ευρέως σε τσιπ μεγάλης υπολογιστικής ισχύος ai και σε τσιπ μεταγωγής δικτύων υπολογιστικής ισχύος.

από αυτή την άποψη, η xinhe semiconductor παρέχει μια ενιαία πλατφόρμα eda προσομοίωσης πολλαπλών φυσικών για το σχεδιασμό και την ανάπτυξη ολοκληρωμένων συστημάτων chiplet. η πλατφόρμα υποστηρίζει παραμετρική μοντελοποίηση δομών διασύνδεσης σε κύρια σχέδια διεργασιών και οι δυνατότητες προσομοίωσής της είναι 10 φορές πιο γρήγορες από άλλες πλατφόρμες. διαθέτει επίσης ενσωματωμένη ανάλυση πρωτοκόλλου hbm/ucie αποδοτικότητα έχει κερδίσει βραβεία από πολλούς εγχώριους και ξένους ηγέτες σχεδιασμού τσιπ υπολογιστικής ισχύος για να βοηθήσει στην επιτάχυνση της εφαρμογής ολοκληρωμένων προϊόντων υπολογιστικής ισχύος.

▲ huang xiaobo, technology marketing director της xinhe semiconductor

κατά την εκπαίδευση μεγάλων μοντέλων, η υποδομή δικτύου αντιπροσωπεύει το 30% του κόστους, υπογραμμίζοντας τη σημασία της απόδοσης του δικτύου. σύμφωνα με τον zhu jundong, συνιδρυτή της qimo και αντιπρόεδρο προϊόντων και λύσεων, το δίκτυο έχει γίνει το σημείο συμφόρησης των έξυπνων υπολογιστικών επιδόσεων. και διασύνδεση εντός τσιπ.

τα μεγάλα συμπλέγματα υπολογιστών νοημοσύνης απαιτούν διασύνδεση υψηλής απόδοσης και το modernize rdma και τα chiplets έχουν γίνει βασικές τεχνολογίες. προκειμένου να βελτιστοποιηθεί το rdma, η σειρά πυρήνων επιτάχυνσης δικτύου ndsa της qimo βασίζεται σε μια προγραμματιζόμενη αρχιτεκτονική ροής πολλών πυρήνων και χρησιμοποιεί μια μηχανή δεδομένων υψηλής απόδοσης για την επίτευξη ροής δεδομένων υψηλής απόδοσης και ευέλικτης επιτάχυνσης δεδομένων. το gpu link chiplet "ndsa-g2g" που πρωτοστάτησε η ge βασίζεται στην υποδομή ethernet και χρησιμοποιεί μηχανή δεδομένων υψηλής απόδοσης και τεχνολογία διασύνδεσης d2d για την επίτευξη υψηλού εύρους ζώνης σε επίπεδο terabyte δικτύου scale-up, με απόδοση συγκρίσιμη με το σημείο αναφοράς της παγκόσμιας διασύνδεσης τεχνολογία.

▲zhu jundong, συνιδρυτής της qimo και αντιπρόεδρος προϊόντων και λύσεων

η alphawave είναι μια εταιρεία που παρέχει λύσεις σχεδιασμού ip, chiplet και asic για εφαρμογές hpc, ai και δικτυακών υψηλών ταχυτήτων. ο guo dawei, ο ανώτερος διευθυντής επιχειρήσεων στην περιοχή ασίας-ειρηνικού, μοιράστηκε ότι ως απάντηση στα προβλήματα που αντιμετωπίζουν κατά τη μετάδοση δεδομένων, τα προϊόντα alphawave ip έχουν ποσοστό σφάλματος μικρότερο κατά 2 τάξεις από τα ανταγωνιστικά προϊόντα ενσωμάτωση και επαλήθευση, και είναι βαθιά ενσωματωμένα με το οικοσύστημα του βραχίονα. μπορούν επίσης να παρέχουν πλήρη υποστήριξη κύκλου ζωής για τα soc των πελατών.

όσον αφορά τα chiplet, η alphawave βοηθά τους πελάτες να συντομεύσουν τον κύκλο, να μειώσουν το κόστος και να βελτιώσουν την απόδοση και την ταχύτητα επανάληψης. έχει πλέον κατασκευάσει το πρώτο chiplet σύνδεσης io πολλαπλών πρωτοκόλλων, το οποίο κυκλοφόρησε φέτος. όσον αφορά τα εξατομικευμένα τσιπ, η alphawave εστιάζει κυρίως σε διεργασίες κάτω των 7 nm και μπορεί να ολοκληρώσει ολόκληρη τη διαδικασία από τις προδιαγραφές έως το tape-out σύμφωνα με τις ανάγκες των πελατών. 25.

▲guo dawei, ανώτερος επιχειρηματικός διευθυντής της περιοχής alphawave asia pacific

συμπέρασμα: η κατάντη νοημοσύνη αυξάνεται και τα τσιπ ai αντιμετωπίζουν ιστορικές ευκαιρίες

στο δρόμο προς το απόλυτο θέμα της γενικής τεχνητής νοημοσύνης, η μορφή των αλγορίθμων ai συνεχίζει να αλλάζει και τα τσιπ ai ακολουθούν το παράδειγμά τους. όταν το αρχαίο χαλίκι συναντά τη μελλοντική νοημοσύνη των μηχανών, η τεχνολογία και η σοφία της μηχανικής συγχωνεύονται και συγκρούονται τσιπ τεχνητής νοημοσύνης με εξαιρετική σχεδίαση εισέρχονται σε συμπλέγματα υπολογιστών και εισέρχονται σε χιλιάδες νοικοκυριά, υποστηρίζοντας την εξέλιξη της ζωής που βασίζεται στο πυρίτιο.

από έξυπνα κέντρα υπολογιστών και έξυπνη οδήγηση έως υπολογιστές τεχνητής νοημοσύνης, κινητά τηλέφωνα τεχνητής νοημοσύνης και νέο υλικό τεχνητής νοημοσύνης, η τάση της μεταγενέστερης νοημοσύνης έχει φέρει ένα νέο κύμα ιστορικών ευκαιριών σε τσιπ τεχνητής νοημοσύνης που εδραιώνουν διαφορετικά σενάρια. οι ταχέως αναπτυσσόμενοι αλγόριθμοι και εφαρμογές τεχνητής νοημοσύνης συνεχίζουν να ξεκλειδώνουν νέες προκλήσεις υπολογιστικής ισχύος. η τεχνολογική καινοτομία και η ζήτηση της αγοράς προωθούν διπλά την επέκταση της αγοράς τσιπ τεχνητής νοημοσύνης και διαφοροποιούν το ανταγωνιστικό τοπίο των τσιπ ai.

στις 7 σεπτεμβρίου, το global ai chip summit 2024 θα συνεχίσει να παρέχει εντατικές πληροφορίες: μια ειδική συνεδρία για την καινοτομία αρχιτεκτονικής τσιπ τεχνητής νοημοσύνης και μια ειδική συνεδρία για τσιπ τεχνητής νοημοσύνης αιχμής/τελικής πλευράς θα πραγματοποιηθεί στον κύριο χώρο και το "2024 china's οι 20 κορυφαίες εταιρείες λύσεων έξυπνων υπολογιστών» και «2024 υπάρχουν δύο λίστες με τις «top 10 αναδυόμενες εταιρείες τεχνικών τεχνολογιών τεχνητής νοημοσύνης της κίνας» το φόρουμ τεχνολογίας intelligent computing cluster και το china risc-v computing chip innovation forum. .