νέα

Διάλογος με τον Xiong Dapeng, Πρόεδρο της Yizhu Technology: Η ενοποίηση της αποθήκευσης και της πληροφορικής μπορεί να ξεκινήσει τη δεύτερη καμπύλη ανάπτυξης της υπολογιστικής ισχύος στην εποχή της AI

2024-08-14

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

Η έκρηξη της τεχνητής νοημοσύνης (AI) έχει προκαλέσει τεράστια ζήτηση για υπολογιστική ισχύ Στη μετα-Moore εποχή, οι προηγμένες διαδικασίες κατασκευής τσιπ πλησιάζουν τα φυσικά όρια και η ενοποίηση της αποθήκευσης και της πληροφορικής αναμένεται να γίνει μια από τις σημαντικές τεχνολογικές διαδρομές. στο μέλλον.
Η αποθήκευση και ο υπολογισμός είναι ενσωματωμένοι, δηλαδή η αποθήκευση δεδομένων και ο υπολογισμός ενσωματώνονται στην ίδια περιοχή του ίδιου τσιπ. Σε ποιες πτυχές αντικατοπτρίζονται τα πλεονεκτήματα απόδοσης και κόστους των ολοκληρωμένων τσιπ αρχιτεκτονικής αποθήκευσης και υπολογιστών; Ποιες είναι οι τρέχουσες προκλήσεις που αντιμετωπίζει η μεγάλης κλίμακας εμπορευματοποίηση; Θα γίνει η ενοποίηση της αποθήκευσης και της πληροφορικής μια δυνατότητα για την εγχώρια βιομηχανία τσιπ να αλλάξει λωρίδα και να την προσπεράσει;
Το China Business News είχε πρόσφατα μια ανταλλαγή απόψεων με τον Xiong Dapeng, ιδρυτή, πρόεδρο και διευθύνοντα σύμβουλο της Yizhu Technology, σχετικά με τα παραπάνω θέματα. Κατά την άποψή του, η ολοκληρωμένη τεχνολογία αποθήκευσης και υπολογιστών έχει δυνατότητες μετασχηματισμού στο μελλοντικό τομέα της πληροφορικής και θα σπάσει τον νόμο του Moore και θα ξεκινήσει τη δεύτερη καμπύλη ανάπτυξης της υπολογιστικής ισχύος. «Ειδικά στην εποχή της τεχνητής νοημοσύνης, αυτή η τεχνολογία μπορεί να γίνει βασικός παράγοντας για την ανάπτυξη της υπολογιστικής ισχύος».
Σπάστε την αρχιτεκτονική von Neumann και εξαλείψτε τρία μεγάλα προβλήματα
Σύμφωνα με την παραδοσιακή αρχιτεκτονική von Neumann, οι λειτουργίες υπολογισμού και αποθήκευσης ολοκληρώνονται από υπολογιστικές μονάδες (CPU, GPU, κ.λπ. XPU) και μονάδες αποθήκευσης αντίστοιχα. Τα δεδομένα λαμβάνονται από τη μνήμη και επιστρέφονται στη μνήμη μετά την επεξεργασία.
"Σήμερα, όταν επικρατούν μεγάλα μοντέλα, οι παράμετροι του μοντέλου πρέπει να μετακινηθούν για να ολοκληρωθούν οι υπολογισμοί. Ο αριθμός των παραμέτρων είναι πολύ μεγάλος και ο χρόνος που δαπανάται αντιπροσωπεύει ένα υψηλό ποσοστό, ακόμη και περισσότερο από 80%. Σε ορισμένες περιπτώσεις, αυτό Ως εκ τούτου, το εύρος ζώνης δεδομένων περιορίζει το πραγματικό. Η αποτελεσματική απόδοση του τσιπ μπορεί να είναι ένα P, αλλά η πραγματική απόδοση μπορεί να είναι πολύ χαμηλότερη από αυτόν τον αριθμό είπε το China Business News.
Μαζί με το πρόβλημα του «προβλήματος του τοιχώματος αποθήκευσης», καταναλώνεται μεγάλη ποσότητα ενέργειας στη διαδικασία μετάδοσης, με αποτέλεσμα τη σημαντική μείωση της αναλογίας ενεργειακής απόδοσης του τσιπ, που είναι το «πρόβλημα του ενεργειακού τοίχου».
Επιπλέον, υπάρχει το πρόβλημα του "τοίχου μεταγλώττισης" - δηλαδή, ο δυναμικός προγραμματισμός ροής δεδομένων είναι πολύπλοκος και ο μεταγλωττιστής δεν μπορεί να βελτιστοποιήσει αυτόματα τους χειριστές και τα εκτελέσιμα προγράμματα για να επιτύχει βελτιστοποίηση ροής δεδομένων υπό στατικές και προβλέψιμες συνθήκες και πρέπει να βασίζεται σε μη αυτόματο συντονισμός για την επίτευξη αυτού του στόχου Η υψηλότερη αποτελεσματική υπολογιστική ισχύς αυξάνει το χρόνο και το κόστος εργασίας της πραγματικής ανάπτυξης και μετάβασης. «Αυτά τα τρία σημεία έχουν περιορίσει σημαντικά την ανάπτυξη της βιομηχανίας τεχνητής νοημοσύνης, η οποία έχει ολοένα και μεγαλύτερη έλλειψη πόρων και έχει αυξήσει σημαντικά την κατανάλωση ενέργειας».
Η ενσωματωμένη τεχνολογία αποθήκευσης και υπολογιστών σπάει την αρχιτεκτονική von Neumann, ενσωματώνει λειτουργίες αποθήκευσης και υπολογιστικές λειτουργίες στο ίδιο τσιπ και χρησιμοποιεί απευθείας μονάδες αποθήκευσης για την επεξεργασία δεδομένων Τροποποιώντας την αρχιτεκτονική υπολογιστών στη μνήμη του κυκλώματος "ανάγνωσης". στο κύκλωμα "ανάγνωσης" "Τα αποτελέσματα της λειτουργίας λαμβάνονται στο κύκλωμα και τα αποτελέσματα "γράφονται" απευθείας στη διεύθυνση προορισμού της μνήμης. Δεν απαιτούνται πλέον συχνές μεταφορές δεδομένων μεταξύ της υπολογιστικής μονάδας και της μονάδας αποθήκευσης. την κατανάλωση που προκαλείται από τη μετακίνηση δεδομένων και μειώνοντας σημαντικά την κατανάλωση ενέργειας, βελτιώνοντας σημαντικά την υπολογιστική απόδοση.
"Η ολοκληρωμένη τεχνολογία αποθήκευσης και υπολογιστών αναμένεται να γίνει μια από τις σημαντικές τεχνικές διαδρομές στην εποχή μετά τον Moore. Από την πρώτη αρχή της αποτελεσματικής υπολογιστικής ισχύος, για την αποθήκευση και την υπολογιστική ολοκλήρωση, η ποσότητα της μεταφοράς δεδομένων μειώνεται σημαντικά και η αποτελεσματική Η υπολογιστική ισχύς παρουσιάζει γραμμική ανάπτυξη Μπορεί να ειπωθεί ότι η ολοκλήρωση υπολογιστών θα σπάσει τον νόμο του Moore και θα ανοίξει τη δεύτερη καμπύλη ανάπτυξης της υπολογιστικής ισχύος δυναμικό στον μελλοντικό τομέα των υπολογιστών, ειδικά στην εποχή της τεχνητής νοημοσύνης, αυτή η τεχνολογία μπορεί να γίνει βασικός παράγοντας για την προώθηση της ανάπτυξης της υπολογιστικής ισχύος», δήλωσε ο Xiong Dapeng.
Μια λύση με καλύτερη ενεργειακή απόδοση και απόδοση κόστους
Σε σύγκριση με το πρόσφατα δημοφιλές τσιπ μνήμης υψηλού εύρους ζώνης HBM, το ολοκληρωμένο τσιπ αρχιτεκτονικής αποθήκευσης και υπολογιστών έχει καλύτερη ενεργειακή απόδοση συστήματος και απόδοση κόστους.
Το HBM είναι μια τεχνολογία διασύνδεσης μνήμης υψηλής απόδοσης που χρησιμοποιείται κυρίως για τη βελτίωση των δυνατοτήτων επεξεργασίας δεδομένων των συστημάτων GPU και υπολογιστών υψηλής απόδοσης (HPC). Αυτή η τεχνολογία αυξάνει δραματικά το εύρος ζώνης στοιβάζοντας τα τσιπ DRAM κάθετα και συνδέοντάς τα σφιχτά στον επεξεργαστή χρησιμοποιώντας διασυνδέσεις υψηλής ταχύτητας.
"Το HBM είναι μια αποτελεσματική τεχνική διαδρομή για την επίλυση του προβλήματος του "τοίχου αποθήκευσης", αλλά απαιτεί κόστος και κατανάλωση ενέργειας, επειδή η παροχή μεγάλου εύρους ζώνης απαιτεί μεγαλύτερη κατανάλωση ενέργειας και η τιμή είναι επίσης πολύ ακριβή, ξεπερνώντας κατά πολύ την τιμή της παραδοσιακής DRAM." Ο Xiong Dapeng είπε, "Ουσιαστικά, το HBM είναι ένα τσιπ μνήμης και δεν έχει υπολογιστικές λειτουργίες. Πρέπει να συνδυαστεί με υπολογιστικά τσιπ όπως το GPGPU για να επιτευχθούν υπολογιστικές λειτουργίες."
Από την άποψη του κόστους του συστήματος, το ολοκληρωμένο τσιπ αποθήκευσης και υπολογιστών μπορεί να είναι χαμηλότερο από τον συνδυασμό της παραδοσιακής GPGPU και HBM.
Από τη μία πλευρά, οφείλεται στην υψηλότερη πυκνότητα υπολογιστικής ισχύος ή PPA της ολοκληρωμένης αρχιτεκτονικής αποθήκευσης και υπολογιστών. "Το ισοδύναμο εύρος ζώνης δεδομένων της ολοκληρωμένης αρχιτεκτονικής αποθήκευσης και υπολογιστών είναι πολύ μεγαλύτερο από αυτό του HBM, το οποίο μπορεί να είναι πολλές φορές ή και δέκα φορές η διαφορά. Ταυτόχρονα, η πυκνότητα υπολογιστικής ισχύος του είναι πιο συμφέρουσα. Η πραγματική αποτελεσματική υπολογιστική ισχύς , η απόδοση κόστους και η αναλογία ενεργειακής απόδοσης θα είναι πολύ υψηλότερα από τη λύση GPGPU+HBM», δήλωσε ο Xiong Dapeng.
Από την άλλη πλευρά, η ολοκληρωμένη τεχνολογία αποθήκευσης και υπολογιστών εξαρτάται σχετικά λιγότερο από προηγμένες διαδικασίες, ενώ τόσο η GPGPU όσο και η HBM βασίζονται σε μεγάλο βαθμό σε προηγμένες διαδικασίες. "Η HBM βασίζεται σε προηγμένες διαδικασίες και έχει μεγάλους κινδύνους από την αλυσίδα εφοδιασμού. Ωστόσο, εάν υιοθετήσει την ολοκληρωμένη οδό τεχνολογίας αποθήκευσης και υπολογιστών, ακόμη και αν δεν χρησιμοποιεί προηγμένες διαδικασίες, όπως 12nm και 22nm, η απόδοση μπορεί να μην είναι χειρότερη από 4nm ή Ακόμα και 3 nm είναι επίσης μια αλλαγή.
Όσον αφορά την απόδοση κόστους, αν και η ολοκληρωμένη αποθήκευση και η υπολογιστική μπορεί να απαιτούν περισσότερα τσιπ για την επίτευξη της ίδιας απόδοσης, η υψηλή απόδοση κόστους και ο υψηλός λόγος ενεργειακής απόδοσης είναι ένα από τα σημαντικά πλεονεκτήματά του.
Ενδέχεται να εφαρμοστεί σε μεγάλη κλίμακα στον τομέα των μεγάλων μοντέλων τα επόμενα 2-3 χρόνια.
Η έρευνα και η εφαρμογή της ολοκληρωμένης τεχνολογίας αποθήκευσης και υπολογιστών επιταχύνονται σε όλο τον κόσμο.
Προς το παρόν, μεγάλες εταιρείες υπολογιστικών τσιπ στο εξωτερικό που υιοθετούν την ολοκληρωμένη διαδρομή αποθήκευσης και υπολογιστών περιλαμβάνουν την εκκίνηση τσιπ τεχνητής νοημοσύνης Groq, η οποία αποτιμάται σε περισσότερα από 2,8 δισεκατομμύρια δολάρια και θεωρείται ισχυρός ανταγωνιστής της Nvidia απέκτησε τις Microsoft, Temasek, Samsung, Marvell, Hainan κ.λπ. Η Lux, η Ericsson και πολλές άλλες εταιρείες έχουν επενδύσει.
Επιπλέον, η Samsung έχει επίσης δημοσιεύσει έρευνα για τον υπολογισμό στη μνήμη που βασίζεται σε MRAM στο Nature και έχει αποδείξει την υψηλή ακρίβεια του αλγορίθμου της AI. Η SK Hynix κυκλοφόρησε προϊόντα υπολογιστών σε μνήμη DRAM που βασίζονται στη διεπαφή GDDR, η οποία μπορεί να αυξήσει σημαντικά την υπολογιστική ταχύτητα και να μειώσει την κατανάλωση ενέργειας.
"Απ' όσο γνωρίζω, οι περισσότερες εταιρείες στο εξωτερικό εφαρμόζουν αποθήκευση και υπολογιστές με βάση SRAM, αλλά η χωρητικότητά του είναι χαμηλή και το κόστος υψηλό. Για παράδειγμα, η πλήρης λύση του Groq απαιτεί περισσότερα από 570 τσιπ. Εάν χρησιμοποιηθεί το NVIDIA H100, ο αριθμός των τσιπ είναι μόνο σε μονοψήφια νούμερα.
Ωστόσο, όταν η υπολογιστική ισχύς των ολοκληρωμένων τσιπ αποθήκευσης και υπολογιστών επεκτείνεται σε μεγάλη κλίμακα, εξακολουθεί να αντιμετωπίζει πολλές προκλήσεις: πρώτον, το πρόβλημα της αναξιόπιστης ακρίβειας, δεύτερον, με βάση τους αναλογικούς υπολογισμούς, η μετατροπή από ψηφιακό σε αναλογικό φέρνει συμφόρηση στην ενέργεια Κατανάλωση, μέγεθος και απόδοση Τρίτον, τα μεγάλα μοντέλα τεχνητής νοημοσύνης έχουν απαιτήσεις χωρητικότητας.
"Η πλήρως ψηφιακή διαδρομή μπορεί να λύσει καλά αυτά τα προβλήματα, η οποία είναι επίσης η βάση για την Yizhu Technology για την ανάπτυξη τσιπ συμπερασμάτων μεγάλης υπολογιστικής ισχύος AI."
Σε ένα γενικό ολοκληρωμένο σύστημα αναλογικής αποθήκευσης και υπολογιστών, τα δεδομένα αποθηκεύονται με τη μορφή αναλογικών σημάτων, που αντιπροσωπεύονται από διαφορετικά επίπεδα τάσης εντός της μονάδας αποθήκευσης, και λειτουργίες όπως το MAC εκτελούνται με βάση το νόμο του Ohm και τους νόμους του Kirchhoff. Το μεγαλύτερο πρόβλημα με αυτήν την προσέγγιση είναι ότι η ακρίβεια και η ακρίβεια δεν είναι αξιόπιστες, λόγω του θορύβου του αναλογικού κυκλώματος και των διαφόρων μεταβλητών. Ανεξάρτητα από τη διαδικασία κατασκευής ή το περιβάλλον εργασίας, οι τιμές που αντιπροσωπεύονται από το memristor θα έχουν σφάλματα ή μετατοπίσεις. Οι ψηφιακές-αναλογικές υβριδικές μέθοδοι προσπαθούν να εξισορροπήσουν ζητήματα απόδοσης και ακρίβειας, αλλά και πάλι δεν μπορούν να εγγυηθούν υψηλή ακρίβεια και αξιοπιστία.
Ο Xiong Dapeng εισήγαγε ότι η λύση της Yizhu Technology είναι μια πλήρως ψηφιακή αποθήκευση και ενοποίηση υπολογιστών που βασίζεται στο memristor (ReRAM). Επειδή είναι πλήρως ψηφιακό, τα δεδομένα τοποθετούνται στη μονάδα αποθήκευσης σε δυαδική μορφή. μπορεί να είναι αξιόπιστο.
Επιπλέον, η ανάπτυξη ολοκληρωμένης αποθήκευσης και υπολογιστών αντιμετωπίζει επίσης προβλήματα υλοποίησης έργων. "Ως νέα τεχνολογική διαδρομή, ο τρόπος χρήσης και ενσωμάτωσης στην υπάρχουσα οικολογία είναι μια μεγάλη πρόκληση. Ο προγραμματισμός και η συμβατότητα με την υπάρχουσα οικολογία είναι ζωτικής σημασίας."
Συνολικά, η ολοκληρωμένη τεχνολογία αποθήκευσης και υπολογιστών θεωρείται παγκοσμίως ως ένα αποτελεσματικό μέσο για την επίλυση της αντίφασης μεταξύ της υψηλής ζήτησης υπολογιστικής ισχύος και του υψηλού κόστους κατανάλωσης ενέργειας. Τα επόμενα χρόνια, καθώς η τεχνολογία συνεχίζει να ωριμάζει και η ζήτηση στην αγορά αυξάνεται, τα ολοκληρωμένα τσιπ αποθήκευσης και υπολογιστών αναμένεται να χρησιμοποιηθούν ευρέως σε πολλούς τομείς και να προωθήσουν την καινοτόμο ανάπτυξη ολόκληρης της βιομηχανίας. Επί του παρόντος, η εφαρμογή ολοκληρωμένων τσιπ αποθήκευσης και υπολογιστών στον τομέα των μεγάλων μοντέλων βρίσκεται ακόμη σε στάδιο ανάπτυξης και η Xiong Dapeng προβλέπει ότι θα εφαρμοστεί σε μεγάλη κλίμακα τα επόμενα 2-3 χρόνια.
(Αυτό το άρθρο προέρχεται από το China Business News)
Αναφορά/Σχόλια