Νέα

Το "AI Box" της NVIDIA αναβαθμίζει και κυκλοφορεί λογισμικό και υπηρεσίες και η Jen-Hsun Huang δημιουργεί ένα ψηφιακό αντίγραφο του φυσικού κόσμου

2024-07-30

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

Text/Tencent Technology Li Haidan Editor/Guo Xiaojing

Στις 30 Ιουλίου, ώρα Πεκίνου, η NVIDIA (γνωστή και ως NVIDIA) παρουσίασε πολλές από τις τελευταίες της εξελίξεις στους τομείς της απόδοσης, της προσομοίωσης και της δημιουργίας τεχνητής νοημοσύνης στο SIGGRAPH 2024, ένα κορυφαίο συνέδριο γραφικών υπολογιστών που πραγματοποιήθηκε στο Ντένβερ των ΗΠΑ.

Στο περσινό SIGGRAPH, η NVIDIA παρουσίασε τις κάρτες γραφικών GH200, L40S και ChatUSD. Ο φετινός πρωταγωνιστής είναι το νέο ατού της NVIDIA στην εποχή της γενετικής τεχνητής νοημοσύνης——Νέα αναβάθμιση "Nvidia NIM".και εφαρμόστε τη γενετική τεχνητή νοημοσύνη σε USD (καθολική περιγραφή σκηνής) μέσω NIM, διευρύνοντας τις δυνατότητες της τεχνητής νοημοσύνης στον τρισδιάστατο κόσμο.

Αναβάθμιση NIM Nvidia: ευλογία και πρόκληση

Η Nvidia ανακοίνωσε ότι η Nvidia NIM επιτυγχάνει περαιτέρω βελτιστοποίηση και τυποποιεί τη σύνθετη ανάπτυξη μοντέλων AI. Το NIM είναι βασικό μέρος της διάταξης AI της NVIDIA. Ο Huang Renxun έχει επανειλημμένα επαινέσει την καινοτομία που έφερε η NIM, αποκαλώντας την "Το AI-in-a-Box, ουσιαστικά είναι τεχνητή νοημοσύνη σε κουτί。”

Αυτή η αναβάθμιση αναμφίβολα εδραιώνει την ηγετική θέση της Nvidia στον τομέα της τεχνητής νοημοσύνης και γίνεται σημαντικό μέρος της τεχνολογικής της τάφρου.

Το CUDA θεωρείται εδώ και καιρό βασικός παράγοντας στην ηγετική θέση της Nvidia στον τομέα της GPU. Με την υποστήριξη του CUDA, η GPU έχει εξελιχθεί από έναν μόνο επεξεργαστή γραφικών σε μια παράλληλη υπολογιστική συσκευή γενικής χρήσης, καθιστώντας δυνατή την ανάπτυξη AI. Ωστόσο, παρόλο που το οικοσύστημα λογισμικού της Nvidia είναι πολύ πλούσιο, αυτά τα κατακερματισμένα συστήματα εξακολουθούν να είναι πολύ περίπλοκα και δύσκολο να κυριαρχήσουν για παραδοσιακές βιομηχανίες που δεν διαθέτουν βασικές δυνατότητες ανάπτυξης τεχνητής νοημοσύνης.

Προκειμένου να λύσει αυτό το πρόβλημα, τον Μάρτιο του τρέχοντος έτους, η Nvidia κυκλοφόρησε NIM (Nvidia Inference Microservices) στο συνέδριο GTC, ενσωματώνοντας όλο το λογισμικό που αναπτύχθηκε τα τελευταία χρόνια για να απλοποιήσει και να επιταχύνει την ανάπτυξη εφαρμογών AI. Η NIM μπορεί να χρησιμοποιήσει μοντέλα ως βελτιστοποιημένα "κοντέινερ" που μπορούν να αναπτυχθούν στο cloud, στο κέντρο δεδομένων ή στο σταθμό εργασίας, επιτρέποντας στους προγραμματιστές να ολοκληρώσουν την εργασία σε λίγα λεπτά, όπως η εύκολη δημιουργία εφαρμογών τεχνητής νοημοσύνης για co-pilots, chatbot κ.λπ. .

Μέχρι τώρα, το οικοσύστημα NIM της Nvidia έχει παράσχει μια σειρά προεκπαιδευμένων μοντέλων τεχνητής νοημοσύνης.ανακοίνωσε η Nvidia, βοηθώντας τους προγραμματιστές να επιταχύνουν την ανάπτυξη και την ανάπτυξη εφαρμογών σε πολλούς τομείς και εστιάζοντας σε διαφορετικούς τομείς (όπως η κατανόηση,ψηφιακός άνθρωπος, τρισδιάστατη ανάπτυξη, ρομποτική και ψηφιακή βιολογία) διαθέσιμα συγκεκριμένα μοντέλα AI:

Στην κατεύθυνση της κατανόησης, το NIM μπορεί να χρησιμοποιήσει το Llama 3.1 και το NeMo Retriever για να βελτιώσει τις δυνατότητες επεξεργασίας δεδομένων κειμένου προς την κατεύθυνση των ψηφιακών ανθρώπων, παρέχει μοντέλα όπως το Parakeet ASR και το FastPitch HiFiGAN, τα οποία υποστηρίζουν σύνθεση ομιλίας υψηλής πιστότητας και αυτόματη. Αναγνώριση ομιλίας για τη δημιουργία εικονικών βοηθών και ψηφιακών ανθρώπων Παρέχει ισχυρά εργαλεία.

Όσον αφορά την ανάπτυξη 3D, μοντέλα όπως το USD Code και το USD Search απλοποιούν τη δημιουργία και τη λειτουργία τρισδιάστατων σκηνών, βοηθώντας τους προγραμματιστές να δημιουργήσουν πιο αποτελεσματικά ψηφιακούς δίδυμους και εικονικούς κόσμους.

Στην κατεύθυνση της ενσάρκωσης του ρομπότ, η NVIDIA κυκλοφόρησε τα μοντέλα MimicGen και Robocasa. Επιταχύνετε την ανάπτυξη και την εφαρμογή της ρομποτικής δημιουργώντας δεδομένα συνθετικής κίνησης και περιβάλλοντα προσομοίωσης. Το MimicGen NIM μπορεί να δημιουργήσει δεδομένα συνθετικής κίνησης με βάση δεδομένα απομακρυσμένης λειτουργίας που έχουν καταγραφεί από χωρικές υπολογιστικές συσκευές όπως το Apple Vision Pro. Το Robocasa NIM δημιουργεί ρομποτικές εργασίες και περιβάλλοντα έτοιμα για προσομοίωση στο OpenUSD, ένα παγκόσμιο πλαίσιο ανάπτυξης και συνεργασίας στον τρισδιάστατο κόσμο.

Μοντέλα όπως το DiffDock και το ESMFold στον τομέα της ψηφιακής βιολογίας παρέχουν προηγμένες λύσεις στην ανακάλυψη φαρμάκων και στην πρόβλεψη αναδίπλωσης πρωτεϊνών, προάγοντας την πρόοδο της βιοϊατρικής έρευνας και ούτω καθεξής.

Επιπλέον, η Nvidia ανακοίνωσε ότι η πλατφόρμα συμπερασμάτων Hugging Face-as-a-service τροφοδοτείται επίσης από την Nvidia NIM και εκτελείται στο cloud.

Με την ενσωμάτωση αυτών των ευέλικτων μοντέλων, το οικοσύστημα της Nvidia όχι μόνο βελτιώνει την αποτελεσματικότητα της ανάπτυξης τεχνητής νοημοσύνης, αλλά παρέχει και καινοτόμα εργαλεία και λύσεις. Ωστόσο, αν και οι πολλές αναβαθμίσεις της Nvidia NIM είναι πράγματι «καλά νέα» για τον κλάδο. Αλλά από την άλλη πλευρά, φέρνει επίσης πολλές προκλήσεις στους προγραμματιστές.

Η Nvidia NIM απλοποιεί σημαντικά τη διαδικασία ανάπτυξης και εγκατάστασης μοντέλων τεχνητής νοημοσύνης παρέχοντας προεκπαιδευμένα μοντέλα τεχνητής νοημοσύνης και τυποποιημένα API ?Εξάλλου, οι επιχειρήσεις μπορούν να χρησιμοποιήσουν λιγότερο τεχνικό προσωπικό για να ολοκληρώσουν την ίδια εργασία, επειδή αυτές οι εργασίες έχουν ολοκληρωθεί εκ των προτέρων από το NIM και οι απλοί προγραμματιστές μπορεί να μην χρειάζεται πλέον να εκτελούν σύνθετες εργασίες εκπαίδευσης και συντονισμού μοντέλων.

Διδάξτε την τεχνητή νοημοσύνη να σκέφτεται τρισδιάστατα και να δημιουργήσετε έναν εικονικό φυσικό κόσμο

Η NVIDIA έδειξε επίσης την εφαρμογή της γενετικής τεχνητής νοημοσύνης στις ανοιχτές πλατφόρμες USD και Omniverse στο συνέδριο SIGGRAPH.

Η Nvidia ανακοίνωσε ότι κατασκεύασε το πρώτο μοντέλο παραγωγής τεχνητής νοημοσύνης στον κόσμο που μπορεί να κατανοήσει τη γλώσσα, τη γεωμετρία, τα υλικά, τη φυσική και τον χώρο του OpenUSD (Universal Scene Description), και συσκευάσει αυτά τα μοντέλα ως μικροϋπηρεσίες NIM Nvidia.Επί του παρόντος, υπάρχουν τρία NIM διαθέσιμα για προεπισκόπηση στον κατάλογο API της Nvidia: Κωδικός USD, ο οποίος απαντά σε ανοιχτές ερωτήσεις γνώσεων USD και δημιουργεί ανοιχτό κώδικα USD Python USD, ο οποίος επιτρέπει στους προγραμματιστές να αναζητούν το τεράστιο ανοιχτό USD 3D χρησιμοποιώντας φυσική γλώσσα ή εισαγωγή εικόνας και βάση δεδομένων εικόνων Επικύρωση USD, η οποία ελέγχει τα μεταφορτωμένα αρχεία για συμβατότητα με ανοιχτές εκδόσεις USD και δημιουργεί εικόνες που έχουν εντοπιστεί με πλήρη απόδοση RTX χρησιμοποιώντας το Omniverse Cloud API.

Η Nvidia είπε ότι με τη βελτίωση και την προσβασιμότητα του OpenUSD από τις μικροϋπηρεσίες Nvidia NIM, όλα τα κοινωνικά στρώματα μπορούν να δημιουργήσουν εικονικούς κόσμους βασισμένους στη φυσική και ψηφιακά δίδυμα στο μέλλον. Με τη νέα γενετική τεχνητή νοημοσύνη που βασίζεται σε ανοιχτά πλαίσια ανάπτυξης USD και επιταχυνόμενης Nvidia που έχουν δημιουργηθεί στην πλατφόρμα Nvidia Omniverse, περισσότερες βιομηχανίες μπορούν τώρα να αναπτύξουν εφαρμογές για οπτικοποίηση έργων βιομηχανικού σχεδιασμού και μηχανικής, καθώς και για περιβάλλοντα προσομοίωσης για τη δημιουργία του επόμενου κύματος φυσικής τεχνητής νοημοσύνης και ρομπότ . Επιπλέον, μια νέα υποδοχή USD συνδέει μορφές δεδομένων ρομποτικής και βιομηχανικής προσομοίωσης και εργαλεία προγραμματιστών, επιτρέποντας στους χρήστες να μεταδίδουν σε ροή δεδομένων μεγάλης κλίμακας, πλήρως Nvidia RTX με ανίχνευση ακτίνων στο Apple Vision Pro.

Εν ολίγοις, η εισαγωγή του USD μέσω της Nvidia NIM για την καλύτερη κατανόηση του φυσικού κόσμου και τη δημιουργία εικονικών κόσμων μέσω μεγάλων μοντέλων είναι ένα πολύτιμο πλεονέκτημα.ψηφιακά στοιχεία . Για παράδειγμα, το 2019, ο καθεδρικός ναός της Παναγίας των Παρισίων της Γαλλίας υπέστη σοβαρή πυρκαγιά και μεγάλες περιοχές της εκκλησίας καταστράφηκαν. Ευτυχώς, οι σχεδιαστές παιχνιδιών της Ubisoft έχουν επισκεφτεί αυτό το κτίριο αμέτρητες φορές, μελέτησαν τη δομή του, ολοκλήρωσαν την ψηφιακή αποκατάσταση της Notre Dame και αναδημιούργησαν την Notre Dame στο παιχνίδι 3A "Assassin's Creed: Unity" Όλες οι λεπτομέρειες έφεραν επίσης μεγάλη βοήθεια στην αποκατάσταση του Notre Dame de Paris. Εκείνη την εποχή, οι σχεδιαστές και οι ιστορικοί χρειάστηκαν δύο χρόνια για να αναπαραχθούν, αλλά με την εισαγωγή αυτής της τεχνολογίας, μπορούμε να επιταχύνουμε την αναπαραγωγή ψηφιακών αντιγράφων σε μεγάλη κλίμακα στο μέλλον και να χρησιμοποιήσουμε την τεχνητή νοημοσύνη για να κατανοήσουμε και να αναπαράγουμε τη φυσική με πιο εκλεπτυσμένο τρόπο. τρόπο.

Για ένα άλλο παράδειγμα, οι σχεδιαστές κατασκευάζουν βασικές τρισδιάστατες σκηνές στο Omniverse και χρησιμοποιούν αυτές τις σκηνές για να προσαρμόσουν τη γενετική τεχνητή νοημοσύνη για να επιτύχουν μια ελεγχόμενη και συνεργατική διαδικασία δημιουργίας περιεχομένου. Για παράδειγμα, η WPP και η The Coca-Cola Company ήταν οι πρώτες που υιοθέτησαν αυτήν τη ροή εργασιών για να επεκτείνουν τις παγκόσμιες διαφημιστικές τους καμπάνιες.

Η Nvidia ανακοίνωσε επίσης την επερχόμενη κυκλοφορία αρκετών νέων μικροϋπηρεσιών NIM, συμπεριλαμβανομένων των USD Layout, USD Smart Material και FDB Mesh Generation, για να βελτιώσει περαιτέρω τις δυνατότητες εφαρμογών και την αποτελεσματικότητα των προγραμματιστών στην ανοιχτή πλατφόρμα USD.

Αυτή τη φορά η NVIDIA Research συμμετείχε στο συνέδριο με περισσότερες από 20 εργασίες, μοιράζοντας καινοτόμα αποτελέσματα σχετικά με την προώθηση της ανάπτυξης συνθετικών γεννητριών δεδομένων και εργαλείων αντίστροφης απόδοσης, δύο από τα οποία κέρδισαν το βραβείο τεχνικού καλύτερου χαρτιού. Η έρευνα που παρουσιάστηκε φέτος δείχνει ότιΤο AI κάνει τις δυνατότητες προσομοίωσης ακόμα καλύτερες βελτιώνοντας την ποιότητα εικόνας και ξεκλειδώνοντας νέους τρόπους τρισδιάστατης αναπαράστασης ;Επίσης, βελτιωμένοι παραγωγοί συνθετικών δεδομένων και περισσότερο βελτιώνουν το επίπεδο της τεχνητής νοημοσύνης. Αυτές οι μελέτες παρουσιάζουν τις τελευταίες προόδους και καινοτομίες της Nvidia στην τεχνητή νοημοσύνη και την προσομοίωση.

Η Nvidia λέει ότι οι σχεδιαστές και οι καλλιτέχνες έχουν τώρα νέους τρόπους για να βελτιώσουν την παραγωγικότητά τους χρησιμοποιώντας γενετική τεχνητή νοημοσύνη που έχει εκπαιδευτεί σε επιτρεπόμενα δεδομένα. Για παράδειγμα, η Shutterstock (Αμερικανός προμηθευτής εικόνας) κυκλοφόρησε μια εμπορική έκδοση beta της υπηρεσίας παραγωγής 3D. Επιτρέπει στους δημιουργούς να δημιουργήσουν γρήγορα πρωτότυπα στοιχεία 3D και να δημιουργήσουν φόντο 360 HDRi για να φωτίσουν σκηνές χρησιμοποιώντας μόνο μηνύματα κειμένου ή εικόνας και η Getty Images (εταιρεία ανταλλαγής φωτογραφιών των ΗΠΑ) επιτάχυνε την υπηρεσία δημιουργίας τεχνητής νοημοσύνης για να κάνει τη δημιουργία εικόνων γρηγορότερη. Αυτές οι υπηρεσίες βασίζονται στο Nvidia Edify, την πολυτροπική αρχιτεκτονική τεχνητής νοημοσύνης, με νέα μοντέλα που είναι δύο φορές πιο γρήγορα, βελτιώνουν την ποιότητα εικόνας και την άμεση ακρίβεια και επιτρέπουν στους χρήστες να ελέγχουν τις ρυθμίσεις της κάμερας, όπως το βάθος πεδίου ή την εστίαση. Οι χρήστες μπορούν να δημιουργήσουν τέσσερις εικόνες σε περίπου έξι δευτερόλεπτα και να τις αναβαθμίσουν σε ανάλυση 4K.

συμπέρασμα

Σε κάθε σημαντική περίσταση όπου εμφανίζεται ο Χουάνγκ, φοράει πάντα ένα δερμάτινο μπουφάν και περιγράφει στον κόσμο το συναρπαστικό μέλλον που επιφέρει η τεχνητή νοημοσύνη.

Βιώνουμε επίσης την ανάπτυξη της NVIDIA, βλέποντας τη NVIDIA βήμα προς βήμα από έναν γίγαντα gaming GPU σε έναν κυρίαρχο τσιπ AI, και στη συνέχεια σε μια διάταξη πλήρους στοίβας κάθετου και οριζόντιου λογισμικού και υλικού AI Η NVIDIA είναι γεμάτη φιλοδοξίες και επαναλαμβάνεται γρήγορα στην πρώτη γραμμή του κύματος τεχνολογίας AI.

Από προγραμματιζόμενη GPU σκίασης, CUDA accelerated computing, μέχρι το λανσάρισμα της Nvidia Omniverse και των παραγωγικών μικροϋπηρεσιών AI NIM, στην προώθηση της ανάπτυξης τρισδιάστατης μοντελοποίησης, προσομοίωσης ρομπότ και ψηφιακής διπλής τεχνολογίας, σημαίνει επίσης ότι ένας νέος γύρος καινοτομίας στο AI έρχεται η βιομηχανία.

Ωστόσο, καθώς οι μεγάλες εταιρείες διαθέτουν περισσότερους πόρους, συμπεριλαμβανομένων κεφαλαίων, τεχνολογίας και ανθρώπινου δυναμικού, είναι σε θέση να υιοθετήσουν και να εφαρμόσουν προηγμένες τεχνολογίες όπως η Nvidia NIM πιο γρήγορα. Λόγω των περιορισμένων πόρων, οι μικρές και μεσαίες επιχειρήσεις ενδέχεται να δυσκολεύονται να συμβαδίσουν με τον ρυθμό της τεχνολογικής ανάπτυξης. Σε συνδυασμό με τις διαφορές στα τεχνικά επίπεδα των ταλέντων, θα οδηγήσει σε περισσότερη τεχνολογική ανισότητα στο μέλλον;

Η ιδανική τεχνητή νοημοσύνη της ανθρωπότητας είναι να βοηθά τους ανθρώπους να λύσουν τα χέρια και να εργάζονται και να φέρουν έναν κόσμο με υψηλότερη παραγωγικότητα. Αλλά όταν η παραγωγικότητα και τα μέσα παραγωγής ελέγχονται από μικρό αριθμό ανθρώπων, θα πυροδοτήσει μια βαθύτερη κρίση; Όλα αυτά είναι ερωτήματα που πρέπει να σκεφτούμε.