Νέα

Η Nvidia στέλνει δείγματα Blackwell αυτή την εβδομάδα, κυκλοφορεί ενημέρωση για την υποστήριξη της δημιουργίας 3D και μοντέλων ρομπότ

2024-07-30

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

Συντάκτης αυτού του άρθρου: Li Dan

Πηγή: Hard AI

Τη Δευτέρα 29 Ιουλίου, Eastern Time, η NVIDIA παρουσίασε νέα εργαλεία στο SIGGRAPH 2024, το ετήσιο συνέδριο και έκθεση γραφικών υπολογιστών και διαδραστικής τεχνολογίας που πραγματοποιήθηκε στο Ντένβερ των Η.Π.Α.

Ο Διευθύνων Σύμβουλος της Nvidia, Huang Renxun, αποκάλυψε στο SIGGRAPH 2024 ότι αυτή την εβδομάδα η Nvidia θα στείλει δείγματα της αρχιτεκτονικής Blackwell, η οποία είναι η νέα αρχιτεκτονική chip που κάνει το ντεμπούτο της φέτος. Ταυτόχρονα, η Nvidia ανακοίνωσε μια σειρά ενημερώσεων λογισμικού, που αφορούν κυρίως τη μικρουπηρεσία συμπερασμάτων Nvidia (NIM), μια μικρουπηρεσία εγγενή στο cloud που χρησιμοποιείται για τη βελτιστοποίηση των συμπερασμάτων τεχνητής νοημοσύνης (AI), για την προώθηση μεγάλης κλίμακας ανάπτυξης μοντέλων τεχνητής νοημοσύνης από επιχειρήσεις.

Όταν η NVIDIA κυκλοφόρησε το NIM τον Μάρτιο του τρέχοντος έτους, εισήγαγε ότι η NIM παρέχει βελτιστοποιημένες μικροϋπηρεσίες συμπερασμάτων που έχουν σχεδιαστεί για να συντομεύουν το χρόνο για την αγορά και να απλοποιούν την ανάπτυξη μοντέλων τεχνητής νοημοσύνης οπουδήποτε στο cloud, τα κέντρα δεδομένων και τους σταθμούς εργασίας με επιτάχυνση GPU. Το NIM υποστηρίζει περιπτώσεις χρήσης τεχνητής νοημοσύνης σε πολλούς τομείς, συμπεριλαμβανομένων μοντέλων μεγάλων γλωσσών (LLM), μοντέλων οπτικής γλώσσας (VLM) και μοντέλων για ομιλία, εικόνα, βίντεο, 3D, ανάπτυξη φαρμάκων, ιατρική απεικόνιση και πολλά άλλα.

Οι προγραμματιστές μπορούν να δοκιμάσουν νέα μοντέλα παραγωγής τεχνητής νοημοσύνης χρησιμοποιώντας το φιλοξενούμενο cloud API της NVIDIA ή να φιλοξενήσουν οι ίδιοι το μοντέλο κατεβάζοντας NIM και να αναπτύξουν γρήγορα χρησιμοποιώντας το Kubernetes σε μεγάλους παρόχους cloud ή σε εγκαταστάσεις για να μειώσουν τον χρόνο ανάπτυξης, την πολυπλοκότητα και το κόστος. Οι μικροϋπηρεσίες NIM απλοποιούν τη διαδικασία ανάπτυξης του μοντέλου AI, συσκευάζοντας αλγόριθμους, βελτιστοποιήσεις συστήματος και χρόνου εκτέλεσης και προσθέτοντας βιομηχανικά πρότυπα API. Αυτό δίνει τη δυνατότητα στους προγραμματιστές να ενσωματώσουν το NIM στις υπάρχουσες εφαρμογές και υποδομές τους χωρίς εκτεταμένη προσαρμογή ή εξειδίκευση.

Η ενημέρωση που ανακοινώθηκε από τη NVIDIA τη Δευτέρα επεκτείνει τη βιβλιοθήκη μικροϋπηρεσιών συμπερασμάτων NIM για να καλύψει περιβάλλοντα φυσικού κόσμου, προηγμένη οπτική μοντελοποίηση και διάφορες κάθετες εφαρμογές. Η NVIDIA έχει παράσχει περίπου 100 μικροϋπηρεσίες συμπερασμάτων NIM σε εκδόσεις προεπισκόπησης και τώρα κυκλοφορεί την πλήρη έκδοση. Για παράδειγμα, ως μέρος του νέου NIM της NVIDIA, το API δημιουργίας εικόνων 4K της εταιρείας οπτικών μέσων Getty Images Holdings και η γεννήτρια 3D εικόνας της Shutterstock Inc., ενός παρόχου ψηφιακού περιεχομένου όπως εικόνες, ταινίες και μουσική, θα κυκλοφορήσουν σύντομα . Και οι δύο χρησιμοποιούν το Nvidia Edify της Nvidia, μια πολυτροπική αρχιτεκτονική για τεχνητή νοημοσύνη που δημιουργείται από το όραμα.

Η NVIDIA ανακοίνωσε την ίδια μέρα ότι συνεργάστηκε με το σύνολο εργαλείων επεξεργασίας φυσικής γλώσσας (NLP) και την πλατφόρμα Hugging Face για να ξεκινήσει το συμπέρασμα ως υπηρεσία που θα βοηθήσει τους προγραμματιστές να δημιουργήσουν γρήγορα πρωτότυπα και να αναπτυχθούν στην παραγωγή χρησιμοποιώντας μοντέλα AI ανοιχτού κώδικα που φιλοξενούνται στο Hugging Face Hub. Τα σχόλια ανέφεραν ότι αυτή η συνεργασία θα απλοποιήσει την ανάπτυξη μοντέλων AI για προγραμματιστές.


Το fVDB αξιοποιεί τα τρισδιάστατα δεδομένα του πραγματικού κόσμου για τη δημιουργία χωρικής νοημοσύνης

Μεταξύ αυτών, η NVIDIA κυκλοφόρησε το fVDB, το οποίο χρησιμοποιεί τρισδιάστατα δεδομένα πραγματικού κόσμου για τη δημιουργία χωρικής νοημοσύνης. Η Nvidia ισχυρίζεται ότι το μοντέλο τεχνητής νοημοσύνης με παραγωγικό υλικό μπορεί να κατανοήσει και να εκτελέσει λειτουργίες λεπτών ή ακαθάριστων κινητικών δεξιοτήτων στον υλικό κόσμο. Η κατανόηση και η πλοήγηση στις τρεις διαστάσεις του φυσικού κόσμου απαιτεί χωρική νοημοσύνη. Για να παρέχει αυτό το είδος τεχνητής νοημοσύνης με ένα ισχυρό, συνεκτικό πλαίσιο που μπορεί να χειριστεί ρεαλιστική κλίμακα, η NVIDIA δημιούργησε το fVDB, ένα πλαίσιο βαθιάς μάθησης σχεδιασμένο για αραιή, μεγάλης κλίμακας και υψηλής απόδοσης χωρική νοημοσύνη.

Το fVDB είναι χτισμένο στο OpenVDB, μια δομή και βιβλιοθήκη βιομηχανικών προτύπων για την προσομοίωση και την απόδοση αραιών ογκομετρικών δεδομένων όπως νερό, φωτιά, καπνός και σύννεφα. Το fVDB παρέχει τέσσερις φορές τη χωρική κλίμακα, 3,5 φορές την απόδοση των προηγούμενων πλαισίων και πρόσβαση σε τεράστια σύνολα δεδομένων του πραγματικού κόσμου. Απλοποιεί τη διαδικασία συνδυάζοντας λειτουργικότητα που προηγουμένως απαιτούσε πολλές βιβλιοθήκες βαθιάς εκμάθησης.


Το σπονδυλωτό πλαίσιο ανοιχτού κώδικα Isaac Lab παρέχει προσομοίωση για την επιτάχυνση της εκμάθησης ρομπότ

Η NVIDIA κυκλοφόρησε επίσης το Isaac Lab, ένα αρθρωτό πλαίσιο ανοιχτού κώδικα για εκμάθηση ρομπότ που μπορεί να λύσει τους περιορισμούς των παραδοσιακών μεθόδων εκπαίδευσης στις δεξιότητες εκμάθησης ρομπότ.

Το Isaac Lab παρέχει αρθρωτές προσομοιώσεις υψηλής πιστότητας για διαφορετικά περιβάλλοντα εκπαίδευσης, παρέχοντας δυνατότητες τεχνητής νοημοσύνης στον φυσικό κόσμο και προσομοιώσεις φυσικού κόσμου που βασίζονται σε GPU.

Το Isaac Lab υποστηρίζει τη μάθηση μίμησης (μίμηση ανθρώπων) και την ενισχυτική μάθηση (μάθηση μέσω δοκιμής και λάθους), παρέχοντας ευέλικτες μεθόδους εκπαίδευσης για οποιαδήποτε εφαρμογή ρομπότ. Παρέχει ένα φιλικό προς τον χρήστη περιβάλλον για σενάρια εκπαίδευσης και βοηθά τους κατασκευαστές ρομπότ να προσθέτουν ή να ενημερώνουν τις δεξιότητές τους με βάση τις μεταβαλλόμενες επιχειρηματικές ανάγκες.


Χρησιμοποιήστε τις μικροϋπηρεσίες NVIDIA NIM και VIA για να δημιουργήσετε έναν πράκτορα οπτικής τεχνητής νοημοσύνης που βασίζεται σε VLM

Η NVIDIA έχει προσαρμόσει το NIM για τεχνητή νοημοσύνη στον φυσικό κόσμο, υποστηρίζοντας ομιλία και μετάφραση, όραση και ρεαλιστικά κινούμενα σχέδια και συμπεριφορά. Η NVIDIA κυκλοφορεί τις μικροϋπηρεσίες VIA, οι οποίες είναι πλέον διαθέσιμες για λήψη σε προεπισκόπηση προγραμματιστή.

Οι μικροϋπηρεσίες VIA μπορούν εύκολα να ενσωματωθούν με το NIM και οι χρήστες μπορούν να χρησιμοποιούν ευέλικτα οποιοδήποτε μοντέλο LLM ή VLM στο API προεπισκόπησης μοντέλου της NVIDIA και στον κατάλογο API microservices NIM με δυνατότητα λήψης. Οι μικροϋπηρεσίες VIA, μια επέκταση των μικροϋπηρεσιών Metropolis της NVIDIA, είναι δομικά στοιχεία εγγενή στο cloud που επιταχύνουν την ανάπτυξη οπτικών πρακτόρων τεχνητής νοημοσύνης που βασίζονται σε VLM και NIM, είτε αναπτύσσονται στην άκρη είτε στο σύννεφο.

Με τη βοήθεια τεχνητής νοημοσύνης, μικροϋπηρεσιών NIM και βασικών μοντέλων, οι χρήστες μπορούν πλέον να χρησιμοποιούν λιγότερα μοντέλα για τη δημιουργία εφαρμογών με ευρεία επίγνωση και πλούσια κατανόηση των συμφραζομένων. Το VLM υποστηρίζει οπτικούς πράκτορες τεχνητής νοημοσύνης που μπορούν να κατανοήσουν τα στοιχεία φυσικής γλώσσας και να εκτελέσουν οπτικές απαντήσεις σε ερωτήσεις. Οι πράκτορες οπτικής τεχνητής νοημοσύνης χρησιμοποιούν δυνατότητες όρασης υπολογιστή για να αντιληφθούν και να αλληλεπιδράσουν με τον φυσικό κόσμο και να εκτελέσουν συλλογιστικές εργασίες.

Αυτοί οι πράκτορες μπορούν να ξεκλειδώσουν πλήρως τις δυνατότητες των εφαρμογών σε διάφορους κλάδους Μπορούν να απλοποιήσουν σημαντικά τη ροή εργασίας της ανάπτυξης εφαρμογών και να παρέχουν μετασχηματιστικές νέες δυνατότητες αντίληψης, όπως σύνοψη εικόνων ή βίντεο, διαδραστικές οπτικές ερωτήσεις και απαντήσεις και οπτικές ειδοποιήσεις. Αυτοί οι οπτικοί πράκτορες τεχνητής νοημοσύνης θα αναπτυχθούν σε εργοστάσια, αποθήκες, καταστήματα λιανικής, αεροδρόμια, διασταυρώσεις κυκλοφορίας και άλλα μέρη και θα βοηθήσουν τις ομάδες επιχειρήσεων να λαμβάνουν καλύτερες αποφάσεις αξιοποιώντας πλουσιότερες γνώσεις που δημιουργούνται από φυσικές αλληλεπιδράσεις.


Το Omniverse Replicator βοηθά στην επίλυση προβλημάτων έλλειψης δεδομένων που περιορίζουν την εκπαίδευση μοντέλων

Η NVIDIA παρουσίασε τον τρόπο χρήσης των μικροϋπηρεσιών NIM για τη δημιουργία μιας προσαρμοσμένης γραμμής παραγωγής συνθετικών δεδομένων (SDG) για USD, η οποία χρησιμοποιεί το Omniverse Replicator της NVIDIA. Το Omniverse Replicator είναι ένα SDK που βασίζεται σε Universal Scene Description (OpenUSD) και NVIDIA RTX.

Οι προγραμματιστές μπορούν να χρησιμοποιήσουν τις μικροϋπηρεσίες NIM και το Omniverse Replicator, μεταξύ άλλων, για να δημιουργήσουν αγωγούς SDG που υποστηρίζουν γενετική τεχνητή νοημοσύνη, επιλύοντας ελλείψεις δεδομένων πραγματικού κόσμου που συχνά περιορίζουν την εκπαίδευση μοντέλων.

Ο Rev Lebaredian, αντιπρόεδρος του Omniverse and Simulation Technologies της NVIDIA είπε:

«Κατασκευάσαμε το πρώτο μοντέλο παραγωγής τεχνητής νοημοσύνης στον κόσμο που μπορεί να κατανοήσει τη γλώσσα, τη γεωμετρία, τα υλικά, τη φυσική και το διάστημα με βάση το OpenUSD».

Ο Lebaredian είπε ότι από το 2016, η NVIDIA επενδύει στο OpenUSD για να επιτρέψει σε βιομηχανικές εταιρείες και σε προγραμματιστές τεχνητής νοημοσύνης υλικού να αναπτύξουν μοντέλα υψηλής απόδοσης πιο εύκολα και πιο γρήγορα.

Η NVIDIA συνεργάζεται επίσης με την Apple, η οποία συνίδρυσε τη Συμμαχία OpenUSD, για τη δημιουργία μιας ροής σωλήνων απόδοσης υβριδικών από το Δίκτυο Παράδοσης Γραφικών της NVIDIA, ένα δίκτυο κέντρων δεδομένων έτοιμα για γραφικά, στο Apple Vision Pro της Apple.