berita

Peningkatan “kotak AI” Nvidia, Huang Renxun ingin membuat salinan digital dunia fisik

2024-07-30

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

Teknologi Teks/Tencent Li Haidan

Pada tanggal 30 Juli waktu Beijing, NVIDIA (juga dikenal sebagai NVIDIA) mendemonstrasikan banyak perkembangan terbarunya di bidang rendering, simulasi, dan AI generatif di SIGGRAPH 2024, sebuah konferensi grafis komputer terkemuka yang diadakan di Denver, AS.

Pada SIGGRAPH tahun lalu, NVIDIA meluncurkan GH200, kartu grafis L40S, dan ChatUSD. Protagonis tahun ini adalah kartu truf baru NVIDIA di era AI generatif——Peningkatan baru "Nvidia NIMS"., dan menerapkan AI generatif pada USD (deskripsi pemandangan universal) melalui NIM, memperluas kemungkinan AI di dunia 3D.

Peningkatan Nvidia NIMS: berkah sekaligus tantangan

Nvidia mengumumkan bahwa Nvidia NIMS mencapai optimalisasi lebih lanjut dan menstandarisasi penerapan model AI yang kompleks. NIMS adalah bagian penting dari tata letak AI NVIDIA. Huang Renxun berulang kali memuji inovasi yang dibawa oleh NIM dengan menyebutnya "AI-in-a-Box, pada dasarnya adalah kecerdasan buatan di dalam sebuah kotak。”

Peningkatan ini tidak diragukan lagi mengkonsolidasikan posisi kepemimpinan Nvidia di bidang AI dan menjadi bagian penting dari parit teknologinya.

CUDA telah lama dianggap sebagai faktor kunci kepemimpinan Nvidia di bidang GPU. Dengan dukungan CUDA, GPU telah berkembang dari prosesor grafis tunggal menjadi perangkat komputasi paralel untuk keperluan umum, sehingga memungkinkan pengembangan AI. Namun, meskipun ekosistem perangkat lunak NVIDIA sangat kaya, sistem yang terfragmentasi ini masih terlalu kompleks dan sulit dikuasai oleh industri tradisional yang tidak memiliki kemampuan dasar pengembangan AI.

Untuk mengatasi masalah ini, pada bulan Maret tahun ini, Nvidia meluncurkan layanan mikro cloud-native NIM (Nvidia Inference Microservices) di konferensi GTC, mengintegrasikan semua perangkat lunak yang dikembangkan dalam beberapa tahun terakhir untuk menyederhanakan dan mempercepat penerapan aplikasi AI. NIM dapat menggunakan model sebagai "kontainer" yang dioptimalkan yang dapat diterapkan di cloud, pusat data, atau stasiun kerja, sehingga memungkinkan pengembang menyelesaikan pekerjaan dalam hitungan menit, seperti dengan mudah membangun aplikasi AI generatif untuk co-pilot, chatbot, dll.

Hingga kini, ekosistem NIM Nvidia telah menyediakan serangkaian model AI terlatih.Nvidia mengumumkan, membantu pengembang mempercepat pengembangan dan penerapan aplikasi di berbagai bidang, dan berfokus pada berbagai bidang (seperti pemahaman,manusia digital, pengembangan 3D, robotika, dan biologi digital) tersedia model AI spesifik:

Dalam arah pemahaman, NIM dapat menggunakan Llama 3.1 dan NeMo Retriever untuk meningkatkan kemampuan pemrosesan data teks; dalam arah manusia digital, NIM menyediakan model seperti Parkit ASR dan FastPitch HiFiGAN, yang mendukung sintesis ucapan dengan ketelitian tinggi dan otomatis. pengenalan suara untuk membangun asisten virtual dan manusia digital.

Dalam hal pengembangan 3D, model seperti USD Code dan USD Search menyederhanakan pembuatan dan pengoperasian adegan 3D, membantu pengembang membangun digital twins dan dunia virtual dengan lebih efisien;

Sehubungan dengan perwujudan robot, NVIDIA telah meluncurkan model MimicGen dan Robocasa. Mempercepat pengembangan dan penerapan robotika dengan menghasilkan data gerak sintetik dan lingkungan simulasi. MimicGen NIM dapat menghasilkan data gerakan sintetis berdasarkan data operasi jarak jauh yang direkam oleh perangkat komputasi spasial seperti Apple Vision Pro. Robocasa NIM menghasilkan tugas robotik dan lingkungan siap simulasi di OpenUSD, kerangka kerja universal untuk pengembangan dan kolaborasi di dunia 3D.

Model seperti DiffDock dan ESMFold di bidang biologi digital memberikan solusi canggih dalam penemuan obat dan prediksi pelipatan protein, mendorong kemajuan penelitian biomedis, dan sebagainya.

Selain itu, Nvidia mengumumkan bahwa platform inferensi sebagai layanan Hugging Face juga didukung oleh Nvidia NIM dan berjalan di cloud.

Dengan mengintegrasikan model serbaguna ini, ekosistem Nvidia tidak hanya meningkatkan efisiensi pengembangan AI, namun juga menyediakan alat dan solusi inovatif. Namun, meski banyaknya upgrade Nvidia NIM memang menjadi "kabar baik" bagi industri. Namun di sisi lain, hal tersebut juga membawa banyak tantangan bagi para programmer.

Nvidia NIM sangat menyederhanakan proses pengembangan dan penerapan model AI dengan menyediakan model AI terlatih dan API terstandar. Ini memang merupakan keuntungan besar bagi pengembang, tetapi apakah ini juga berarti peluang kerja bagi pemrogram biasa di masa depan? ?Lagi pula, perusahaan dapat menggunakan lebih sedikit tenaga teknis untuk menyelesaikan pekerjaan yang sama, karena tugas-tugas ini telah diselesaikan oleh NIM sebelumnya, dan pemrogram biasa mungkin tidak perlu lagi melakukan pelatihan model yang rumit dan pekerjaan penyetelan.

Ajari AI untuk berpikir dalam 3D dan membangun dunia fisik virtual

NVIDIA juga mendemonstrasikan penerapan AI generatif pada platform terbuka USD dan Omniverse pada konferensi SIGGRAPH.

Nvidia mengumumkan bahwa mereka telah membangun model AI generatif pertama di dunia yang dapat memahami bahasa, geometri, material, fisika, dan ruang OpenUSD (Universal Scene Description), dan mengemas model ini sebagai layanan mikro Nvidia NIM.Saat ini, ada tiga NIM yang tersedia untuk pratinjau di katalog API Nvidia: USD Code, yang menjawab pertanyaan pengetahuan USD terbuka dan menghasilkan kode USD Python USD Search, yang memungkinkan pengembang untuk mencari USD 3D terbuka yang luas menggunakan input bahasa atau gambar alami; dan database gambar; Validasi USD, yang memeriksa kompatibilitas file yang diunggah dengan rilis USD terbuka dan menghasilkan gambar yang ditelusuri jalur yang sepenuhnya dirender RTX menggunakan Omniverse Cloud API.

Nvidia mengatakan dengan peningkatan dan aksesibilitas layanan mikro OpenUSD oleh Nvidia NIM, semua lapisan masyarakat dapat membangun dunia virtual berbasis fisika dan kembaran digital di masa depan. Dengan AI generatif baru berdasarkan USD terbuka dan kerangka pengembangan akselerasi Nvidia yang dibangun pada platform Nvidia Omniverse, lebih banyak industri kini dapat mengembangkan aplikasi untuk memvisualisasikan desain industri dan proyek rekayasa, serta untuk lingkungan simulasi untuk membangun gelombang berikutnya dari AI fisika dan robot. . Selain itu, konektor USD baru menghubungkan format data robotika dan simulasi industri serta alat pengembang, memungkinkan pengguna melakukan streaming kumpulan data ray-tracing Nvidia RTX sepenuhnya dalam skala besar ke Apple Vision Pro.

Singkatnya, pengenalan USD melalui Nvidia NIM, yang memungkinkan kita untuk lebih memahami dunia fisik dan membangun dunia virtual melalui model besar, adalah aset yang sangat berharga.aset digital . Misalnya, pada tahun 2019, Katedral Notre Dame di Paris, Prancis mengalami kebakaran hebat, dan sebagian besar gereja hancur. Untungnya, desainer game Ubisoft telah mengunjungi gedung ini berkali-kali, mempelajari strukturnya, menyelesaikan restorasi digital Notre Dame, dan membuat ulang Notre Dame dalam game 3A "Assassin's Creed: Unity" Semua detailnya juga sangat membantu restorasi Notre Nyonya de Paris. Saat itu, desainer dan sejarawan membutuhkan waktu dua tahun untuk mereproduksinya, namun dengan diperkenalkannya teknologi ini, kita dapat mempercepat reproduksi salinan digital dalam skala besar di masa depan, dan menggunakan AI untuk memahami dan mereproduksi fisika dengan cara yang lebih halus. cara.dunia.

Contoh lainnya, desainer membuat adegan tiga dimensi dasar di Omniverse dan menggunakan adegan ini untuk menyesuaikan AI generatif guna mencapai proses pembuatan konten yang terkendali dan kolaboratif. Misalnya, WPP dan The Coca-Cola Company adalah perusahaan pertama yang mengadopsi alur kerja ini untuk memperluas kampanye periklanan global mereka.

Nvidia juga mengumumkan peluncuran beberapa layanan mikro NIM baru, termasuk USD Layout, USD Smart Material, dan FDB Mesh Generation, untuk lebih meningkatkan kemampuan dan efisiensi aplikasi pengembang pada platform USD terbuka.

Kali ini NVIDIA Research berpartisipasi dalam konferensi tersebut dengan lebih dari 20 makalah, berbagi hasil inovatif terkait dengan promosi pengembangan generator data sintetis dan alat rendering terbalik, dua di antaranya memenangkan Technical Best Paper Award. Penelitian yang dipresentasikan tahun ini menunjukkan hal ituAI membuat kemampuan simulasi menjadi lebih baik dengan meningkatkan kualitas gambar dan membuka cara baru dalam representasi 3D ;Juga, generator data sintetis yang ditingkatkan dan tingkat AI yang lebih baik. Studi-studi ini menunjukkan kemajuan dan inovasi terbaru Nvidia dalam AI dan simulasi.

Nvidia mengatakan desainer dan seniman kini memiliki cara baru untuk meningkatkan produktivitas mereka dengan menggunakan AI generatif yang dilatih pada data yang diizinkan. Misalnya, Shutterstock (pemasok gambar Amerika) meluncurkan versi beta komersial dari layanan 3D generatifnya. Hal ini memungkinkan pembuat konten dengan cepat membuat prototipe aset 3D dan menghasilkan latar belakang 360 ​​HDRi untuk menerangi pemandangan hanya dengan menggunakan perintah teks atau gambar; dan Getty Images (perusahaan pertukaran foto AS) mempercepat layanan AI generatifnya untuk membuat pembuatan gambar lebih cepat dua kali lipat untuk meningkatkan kualitas keluaran. Berdasarkan Nvidia Edify, arsitektur AI generatif multi-modal, layanan ini menggandakan kecepatan dibandingkan model-model baru, meningkatkan kualitas gambar dan akurasi cepat, serta memungkinkan pengguna mengontrol pengaturan kamera seperti kedalaman bidang atau fokus. Pengguna dapat menghasilkan empat gambar dalam waktu sekitar enam detik dan meningkatkannya ke resolusi 4K.

Kesimpulan

Dalam setiap acara besar dimana Huang muncul, dia selalu mengenakan jaket kulit dan menjelaskan kepada dunia tentang masa depan menarik yang dibawa oleh AI.

Kami juga mengalami pertumbuhan NVIDIA, menyaksikan NVIDIA selangkah demi selangkah dari raksasa GPU gaming menjadi penguasa chip AI, dan kemudian menjadi tata letak penuh perangkat lunak dan perangkat keras AI vertikal dan horizontal. NVIDIA penuh dengan ambisi dan melakukan iterasi dengan cepat di garis depan gelombang teknologi AI.

Dari GPU shading yang dapat diprogram, komputasi yang dipercepat CUDA, hingga peluncuran Nvidia Omniverse dan layanan mikro AI NIM generatif, hingga promosi pengembangan pemodelan 3D, simulasi robot, dan teknologi digital twin, ini juga berarti babak baru inovasi dalam AI. industri akan datang.

Namun, karena perusahaan besar memiliki lebih banyak sumber daya, termasuk modal, teknologi, dan tenaga kerja, mereka dapat mengadopsi dan menerapkan teknologi canggih seperti Nvidia NIMS dengan lebih cepat. Karena keterbatasan sumber daya, usaha kecil dan menengah mungkin mengalami kesulitan mengikuti laju perkembangan teknologi. Ditambah dengan perbedaan tingkat teknis dari para talenta, apakah hal ini akan menyebabkan lebih banyak kesenjangan teknologi di masa depan?

AI yang ideal bagi umat manusia adalah membantu manusia membebaskan tangan dan tenaga mereka serta mewujudkan dunia dengan produktivitas yang lebih tinggi. Namun ketika produktivitas dan sarana produksi dikuasai oleh segelintir orang, apakah akan memicu krisis yang lebih parah? Ini semua adalah pertanyaan yang perlu kita pikirkan.