Mengunjungi produktivitas baru di Beijing·Keluar dari laboratorium｜Model besar yang tak terlihat, berita

Mengunjungi Produktivitas Baru Beijing·Di Luar Laboratorium｜Model besar yang tak terlihat, produktivitas yang terlihat

2024-08-05

Pada tahun 2017, kecerdasan buatan dimasukkan dalam laporan kerja pemerintah Tiongkok untuk pertama kalinya dan menjadi strategi nasional. Pada tahun 2018, Institut Penelitian Kecerdasan Buatan Zhiyuan Beijing (selanjutnya disebut "Zhiyuan") lahir di sebuah kantor kecil terkemuka. ruang inovasi. Saat itu, model GPT generasi pertama yang diluncurkan oleh OpenAI belum menjadi berita utama media.

Pada tahun 2023, Zhiyuan meningkatkan model kecerdasan ultra-besar pertama di negara saya "Wudao" menjadi 3.0, menjadi salah satu dari tiga institusi AI paling mutakhir di dunia menurut Presiden Microsoft Brad Smith. Di bidang model besar, Zhiyuan adalah satu-satunya lembaga penelitian non-perusahaan di dunia yang tidak didukung oleh produsen besar. Zhiyuan juga merupakan lembaga penelitian baru pertama di Tiongkok yang secara sistematis menggelar penelitian dan pengembangan teknologi model besar, secara terbuka sumber konstruksi ekologi, pelatihan bakat dan budidaya perusahaan.

“Persamaan hak dalam ilmu pengetahuan dan teknologi selalu memunculkan peluang industri besar di masa lalu.” Wang Zhongyuan, presiden baru Zhiyuan, yang memiliki pengalaman korporat dan latar belakang di lembaga penelitian, memiliki pemahaman yang lebih mendalam tentang industri yang diberdayakan teknologi. . Definisi kecerdasan buatan di negara ini juga lebih spesifik: kecerdasan buatan adalah mesin penting bagi pengembangan kekuatan produktif baru.

Bekerja keras untuk tetap berada di depan badai

Sekali atau dua kali, CEO Dark Side of the Moon Yang Zhilin dikelilingi oleh peserta setidaknya tiga kali di Konferensi Zhiyuan Beijing 2024. Ketika pendiri OpenAI Sam Altman memberikan pidato video di Konferensi Zhiyuan setahun yang lalu, kegelisahan juga terlihat jelas. .

Dari tahun 2023 hingga 2024, ilmuwan AI, CEO perusahaan teknologi besar, dan pendiri perusahaan rintisan ternama akan berkumpul di berbagai tempat untuk berkhotbah tentang model besar. Baik mereka ahli teknis atau bukan, semua orang di panggung kurang lebih pernah mendengarnya nama Zhiyuan. Banyak dari mereka yang terlibat langsung dalam proyek penelitian model skala besar Zhiyuan saat itu. CTO Baidu Wang Haifeng pernah menjabat sebagai direktur Zhiyuan, Tang Jie, pendiri Zhipu AI, menjabat sebagai wakil presiden Zhiyuan, dan Yang Zhilin berpartisipasi dalam penelitian dan pengembangan Wu Dao.

Para trendsetter AI ini tidak terlibat dengan Zhiyuan saat ini, dan Zhiyuan tidak terlibat dalam model besar hanya setelah model tersebut menjadi populer.

Pada tahun 2019, Zhiyuan mulai membuat model besar. Pada tahun 2020, Zhiyuan membentuk tim peneliti Wudao dan meluncurkan penelitian dan pengembangan model besar. Pada bulan Maret 2021, model besar Wu Dao 1.0 pertama kali diluncurkan, dan pada bulan Juni, Wu Dao 2.0 diluncurkan. Wisdom menggunakan 1,75 triliun parameter untuk menciptakan rekor model besar "terbesar di dunia" pada saat itu model besar GPT-3 pada saat itu.

Penelitian ilmiah memperhatikan somatosensori, mengajukan pertanyaan dan membuat penilaian. Penilaian bahwa "era model besar kecerdasan buatan akan datang" memberi Zhiyuan keberanian tanpa pamrih. Bahkan istilah China "model besar" pertama kali dikemukakan oleh Zhiyuan.

Apa itu model besar? Huang Tiejun, ketua Institut Penelitian Zhiyuan, percaya bahwa tiga syarat harus dipenuhi: skala besar, dengan parameter melebihi puluhan miliar; muncul, mampu menghasilkan kemampuan baru yang tidak terduga dan serbaguna, tidak terbatas pada masalah atau bidang khusus, mampu menangani Banyak tugas berbeda.

Pada tahun 2023, model besar akan menjadi perhatian publik. Model seri Wudao telah ditingkatkan ke versi 3.0, mencakup model besar dasar seperti bahasa, penglihatan, dan multi-modalitas, dan sepenuhnya open source. Dalam diskusi model dasar di Universitas Stanford saat itu, Intelligent Source menduduki peringkat bersama raksasa teknologi seperti Google, Microsoft, dan Facebook (sekarang Meta), menjadi lembaga perwakilan penelitian model besar di dunia.

“Munculnya sebagian besar hasil penelitian dalam sejarah tidak disengaja, dan tidak ada yang bisa merencanakannya. Semua upaya dilakukan untuk meningkatkan kemungkinan – untuk mempertemukan para peneliti terkemuka dan memberi mereka lingkungan komunitas tempat mereka dapat saling bertukar ide, menemukan masalah, dan temukan mitra kolaboratif. "Kata pengantar yang ditulis oleh Zhang Hongjiang, ketua pendiri Zhiyuan Research Institute, pada otobiografi pemenang Turing Award Yann LeCun lebih seperti alasan mengapa Zhiyuan menjadi yang pertama.

Lakukan rekayasa sistem

Pada awal tahun 2018, Beijing mengeluarkan "Langkah-Langkah Implementasi Beijing untuk Mendukung Pembangunan Lembaga Penelitian dan Pengembangan Baru Kelas Dunia" untuk melakukan lompatan reformasi sistem ilmu pengetahuan dan teknologi. Pada bulan Desember, dengan bimbingan dan dukungan dari Kementerian Sains dan Teknologi serta Komite dan Pemerintah Partai Kota Beijing, Zhiyuan secara resmi didirikan.

Sebelumnya, proses pengelolaan penelitian ilmiah bersifat kompleks, dengan siklus yang panjang mulai dari proposal proyek hingga panduan pelepasan hingga permohonan pendanaan dan peninjauan, sehingga sulit untuk beradaptasi dengan kebutuhan penelitian ilmiah yang selalu berubah dalam lingkungan yang sangat kompetitif. Menurut sistem ini, lembaga penelitian mengajukan proposal proyek pada Oktober 2020, dan penelitian model berskala besar baru dapat diluncurkan secara resmi paling cepat pada tahun 2022. Model Zhiyuan membutuhkan waktu kurang dari 5 bulan sejak pendirian proyek hingga peluncuran model besar.

Ini adalah jenis lembaga penelitian dan pengembangan baru antara universitas dan perusahaan. Xin Zai tidak menggunakan kertas sebagai indeks evaluasi akhir, juga tidak menggunakan produk sebagai indeks evaluasi, tetapi untuk membangun sistem inovatif. Xin Zai menyatukan para sarjana dari berbagai institusi dan perusahaan seperti Universitas Tsinghua, Universitas Peking, Laboratorium Kecerdasan Buatan Facebook, Baidu, dll. Hal-hal besar; hal baru adalah membidik masalah-masalah besar, memperhatikan masalah-masalah ilmiah utama, dan membuat rencana berwawasan ke depan.

“Model universitas telah beroperasi selama beberapa dekade, dan sulit untuk melakukan penelitian dan pengembangan yang sistematis, terorganisir, berskala besar, dan lintas tim. Perusahaan juga akan berinvestasi dalam penelitian dan pengembangan, namun mereka lebih cenderung melakukan penelitian dan pengembangan yang erat kaitannya dengan penelitian dan pengembangan. terkait dengan bisnis. Zhiyuan akan melakukan proyek penelitian 3 hingga A yang akan memakan waktu 5 tahun atau lebih untuk melihat hasilnya,” kata Wang Zhongyuan dalam wawancara eksklusif dengan reporter dari Beijing Business Daily.

Saat ini, kepercayaan Zhiyuan masih terletak pada tekad negaranya dalam kecerdasan buatan. Pada bulan Maret 2024, Li Qiang, anggota Komite Tetap Biro Politik Komite Sentral CPC dan Perdana Menteri Dewan Negara, menjelaskan selama penyelidikan di Beijing: Kecerdasan buatan adalah mesin penting untuk pengembangan kekuatan produktif baru .

Produktivitas baru adalah keadaan produktivitas maju di mana inovasi memainkan peran utama, melepaskan diri dari mode pertumbuhan ekonomi tradisional dan jalur pengembangan produktivitas, memiliki karakteristik teknologi tinggi, efisiensi tinggi dan kualitas tinggi, serta sesuai dengan konsep pembangunan baru. Hal ini lahir dari terobosan teknologi yang revolusioner, alokasi faktor produksi yang inovatif, serta transformasi dan peningkatan industri yang mendalam. "Persamaan hak dalam ilmu pengetahuan dan teknologi telah menciptakan peluang industri yang besar di masa lalu, dan model-model besar dapat membawa kesetaraan baru dalam ilmu pengetahuan dan teknologi," Wang Zhongyuan yakin.

Misalnya, model besar adalah pembawa "kecerdasan", gelombang yang berpusat pada AI adalah operasi intelijen, lapisan bawah adalah sistem perangkat lunak dan perangkat keras teknis, lapisan atas adalah aplikasi AI, dan model besar berada di tengah-tengah keduanya, memainkan peran "batang". Arti penting dari model besar ini adalah untuk mengubah "kecerdasan" menjadi layanan publik seperti air, listrik, dan Internet, serta menyediakan layanan AI kepada sejumlah besar perusahaan atau individu melalui komputasi awan.

Ini adalah proyek yang sistematis. "Membutuhkan investasi sumber daya dan tenaga kerja yang terkonsentrasi. Tidak bisa dilakukan oleh banyak orang tetapi masing-masing melakukannya secara terpisah, tetapi harus dibentuk sistem teknis." Huang Tiejun mencontohkan, "Mengembangkan kecerdasan buatan adalah seperti pembuatan baja dan pembangkit listrik. Diperlukan serangkaian sistem teknis yang lengkap untuk memastikan produksi baja berkualitas tinggi dan pembangkit listrik yang stabil dengan biaya yang relatif rendah,” kata Huang Tiejun.

Melangkah lebih jauh dari industri

Sistem teknis yang dibangun oleh Zhiyuan meliputi: bucket keluarga model besar, sistem operasi model besar, kumpulan data, kerangka pelatihan, perpustakaan operator, dll. Prestasi ini serta visi dan tujuan Chi Yuan digantung di dinding lantai pertama Gedung Chi Yuan.

Visi dan tujuan tersebut dibagi menjadi lima bagian besar, termasuk mekanisme dan pengembangan industri, yang dapat disimpulkan sebagai inovasi. "Zhiyuan ingin mengembangkan teknologi kecerdasan buatan yang paling mutakhir, memimpin dan memprediksi perkembangan kecerdasan buatan, dan melangkah lebih jauh dari industri." Wang Zhongyuan menjelaskan secara rinci, "Zhiyuan akan melakukan hal-hal yang tidak dapat dilakukan oleh universitas dan perusahaan tidak mau melakukannya yang harus dilakukan. Penelitian dan pengembangan, proyek penelitian yang memerlukan waktu 3 hingga 5 tahun atau bahkan lebih lama untuk melihat hasilnya."

Dalam pandangannya, ketika kemampuan teknis model besar mencapai tingkat tertentu, akan ada dua arah utama. "Satu arah adalah berintegrasi dengan produk, mempromosikan aplikasi, dan memberikan nilai komersial. Di sisi lain, ada sejumlah kecil institusi yang terus melakukan Iterasi dan optimalisasi model-model besar teratas. Baik perusahaan maupun lembaga penelitian, mereka harus terus menangani teknologi-teknologi utama."

Misalnya, dalam multi-modalitas, sebagian besar perusahaan domestik memilih arsitektur DiT untuk penelitian dan pengembangan. "Ini karena DiT adalah rute yang terbukti. Zhiyuan berharap untuk menempatkan berbagai modalitas informasi, seperti teks, gambar, video, dan suara, ke dalam satu model pelatihan sejak awal." Wang Zhongyuan menggunakan analogi otak manusia, Model besar multi-modal semacam ini dapat melihat dunia, memahami, dan bernalar. Di masa depan, model besar yang dikombinasikan dengan perangkat keras, yaitu kecerdasan yang diwujudkan, dapat memasuki dunia fisik untuk melayani manusia.

Perusahaan tetap dekat dengan pasar dan mencari skenario ke atas, sementara lembaga penelitian dan pengembangan fokus pada terobosan teknologi inti dan memberikan dukungan ke bawah. Sumber Kebijaksanaan termasuk dalam tipe kedua, yang jauh dari aplikasi dan skenario, tetapi menggunakan sumber terbuka sebagai pendukungnya. industri.

“Kecerdasan buatan tidak setara dengan model besar, ini hanyalah sebuah genre kecerdasan buatan,” jelas Wang Zhongyuan kepada reporter Beijing Business Daily. Sumber Cerdas saat ini juga memanfaatkan teknologi kecerdasan buatan lainnya seperti penelitian mirip otak dan jantung digital, yang berarti bahwa tidak ada batasan atas imajinasi kecerdasan buatan di industri lain.

Reporter Harian Bisnis Beijing, Wei Wei

berita

Mengunjungi Produktivitas Baru Beijing·Di Luar Laboratorium｜Model besar yang tak terlihat, produktivitas yang terlihat

Perkenalan

informasi kontak saya