berita

Huawei Hubble diam-diam berinvestasi pada dua kelompok orang dari Universitas Tsinghua

2024-08-20

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

Teks/Editor Wang Shuoguo/Yan Ziwei

Dua perusahaan model besar tempat Huawei Hubble diam-diam berinvestasi telah merilis perkembangan baru satu demi satu.

Pada pertengahan Agustus, Facewall Intelligence mengumumkan bahwa seri MiniCPM model bahasa besarnya telah menerima lebih dari satu juta unduhan sejak diluncurkan pada bulan Februari.

Pada akhir Juli, Teknologi Shenshu mendunia dan meluncurkan Vidu, model besar Video Wensheng, dengan kinerja yang dibandingkan dengan Sora.

Intelijen yang Menghadap ke Dinding dan Teknologi Shengshu masing-masing didirikan pada tahun 2022 dan 2023, dan tim intinya semuanya berasal dari Universitas Tsinghua. CEO Wall-Facing Intelligence adalah Li Dahai, mantan CTO Zhihu; CEO Teknologi Shengshu adalah Tang Jiayu, yang belajar di Departemen Ilmu Komputer di Universitas Tsinghua dengan gelar sarjana dan master.

Jalur AI sedang populer, dan Huawei Hubble optimis dengan potensi kedua talenta muda ini.

Tim baru

Hubble Investment adalah lembaga investasi yang sepenuhnya dimiliki oleh Huawei.

Menurut Qichacha, pihaknya memiliki dua entitas yakni Hubble Technology Investment Co., Ltd. dan Shenzhen Hubble Technology Investment Partnership.

Sebelumnya, investasi Huawei Hubble berfokus pada teknologi keras, berinvestasi di sejumlah perusahaan chip semikonduktor. Tahun ini, Huawei secara berturut-turut mendukung dua perusahaan terdepan di Tsinghua, menunjukkan penekanannya pada jalur AI.

Menurut data IT Orange, Hubble berturut-turut bertaruh di bidang kecerdasan buatan tahun ini, dengan jumlah investasi kumulatif sebesar 132 juta yuan.

Ke arah model besar, ia lebih memilih elit dari sekolah bergengsi.

Kedua perusahaan yang berinvestasi di perusahaan tersebut memiliki struktur tim pendiri yang serupa dan keduanya didukung oleh Universitas Tsinghua.

Anggota inti Teknologi Shengshu berasal dari Institut Penelitian Kecerdasan Buatan Universitas Tsinghua, dan tim pendiri Wall-Facing Intelligence lahir dari Laboratorium Pemrosesan Bahasa Alami (THUNLP) sekolah tersebut.

Sekelompok wajah Tsinghua dari manajemen senior bioteknologi. Selain CEO, kepala ilmuwannya adalah Zhu Jun, wakil direktur Institut Kecerdasan Buatan Tsinghua, dan CTO Bao Fan adalah rekan mahasiswa Tang Jiayu dan anggota tim peneliti Zhu Jun.

Dari Juni hingga Agustus tahun lalu, Shengshu Technology menyelesaikan dua putaran pembiayaan berturut-turut dan menerima total ratusan juta yuan. Pada bulan Juni tahun ini, Hubble berinvestasi pada saham dan berpartisipasi dalam putaran pendanaan A+.

Jalur pertumbuhan kecerdasan yang menghadap tembok juga serupa.

Salah satu pendirinya Liu Zhiyuan adalah pengawas doktoral di Departemen Ilmu Komputer di Universitas Tsinghua, dan arahan penelitiannya adalah pemrosesan bahasa alami komputer; CTO perusahaan Zeng Guoyang, 26 tahun, adalah siswa yang direkomendasikan dalam kompetisi dan mengikuti kompetisi Laboratorium Pemrosesan Bahasa Alami Tsinghua di tahun keduanya.

Menurut Li Dahai, tim peneliti ilmiah cerdas yang menghadap ke dinding memiliki lebih dari 100 orang, 80% di antaranya lulus dari Qingbei, dengan usia rata-rata hanya 28 tahun. Mereka telah menerbitkan lebih dari 100 makalah di jurnal dan konferensi resmi.

Sebelum mendirikan Wall-face Intelligence, Li adalah CTO Zhihu, yang membangun bisnis pencarian dan rekomendasi untuk platform tersebut dari awal, meluncurkan "komunitas cerdas" AI, dan meningkatkan jumlah pengguna aktif bulanan.

Tahun lalu, ChatGPT sangat populer dan semua orang membicarakan tentang AGI (kecerdasan umum buatan). Setelah memastikan bahwa AGI adalah keyakinan semua orang, bergabunglah dengan tegas.

Majikan lamanya mendukung kewirausahaannya, dan pada bulan April tahun yang sama, Face Wall Intelligence menerima investasi puluhan juta yuan dari Zhihu. Setahun kemudian, Hubble mengambil alih saham tersebut.

Meluncurkan produk baru secara terus menerus

Kedua startup tersebut meluncurkan produk baru dalam waktu yang relatif singkat. Hal ini menjadi alasan penting untuk menarik investasi dari institusi seperti Huawei dan Hubble.

Pada akhir April, Shengshu Technology bekerja sama dengan Universitas Tsinghua merilis model video besar - Vidu. Pada akhir Juli lalu, Vidu diluncurkan secara global, membuka dua fungsi inti Wensheng Video dan Tusheng Video, menyediakan dua pilihan durasi 4 detik dan 8 detik, dengan resolusi hingga 1080P.

Vidu menghasilkan klip 4 detik hanya dalam 30 detik. Saat ini, pengguna dapat mendaftar langsung dengan alamat email mereka untuk merasakan Vidu.

Menurut laporan, video yang dihasilkan oleh Vidu halus dan koheren, tanpa fenomena penyisipan bingkai yang jelas, dan bahasa lensa kaya, dan lensa yang berbeda seperti pengambilan gambar jarak jauh, pengambilan gambar jarak dekat, dan jarak dekat dapat dialihkan.

“Kinerja Vidu sangat luar biasa dalam hal retensi jangka panjang 16 detik dan pemahaman semantik.” Zhu Jun, kepala ilmuwan Teknologi Shengshu, berkomentar.

Intelijen yang tidak tahu apa-apa juga terus mendorong langkah-langkah baru.

Pada bulan Mei, model besarnya Luca dirilis. Li Dahai mengatakan bahwa kemampuan model berbagai bahasa Luca setara dengan ChatGPT.

Pada bulan yang sama, MiniCPM-V2.0 yang menghadap ke dinding diluncurkan, yang secara akurat dapat mengidentifikasi pemandangan jalanan dengan detail yang rumit dan membaca tulisan tangan kuno di slip Tsinghua yang berusia lebih dari 2.300 tahun.

Pada awal tahun lalu, Face Wall Intelligence meluncurkan platform pengembangan perangkat lunak cerdas ChatDev. Pengguna yang memiliki kebutuhan untuk membuat permainan kecil, pengembangan situs web, desain kreatif, dll. dapat dengan cepat mengimplementasikannya hanya dengan menjelaskan nama proyek dan ide terkait melalui ChatDev.

Dalam kata-kata Li Dahai, pengguna biasa dapat membuat perangkat lunak kecil "hanya dalam satu cangkir Coke dan dengan biaya kurang dari satu dolar".

Komersialisasi pada awalnya telah dilaksanakan. Face Wall Intelligence telah bekerja sama dengan China Merchants Bank, Digital Network, Zhihu, dll. untuk menerapkan teknologi pada berbagai skenario seperti keuangan, pendidikan, dan terminal pintar.

Misalnya, pada akhir bulan Juni, sistem persidangan berbantuan kecerdasan buatan yang dikembangkan oleh perusahaan tersebut dioperasikan di Pengadilan Menengah Rakyat Shenzhen, yang mencakup proses seperti pengajuan kasus, peninjauan berkas, sidang pengadilan, dan produksi dokumen.

Sejak uji coba pada bulan Januari tahun ini, sistem ini telah membantu pengajuan 291.000 kasus dan membantu menghasilkan 11.600 draf dokumen pertama.

Temukan cara baru

Li Dahai dan Tang Jiayu memiliki ciri yang sama, mereka tidak percaya takhayul dengan jalan yang ditempuh para pendahulunya.

Misalnya, GPT menekankan bahwa "usaha besar dapat menghasilkan keajaiban", sedangkan pendekatan tim yang menghadapi tembok adalah memprediksi performa model besar melalui model kecil: pertama-tama latih model dengan parameter mulai dari 0,009B hingga 0,03B, lalu ekstrapolasi ke model 2.4B. Performa prediktif, terakhir, latih model 2.4B.

Metode ini mendapatkan hasil dua kali lipat dengan separuh upaya. Bereksperimen pada model kecil terlebih dahulu dan menyesuaikan parameter dapat mengurangi biaya pelatihan.

Sebelum perusahaan ini didirikan, sebagai anggota proyek "Pencerahan" dari Institut Penelitian Kecerdasan Buatan Zhiyuan Beijing, tim Wall-Facing mulai melatih model bahasa besar pada tahun 2020.

Pengalaman masa lalu memungkinkan mereka mengetahui jenis data apa yang dibutuhkan untuk model besar.

"Sangat mudah bagi setiap orang untuk salah paham dan terlalu fokus pada jumlah absolut data. Faktanya, kualitas data, cara menggunakan data, dan pemahaman data lebih penting." dikatakan.

Karena keterbatasan sumber daya, tim telah lama menggunakan metode seperti akselerasi terdistribusi dan penyesuaian parameter untuk mengurangi biaya. Pada tahun 2022, pekerjaan penyesuaian parameter oleh tim yang menghadap ke dinding juga diterbitkan di sub-jurnal Nature.

Gaya bermain Teknologi Shengshu serupa.

Pada peta jalan teknis, Shengshu menggunakan arsitektur konvergensi yang sama dengan Sora, tetapi pada jalur produk, keduanya berbeda.

Tim Sora memilih semuanya dalam video panjang, yang didukung oleh kekuatan teknis Open AI dan kekuatan komputasi Microsoft. Kondisi bagi startup untuk mengembangkan teknologi digital tidak ada bandingannya.

Tim Tang Jiayu memilih untuk memulai dengan gambar 2D dan kemudian memperluas ke bidang 3D dan video.

Video pada dasarnya adalah amplifikasi gambar dalam rangkaian waktu, yang dapat dilihat sebagai gambar multi-frame yang berurutan. Pekerjaan rekayasa pada gambar, seperti pengumpulan data, pembersihan, anotasi, dan pelatihan model yang efisien, dapat digunakan kembali.

Sepanjang tahun 2023, sumber daya utama Shengshu akan ditempatkan pada gambar dan 3D. Baru pada bulan Januari tahun ini generasi video pendek berdurasi 4 detik diluncurkan. Setelah Sora dirilis pada bulan Februari, kemajuan perusahaan semakin cepat, dan pada bulan April dapat menghasilkan video pendek berdurasi 16 detik.

Di lintasan model besar, tim dalam dan luar negeri bersaing untuk "melenturkan otot". Kedua tim Tsinghua ini baru saja mulai melakukan pemanasan dan berharap bisa meraih hasil yang baik.

Pada saat itu, Huawei Hubble, yang berinvestasi lebih awal, diperkirakan akan memperoleh keuntungan berlebih.