minimax mengadakan konferensi hari mitra pertamanya dan merilis model

minimax mengadakan konferensi partner day pertamanya dan merilis model pembuatan video dan musik

2024-09-01

01:55

dalam pertunjukan langsung yang menggabungkan teknologi dan musik, pada tanggal 31 agustus, konferensi pengembang pertama perusahaan unicorn ai minimax shanghai xiyu technology co., ltd. (selanjutnya disebut minimax) - "minimaxlink partner day" dimulai. di hari yang sama, minimax resmi merilis video model-video-01 dan model musik music-01.

model multimodal telah menjadi pertanyaan yang harus dijawab oleh perusahaan model besar, di antaranya involusi model video adalah yang paling jelas. banyak perusahaan ai telah merilis video model besar sebelumnya, termasuk model pembuatan video "qingying" yang diluncurkan oleh zhipu ai, ai pixverse v2. dari teknologi shi, vidu dari teknologi shengshu, “keling ai” dari kuaishou, dll.

01:55

menyusun model multimoda hanyalah permulaan

dapat dipahami bahwa video-01 yang dirilis oleh minimax kali ini berfokus pada pembuatan video asli beresolusi tinggi dan frekuensi gambar tinggi. memasukkan kata cepat dapat menghasilkan video berdurasi lima detik mengalami produk tersebut.

minimax secara resmi merilis model video—video-01

setelah mengevaluasi model video video-01, seorang desainer produk berkata, "efek keseluruhannya sangat bagus, dengan fisika yang benar, rentang dinamis dan stabilitas yang baik, dan respons terhadap konsep fiksi ilmiah dan fantasi relatif akurat, tetapi kesan plastiknya adalah berat. performa estetikanya relatif buruk, kualitas gambar dan detail gambarnya buruk.”

terkait hal ini, pendiri dan ceo minimax yan junjie mengatakan bahwa yang dipamerkan saat ini hanyalah produk versi pertama, dan versi terbaru akan diluncurkan secara bertahap di masa mendatang.

oleh karena itu, model video akan diberikan kepada pengguna secara gratis untuk jangka waktu tertentu. komersialisasi tidak akan dipertimbangkan hingga produk diperbarui ke kondisi yang memuaskan. “komersialisasi di masa depan terutama dibagi menjadi dua bentuk. yang pertama didasarkan pada platform terbuka perusahaan dan akumulasi lebih dari 2.000 mitra pelanggan perusahaan. banyak pengguna perusahaan terkenal juga bersedia menggunakan kemampuan pengenalan suara kemampuan pengenalannya sendiri. mekanisme periklanan telah diperkenalkan ke dalam produk.”

menurut laporan, produk matriks model multi-modal minimax saat ini juga mencakup music-01, model pembangkitan musik end-to-end multi-fungsi, pidato-01, model sintesis ucapan generatif generasi baru, dll. "ini baru permulaan. kami akan terus meningkatkan kecepatan dan efek model, dan selanjutnya merilis produk terkait."

kunci untuk meningkatkan kinerja model

“sebagai perusahaan teknologi, teknologi selalu menjadi elemen inti.” yan junjie mengatakan pada tahap ini, fokus minimax bukan pada komersialisasi.

yan junjie mengatakan model minimax saat ini menangani lebih dari 3 miliar interaksi pelanggan. setahun yang lalu, waktu interaksi minimax hanya 3% dari chatgpt; kini proporsinya meningkat menjadi 53%; namun demikian, pengguna yang terhubung belum mencapai 1% dari populasi global, hanya 0,8%. untuk tumbuh dari 1% menjadi 100%, hal terpenting adalah meningkatkan tingkat penetrasi dan kedalaman penggunaan produk ai di kalangan pengguna.

data interaksi pengguna minimax

ada banyak kesulitan teknis yang perlu diatasi. diantaranya, tiga arah optimasi yang paling penting adalah: bagaimana mengurangi tingkat kesalahan model secara terus menerus, input dan output yang tidak terbatas, dan multi-modalitas. “tidak sulit untuk menemukan dari kehidupan bahwa interaksi teks hanyalah sebagian kecil, dan lebih banyak lagi adalah interaksi suara dan video. konten multi-modal, seperti suara, grafik, teks dan video, telah menjadi arus utama transmisi informasi. untuk meningkatkan kecepatan penetrasi, multi-modalitas adalah satu-satunya cara yang harus dilakukan." yan junjie mengatakan bahwa untuk mengatasi kesulitan ini, "kecepatan" adalah tujuan penelitian dan pengembangan teknologi inti dari model besar yang mendasari minimax. “di antara dua model dengan performa serupa, model dengan pelatihan dan inferensi lebih cepat dapat menggunakan sumber daya komputasi secara lebih efektif untuk melakukan iterasi lebih banyak data, sehingga memiliki kemampuan model yang lebih baik.”

menurut laporan, minimax telah mengalami dua perubahan teknologi utama di masa lalu, termasuk moe (mixed expert architecture) dan linear attention (perhatian linier). pada bulan april tahun ini, perusahaan mengembangkan model generasi baru berdasarkan moe+ linear attention, yang dianggap sebanding dengan level gpt-4o. saat memproses 100.000 token, efisiensi pemrosesan model baru dapat ditingkatkan hingga 2-3 kali lipat, dan seiring bertambahnya panjangnya, efisiensi model meningkat lebih jelas.

diketahui bahwa model teks seri abab7 yang menggunakan teknologi generasi baru akan dirilis secara resmi dalam beberapa minggu ke depan.

laporan publik menunjukkan bahwa minimax, yang didirikan pada desember 2021, sebelumnya telah menyelesaikan tiga putaran pembiayaan. investornya termasuk tencent, mihoyo, dll., dan valuasinya saat ini telah melampaui us$2,5 miliar.

reporter surat kabar yu yan dan pekerja magang wang chun

(artikel ini berasal dari the paper. untuk informasi lebih orisinal, silakan unduh aplikasi “the paper”)

laporan/umpan balik

berita

minimax mengadakan konferensi partner day pertamanya dan merilis model pembuatan video dan musik

perkenalan

informasi kontak saya