informasi kontak saya
surat[email protected]
2024-09-26
한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina
"jalur pengembangan model besar byte adalah pertama-tama pergi ke c untuk memoles produk, dan kemudian pergi ke b untuk memperluas pasar setelah kemampuan model memiliki keunggulan kompetitif." pada tanggal 25 september, tan daizai, presiden volcano engine, menerima wawancara dengan "daily economic news" said selama wawancara kelompok media termasuk jurnalis.
berdasarkan jalur pengembangan ini, setelah versi awal diterapkan pada platform pembuatan ai "ji meng" yang dikembangkan oleh tim pengeditan pada bulan mei tahun ini, model pembuatan video bean bag secara resmi diluncurkan pada tur inovasi ai volcano engine 2024 pada tanggal 24 september, dan ditujukan untuk pasar perusahaan terbuka untuk pengujian beta.
sejak sora memulai "era video chatgpt", pemain model besar dalam negeri seperti kuaishou, zhipu ai, minimax, dan alibaba telah berturut-turut meluncurkan produk serupa. kini setelah bytedance memasuki permainan, dapatkah hal itu mengubah lanskap persaingan model video besar yang ada ?
melalui demonstrasi efek dari dua model pembuatan video pada konferensi pers, tan dai percaya bahwa apakah itu kemampuan pemahaman semantik, gambar interaktif yang kompleks dari beberapa pergerakan subjek, atau konsistensi konten dari peralihan multi-lensa, generasi video doubao yang besar model telah mencapai tingkat industri terdepan.
pada saat yang sama, "model generasi musik" dan "model interpretasi simultan" dirilis pada konferensi tersebut, yang selanjutnya memperluas wilayah byte ai.
sebagai pemain pertama di industri yang menurunkan harga model besar, volcano engine telah mempercepat komersialisasinya secara signifikan. tan dai mengatakan kepada reporter "daily economic news" bahwa jumlah panggilan ke b meningkat pesat. "saya tidak begitu jelas mengenai bisnis ke c, namun saya merasa hal ini berjalan dengan sangat lancar. saya pikir ai dapat memecahkan masalah secara menyeluruh, dan batasan antara bisnis ke b dan ke c tidak begitu jelas."
seorang reporter dari "daily economic news" mengetahui dari konferensi pers bahwa pada bulan september tahun ini, rata-rata penggunaan harian token dalam model doubao telah melampaui 1,3 triliun, rata-rata 50 juta gambar dihasilkan setiap hari, dan rata-rata pemrosesan suara harian adalah 850.000 jam.
pada tanggal 31 agustus, minimax, salah satu dari "enam naga kecil ai", merilis model generasi video video-1; pada tanggal 19 september, keling ai menyelesaikan iterasi ke-9 dan merilis "model keling 1.5". yunqi pada konferensi tersebut, alibaba cloud meluncurkan model pembuatan video baru. dalam waktu kurang dari sebulan, bidang model pembuatan video yang sudah bergejolak telah menyambut pemain baru.
pada tur inovasi ai volcano engine pada tanggal 24 september, dua model besar doubao video generation-pixeldance dan doubao video generation-seaweed dirilis bersamaan.
reporter "daily economic news" memperhatikan bahwa durasi maksimum pembuatan konten video yang didukung oleh kedua model besar ini belum diumumkan. aplikasi jimeng menunjukkan bahwa ia mendukung pembuatan konten video sebesar 3 detik, 6 detik, 9 detik, dan 12 detik. sebaliknya, keling meluncurkan fungsi kelanjutan video pada 21 juni, yang memungkinkan video berdurasi sekitar 5 detik, dan video berdurasi terpanjang dapat dihasilkan sekitar 3 menit.
sumber foto konferensi pers: foto oleh yang xinyi, reporter dari daily news
"skenario yang berbeda memiliki persyaratan durasi video yang berbeda, dan kami lebih memperhatikan solusi untuk industri yang berbeda." tan dai mengatakan dalam sebuah wawancara dengan reporter dari "daily economic news" bahwa keuntungan dari model pembuatan video doubao yang besar adalah dalam hal ini. industri terutama terletak pada kemampuan untuk mengikuti instruksi, konsistensi peralihan multi-lensa dan kemampuan generalisasi pembuatan video.
pada konferensi pers, banyak video resmi yang menunjukkan kemampuan di atas: misalnya, dalam video demonstrasi seorang pria dan seorang wanita berlari menunggang kuda, dalam layar berdurasi 10 detik, kedua orang tersebut memiliki ekspresi dan gerakan yang berbeda, namun keduanya tampil. baik.alami dan halus.
perlu dicatat bahwa model besar pembuatan video doubao mendukung pembuatan hitam putih, animasi 3d, animasi 2d, lukisan tiongkok, cat tebal, dan gaya konten lainnya.
"untuk model pembuatan video, sulit untuk menciptakan gaya (produksi konten) yang berbeda. selain teknologi, hal ini terutama bergantung pada kekayaan sumber data." tan dai mengaitkan hal ini dengan “keunggulan kemampuan full-stack, terobosan teknologi, dan pemahaman douyin dan jianying tentang video.”
berpegang pada prinsip pragmatisme, tan dai mengatakan bahwa model pembuatan video bean bag yang baru "telah mempertimbangkan komersialisasi sejak diluncurkan", dan bidang penerapannya meliputi pemasaran e-commerce, pendidikan animasi, pariwisata budaya perkotaan, dan skrip mikro.
yang juga "cemas" dengan komersialisasi adalah keling. pada konferensi hasil kuartal kedua pada malam tanggal 20 agustus, cheng yixiao, salah satu pendiri, ketua dan ceo kuaishou, menganggap komersialisasi keling sebagai prioritas utama dan "berusaha untuk mencapai skala realisasi komersial yang besar sesegera mungkin." ."
berbicara mengenai strategi harga, tan dai mengungkapkan bahwa harga model generasi video doubao belum ditentukan. “skenario penerapan model video dan model bahasa berbeda, dan logika penetapan harga juga berbeda. nilai produk harus diukur melalui pengalaman baru, biaya migrasi, dll. apakah (produk) pada akhirnya dapat digunakan secara luas. juga bergantung pada apakah produktivitasnya lebih baik. roi (laba atas investasi) telah meningkat pesat.”
selain model generasi video baru, acara ini juga merilis model musik bean bag dan model interpretasi simultan. hingga saat ini, rangkaian model besar modal penuh doubao telah mencakup tiga kategori model bahasa besar, model visual besar, dan model ucapan besar, dan total 13 model besar telah dirilis.
namun model saja tidak cukup. banyak orang di industri ini mengatakan bahwa implementasi yang dilakukan oleh produsen model besar saat ini adalah "mencari paku dengan palu". jadi, cara menemukan paku dan cara menggunakan palu yang cocok untuk memalu paku dengan sedikit usaha mungkin menjadi tantangan baru bagi vendor cloud di era ai.
yang pertama adalah masalah biaya yang terjadi antara produsen model besar dan perusahaan.
pada konferensi pers di bulan mei, tan dai mengumumkan bahwa harga input inferensi model utama doubao hanya 0,0008 yuan/ribu token, yang 99,3% lebih murah daripada industri, memulai perang harga di bidang model besar.
"biaya adalah kuncinya. jika harga turun sepersepuluh, volumenya bisa meningkat sepuluh kali lipat." dalam pandangan tan dai, volume panggilan model dan jangkauan aplikasi adalah fokus saat ini. "kami terutama fokus pada cakupan aplikasi, bukan pendapatan. kami percaya membuka skenario baru lebih berharga, seperti peningkatan skenario dalam obrolan, persahabatan, produktivitas, dan perluasan skenario aplikasi perusahaan.”
namun, dia juga menegaskan bahwa premis bisnis untuk pasar b-end harus berkelanjutan. "kami tidak dapat mempertimbangkan menghasilkan uang dari iklan seperti bisnis ke c." "produk to b harus mencapai laba kotor yang positif, dan kami memiliki kemampuan dan percaya diri untuk melakukannya."
setelah model besar doubao memimpin penurunan harga, alibaba tongyi qianwen, baidu wenxin yiyan, dan model lainnya juga berturut-turut menurunkan harganya. pada konferensi yunqi tahun ini, harga tiga model utama tongyi qianwen di platform alibaba cloud bailian sekali lagi diturunkan. cto alibaba cloud zhou jingren bahkan mengatakan bahwa "dibandingkan dengan aplikasi besar di masa depan, harganya masih terlalu mahal ."
mengenai situasi industri ini saat ini, tan dai mengatakan bahwa setelah penurunan harga, dilihat dari jumlah panggilan, biaya tidak lagi menjadi hambatan bagi inovasi pada harga ini. indeks kualitas tujuannya adalah untuk membuat model lebih kuat dan beragam.”
setelah putaran "pengurangan umum", industri model besar tidak akan lagi "menurunkan" harga secara membabi buta. pada tahap ini, persaingannya adalah kinerja model, yang juga didukung oleh permintaan klien.
menurut pengamatan tan, untuk penerapan model besar, permintaan di pasar ke b berubah secara perlahan, dan permintaan intinya adalah pengurangan biaya dan peningkatan efisiensi. “saat perusahaan menerapkan ai, mereka biasanya membuat rencana dari atas ke bawah, yang memiliki kemungkinan kegagalan yang tinggi. kini mereka perlu berinovasi dari bawah ke atas.”
reporter "daily economic news" memperhatikan bahwa dalam proses membantu perusahaan dalam transformasi digital, volcano engine telah bekerja sama dengan semua pihak untuk membentuk smart terminal large model alliance, automobile large model ecological alliance, dan retail large model ecological alliance , dan pelanggan eksternal telah mencakup lebih dari 30 industri seperti telepon seluler, mobil, keuangan, konsumsi, dan hiburan interaktif.
sekarang, byte memiliki beberapa "palu" yang berguna di tangannya. cara menemukan lebih banyak "paku" yang cocok dengan mereka di semua lapisan masyarakat akan menjadi ujian berikutnya dari mesin gunung berapi.
berita ekonomi harian