berita

"Keling" Kuaishou tiba-tiba menjadi populer, Byte sangat ingin mengejar ketinggalan, dan persaingan di trek video AI Wensheng semakin ketat

2024-07-31

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina



Pada bulan Februari 2024, kemunculan Sora menghalangi banyak perusahaan model besar untuk mengadakan Festival Musim Semi yang bagus.

"Gala Festival Musim Semi masih diputar ulang, jadi kami segera mengadakan diskusi kelompok," kata seorang karyawan perusahaan AI terkemuka kepada "City Circle". Melihat pengalaman Sora yang sangat mulus, bahkan blogger yang menjual kursus pun bergegas meluncurkan tutorial online dan menghasilkan banyak uang.

Siapa yang bisa "meniru" Sora versi domestik dalam waktu tercepat? Semakin banyak orang yang fokus pada Alibaba, Baidu, dan "Lima Besar". Namun tidak ada yang menyangka bahwa pemenangnya adalah pemain cepat dengan performa teknis yang relatif "seperti Buddha".

Pada tanggal 7 Juni, Kuaishou tiba-tiba meluncurkan model video Wensheng "Kling", yang dapat mendukung pembuatan video hingga 2 menit. Selain itu, dibandingkan dengan Sora yang masih dalam tahap "masa depan", Keling dibuka untuk pengujian segera setelah diumumkan, dan hasil yang dihasilkan juga luar biasa.

“Keling adalah topik yang paling banyak dibicarakan di industri akhir-akhir ini,” kata seseorang di industri modal ventura kepada City Circle. Menurut data resmi, lebih dari 500.000 orang melamar Keling dalam waktu satu bulan setelah peluncurannya. Keling telah dibuka untuk lebih dari 300.000 pengguna dan telah menghasilkan lebih dari 7 juta video pendek.

Popularitas Ke Ling yang tak terduga tak pelak membuat Byte sedikit malu. Pada bulan Mei tahun ini, Byte juga membuka pengujian model Video Wensheng "Jimeng", namun efeknya belum terlihat jelas pada trek Video Wensheng yang sedang populer.

Tiba-tiba terlempar oleh lawan yang selama ini "diabaikan", Byte harus mengejar ketertinggalannya. Menurut TMTPost, ByteDance baru-baru ini menetapkan model besar AI sebagai arah “P0 level tertinggi” grup. Banyak tim seperti Douyin dan Jianying juga bekerja keras untuk mengembangkan aplikasi model video AI, yang diharapkan akan diumumkan dalam waktu dekat.

1. Dapat dilakukan dengan cepat, kasar dan ganas.

Banyak pengembang mengatakan kepada "City" bahwa peluncuran dan kinerja luar biasa Keling merupakan kejutan di industri.

Baru-baru ini, "Batas Kota" menggunakan paragraf "kucing hitam" sebagai kata kunci dan memasukkan perintah yang sama di Keling, Jimeng, dan "Qingying" yang baru saja diluncurkan oleh Zhipu AI: "Jalanan kota di hari hujan kosong . Seseorang, seekor kucing hitam lucu berlari melewatinya. Ia memiliki mata hijau, kerah kuning dan lonceng di lehernya, serta rambut hitam panjang di tubuhnya tanah mencerminkannya. Sosok kucing hitam.”

Di antara ketiga video yang dihasilkan, meskipun versi Keling gagal mencapai efek fast running, secara umum video tersebut sesuai dengan aturan objektif.

Sebaliknya, tidak ada air di tanah dalam versi "Jimeng", dan kucing hitam itu tidak bergerak maju. Meskipun versi "Qingying" memiliki akumulasi air, kucing hitam memiliki gaya berjalan yang aneh saat berjalan, dan ekornya juga kehilangan kerangka.

▲ (Video dibuat oleh Ke Ling, Ji Meng, dan Qing Ying secara berurutan)

Menurut "Silicon Star", Keling membutuhkan waktu tiga bulan untuk membangunnya; tim ini sangat kecil, dengan hanya lebih dari 20 orang. Pemimpinnya adalah Wan Pengfei, kepala Pusat Generasi dan Interaksi Visual Kuaishou saat ini, yang sebagian besar melakukan penelitiannya. arahannya meliputi pemrosesan sinyal gambar/video, fotografi komputasi dan visi komputer, pengurangan fungsi yang hilang, pembuatan visi, dll.

Pendahulu Keling berasal dari proyek sederhana "Puji" yang dimulai kembali oleh Kuaishou pada Oktober 2023. Ini adalah perangkat lunak alat yang menggunakan AI untuk menghasilkan emotikon Gif 2 detik dari gambar statis. Pada awal Maret tahun ini, Kuaishou mengadakan pertemuan internal kecil. Ide Wan Pengfei disetujui oleh Gai Kun (Yu Yue), wakil presiden senior Kuaishou, dan Puchi dengan cepat ditetapkan sebagai produk untuk pra-investigasi.

Menurut "Silicon Star People", "Saat melakukan Keling, ada konsensus pada tingkat eksekusi yang cepat, kasar, dan sengit."

Kurang dari sebulan setelah dimulainya proyek Keling, proyek ini mendapat dukungan dari pendiri Kuaishou, Cheng Yixiao, yang menganggapnya sebagai proyek strategis bagi perusahaan. Gai Kun juga sering berkata: Semua kartu perusahaan dapat Anda gunakan, dan perusahaan mendukungnya sepenuhnya.

Ke Ran, seorang pengusaha di jalur manusia digital, menganalisis "City": "Keberhasilan Keling sebagian besar disebabkan oleh materi data video yang dikumpulkan oleh Kuaishou. Melihat negaranya, satu-satunya yang dapat bersaing dengannya dalam aspek ini adalah suara Douishu ."

Meski pemandangannya indah, Byte tampak sedikit kesepian.

Meskipun "Jimeng" secara resmi diumumkan pada tanggal 9 Mei; pada tanggal 17 Juni, Jimeng juga muncul dalam serial pendek AIGC "Sanxingdui: Future Apocalypse" sebagai kepala pendukung teknis AI. Namun, baik dalam hal penampilannya di sisi C atau dibandingkan dengan drama pendek AIGC Kuaishou “Mountains and Seas”, yang diluncurkan pada 13 Juli, suara Ji Meng tidak terlalu keras.

Pada 17 Juli, ada berita di pasar bahwa Byte akan mengumumkan kemajuan teknologi video Vincent mirip Sora. Dunia luar pun mengartikan hal ini sebagai Byte yang akan mengejar dan bersaing langsung dengan Keling.

Namun, Byte kemudian menyatakan kepada "City Circle" bahwa berita tersebut tidak akurat. Pada tanggal 17 Juli, "City Circle" menyadari bahwa acara tersebut lebih seperti sesi berbagi teknologi. Pertemuan ini sebagian besar dipandu oleh Feng Jiashi, pemimpin tim penelitian visual dasar model besar Doubao, dan seluruh sesi dibagikan oleh ilmuwan peneliti Byte, pakar institusi, dll. dalam bahasa Inggris.

Tampaknya "langkah besar" Byte mungkin masih harus menunggu beberapa waktu.

2. Byte belum pulih

Lantas, kenapa Byte melewatkan pesta di track Vincent Video yang sedang ramai belakangan ini?

Sampai batas tertentu, mungkin karena dibandingkan dengan Kuaishou yang bertaruh pada "Ke Ling", ia dapat "mengalahkan sepuluh keterampilan dengan satu usaha". Tata letak model Byte yang berskala besar lebih rumit - dan pada paruh pertama tahun ini, lawan Byte yang lebih penting adalah Tencent dan Alibaba.

Menghadapi model besar, langkah Byte tak lagi "radikal". Bagaimanapun, Byte-lah yang memimpin peluncuran perang harga model besar-besaran di industri lebih dari 2 bulan yang lalu.

Pada tanggal 15 Mei, di “FORCE Motive Power Conference” ByteDance, Byte meluncurkan layanan API berdasarkan model bean bag yang dikembangkan sendiri. Pada saat yang sama, Tan Dai, Presiden Volcano Engine, mengambil satu langkah dan mengungkapkan harga terbaru “Doubao”: 0,0008 yuan/ribu Token, mengumumkan bahwa ini adalah “harga dasar” yang lebih rendah dari 99,3% industri.

Saat itu, "serangan" Byte telah memimpin. Menurut "lingkaran pasar" dari banyak sumber, para pemain terkemuka tidak siap menghadapi serangan Byte; meskipun semua pihak merasa tidak berdaya, mereka hanya bisa mengikuti secara pasif;

Dalam beberapa hari ke depan, Alibaba Cloud, Baidu Wenxin Model, dan Tencent Cloud berturut-turut mengumumkan bahwa mereka akan secara signifikan mengurangi harga token input dan API inferensi model besar mereka. Di bawah pengaruh ini, seruan pihak C untuk model kepala berskala besar kini hampir gratis, dan industri telah mulai bergerak menuju tingkat ekologis berikutnya.

Menurut pendiri perusahaan aplikasi AI legal, hampir tidak ada jeda waktu setelah layanan API dibuka, dan staf penjualan Volcano Engine mulai aktif menghubungi pelanggan dan mempromosikan produk. Hal ini sekaligus membenarkan spekulasi yang beredar di pasar bahwa Byte telah menandai model besar sebagai strategi level tertinggi.



▲(Tan Dai pada "Konferensi FOECE" 2024. Sumber/Mesin Gunung Berapi)

Baru-baru ini, bean bag “produk unggulan” Byte telah berkembang secara signifikan.

Menurut data Questmobile, pada Juni 2024, di antara Aplikasi AIGC domestik, Doubao, Tiangong, Kimi Smart Assistant, dan Cat Box telah mencapai pertumbuhan yang mengesankan—dengan Doubao menduduki peringkat pertama dalam hal lalu lintas.



▲(Sumber foto/QuestMobile)

Dibandingkan dengan Kuaishou, yang lebih dikhawatirkan Byte saat ini mungkin adalah persaingan ekologis penuh dari model dasar besar hingga lapisan aplikasi AI. Selain itu, mengingat Volcano Engine baru resmi menjadi cloud pada tahun 2021, ia merupakan yang "termuda" di antara vendor cloud raksasa. Selama lebih dari tiga tahun, Huoshan Cloud dianggap sebagai penantang di pasar cloud. Bagaimana Byte berkolaborasi dengan model besar dasar, lapisan aplikasi, dan pasar cloud adalah sebuah proposisi yang komprehensif.

Baru-baru ini, menurut laporan "Photon Planet", sejumlah besar pengguna platform "Kouzi" Byte mencari cara untuk menghubungkan agen dan bot yang mereka buat ke akun resmi atau program mini WeChat, dan diskusi sangat aktif.

Pada bulan Desember tahun lalu, Byte meluncurkan platform pengembangan aplikasi AI "coze" di luar negeri. Pada bulan Februari tahun ini, “Button” versi domestik diluncurkan secara online. Sejumlah besar pedagang Douyin juga berharap bisa segera membuat sepanci emas darinya.

Mengingat Tencent terlambat merilis platform pembuatan dan distribusi agen AI "Tencent Yuanqi" pada Mei tahun ini. Saat itu, jumlah kunjungan ke Button sudah mencapai 2,33 juta kali. Hingga saat ini, Tencent Yuanqi belum membuka ekosistem program mini seri WeChat, akun resmi, dan akun berlangganan layanan pelanggan.

Bagaimanapun, pengembangan AI masih dalam tahap awal. Byte, seperti Tencent, masih perlu menghabiskan banyak waktu untuk mengedukasi pengguna. Bersaing untuk mendapatkan hak distribusi di era AI dan menjadi yang terdepan mungkin menjadi pelajaran lebih besar yang harus dilakukan Byte untuk menyasar Tencent.

3. Serang nanti, masih ada waktu

Di tingkat industri, di Internet saat ini, tidak ada kekurangan lalu lintas konten, lalu lintas e-niaga, dan amunisi finansial. Bahkan jika itu "satu langkah di belakang" di Vincent Video dalam jangka pendek, dalam jangka panjang, masih mempunyai potensi untuk mengejar ketinggalan.

Menggunakan strategi pasar aktif untuk mengejar posisi tertinggal dan dengan penuh semangat mencapai keajaiban juga merupakan spesialisasi Byte.

Baru-baru ini, dengan menargetkan Alibaba, Byte juga berupaya mengintegrasikan model-model besar. Pada Konferensi Ekosistem DingTalk yang baru saja diadakan pada tanggal 26 Juni, Presiden Ye Jun mengumumkan bahwa selain Tongyi milik Alibaba, model pihak ketiga besar dari enam perusahaan lainnya juga akan disertakan dalam DingTalk. Ini termasuk MiniMax, Dark Side of the Moon, Zhipu AI, Orion Star, Zero One Thing dan Baichuan Intelligence, yang mencakup hampir semua model startup berskala besar yang terkenal di Tiongkok. Sudah terbukti dengan sendirinya untuk "membangun ekosistem AI paling terbuka di Tiongkok ".

Mirip dengan gameplay DingTalk, selain mendukung "Doubao" miliknya sendiri, platform Kouzi Byte juga memiliki akses ke model eksternal utama seperti Tongyi Qianwen, Dark Side of the Moon, dan MiniMax. Pada tanggal 14 Juni, Kouzi juga meluncurkan fungsi "Model Square", yang memungkinkan pengguna memilih dua model anonim dan menilainya berdasarkan performa konten yang dihasilkan.



Selain itu, Byte baru-baru ini terungkap, dan eksplorasi "perangkat keras AI +" semakin cepat, dan tidak ragu untuk merekrut talenta melalui akuisisi.

Menurut "Tech Planet", PICO, anak perusahaan Byte, telah mengembangkan beberapa perangkat wearable sejak paruh kedua tahun lalu, termasuk headphone dan speaker, dan perangkat tersebut juga akan dilengkapi dengan AI. Tim Byte Doubao juga telah mengeksplorasi kombinasi perangkat lunak dan perangkat keras model skala besar. Kombinasi perangkat lunak dan perangkat keras model skala besar telah diterapkan secara bertahap pada perangkat keras seperti mesin pembelajaran, robot anjing, dan robot.

Menurut laporan lain dari 36Kr, orang yang bertanggung jawab atas “garis D” perangkat keras Byte AI adalah Li Haoqian. Yang terakhir adalah pendiri Oladance, merek headphone OWS (Open Wearable Stereo) yang diakuisisi oleh Byte pada bulan Maret tahun ini. Orang yang bertanggung jawab atas "O Line", lini perangkat keras AI lainnya, juga merupakan pendiri perusahaan yang diakuisisi oleh Byte. Dia melapor kepada Hong Dingkun, Wakil Presiden Teknologi ByteDance.

Ke arah Vincent Video, menghadapi popularitas lagu tersebut belakangan ini, para pengejarnya, termasuk Byte, masih punya waktu.

Baru-baru ini, seorang pengembang mengatakan kepada "City World": "Saat ini, saya menggunakan Keling untuk membuat gambar dan mengurangi beban kerja alur kerja. Saya belum sepenuhnya menggunakannya untuk pembuatan, jadi saya belum terlalu bergantung padanya."

Di mata pengembang lain dan blogger video pendek AIGC, Keling masih memiliki banyak ruang untuk pengoptimalan: "Mengandalkan Keling Wensheng Video tidak dapat menjamin konsistensi IP manusia virtual. Saya biasanya menggunakan Kelingtu untuk memproduksi video. Fungsinya setara hingga memberi Ke Ling gambar, memungkinkannya menghasilkan video dinamis dari perspektif berbeda, lalu menggabungkannya untuk mensimulasikan efek menggerakkan kamera. Faktanya, proporsi pengoperasian manusia lebih besar.

Seorang anggota tim R&D produk kencan simulasi AI dalam negeri mengatakan: "Di pasar aplikasi model skala besar saat ini, semua orang menyeberangi sungai dengan merasakan batunya. Bagaimana cara mengkomersialkannya adalah pertanyaan yang terlalu jauh dan terlalu jauh." samar-samar. Namun yang pasti adalah semakin banyak orang Semakin banyak orang menggunakan dan memainkannya, semakin dapat memastikan optimalisasi dan iterasi produk.”

(Ke Ran adalah nama samaran)

Penulis | Dong Wenshu

Sunting | Li Yuan

Operasi | Liu Shan