berita

Orang tua yang tidak sabar menunggu Sora, bergegas ke Kuaishou Keling

2024-08-01

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina


Mengapa Kuaishou menjadi produsen besar pertama yang meluncurkan video AI? ‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍

Teks |.Chen Meixi

Penyunting |. Direktur

Pada masa-masa awal ketika Open AI menggemparkan dunia dalam hal model berukuran besar, Kuaishou bukanlah sosok yang mempesona. Pada saat itu, Baidu datang dengan Wenxinyiyan, Alibaba datang dengan Tongyi Qianwen, dan Tencent datang dengan model besar Hunyuan, saling mengejar, dan kecepatan penelitian dan pengembangan serta pembukaan sangat cepat.

Kuaishou tidak termasuk dalam daftar pesaing awal, dan bahkan sekarang, hanya sedikit orang yang dapat menyebutkan nama model bahasa besar Kuaishou: Ruyi.

Situasi pertempuran berubah pada tanggal 6 Juni tahun ini. Model besar Keling yang dibuat dengan video Kuaishou membuka aplikasi untuk beta publik. Media sering membandingkan Keling dengan Sora dari Open AI, namun sejak debut eksplosifnya pada bulan Februari, Sora belum dibuka untuk umum. Alhasil, pengguna Tiongkok yang penasaran mulai berbondong-bondong mengunjungi Keling.

Sepuluh hari kemudian, Keling "telah (menerima) puluhan ribu lamaran". Data ini berasal dari Wan Pengfei, yang menghadiri Konferensi Zhiyuan hari itu. Pada saat pidatonya, jabatannya adalah kepala Pusat Interaksi dan Generasi Visual Kuaishou, dan dia juga merupakan penanggung jawab Keling. Pada 19 Juli, jumlah pelamar melebihi satu juta. Keling hanya membutuhkan waktu lebih dari sebulan untuk meningkatkan jumlah aplikasi dari puluhan ribu menjadi satu juta. Di antara kemajuan model-model besar di paruh pertama tahun ini, ini adalah kinerja yang paling menarik perhatian.


Gambaran yang dihasilkan oleh roh, kata-kata yang cepat: lebah di dalam bunga

Kisah turnaround selalu populer di kalangan masyarakat. Namun, inventarisasi cermat terhadap Keling dan bisnis model besar Kuaishou di baliknya akan mengungkapkan bahwa ini bukanlah drama keren yang terbengkalai dan kemudian tiba-tiba muncul, juga bukan narasi heroik di mana seorang pemuda berbakat memimpin tim kecil untuk menyerang. kembali.

Sebuah video selanjutnya dibuat berdasarkan gambar yang dihasilkan oleh Keling, dengan kata cepat: lebah beterbangan

Mengapa Kuaishou menjadi produsen besar pertama yang meluncurkan video AI?Kebutuhan bisnislah yang memberikan motivasi kuat dan prioritas tinggi, akumulasi data dan teknologi dalam bentuk produklah yang menghasilkan kecepatan iterasi, dan kesesuaian skenario bisnislah yang mendatangkan pelanggan nyata.

Kemunculan Ke Ling bukanlah suatu peristiwa yang kebetulan. Di dalam negeri, saingan terbesar Kuaishou di bidang video AI kemungkinan besar akan datang dari ByteDance.


Ketika ada permintaan, ada motivasi

Kreator adalah salah satu tautan terpenting dalam ekosistem konten Kuaishou. Menurut data resmi yang dirilis Kuaishou, pada tahun 2023, akan ada 138 juta kreator yang merilis video pendek di Kuaishou untuk pertama kalinya, dan video yang dirilis sepanjang tahun tersebut mendapat lebih dari 1 triliun suka di platform tersebut.

Memiliki banyak pembuat konten berarti Kuaishou perlu mengambil alih kebutuhan mereka akan alat konten. Jika tidak, pembuat konten yang mengejar produktivitas baru akan segera beralih ke alat lain dan bahkan platform lain. Ini juga merupakan nilai Kuaiying ke Kuaishou dan Pemotongan ke Byte.

Oleh karena itu, investasi Kuaishou sebelumnya dalam model bahasa besar tidaklah radikal, tetapi harus berjuang untuk menjadi yang terdepan dalam persaingan model multi-modal besar.

Sebelum Keling, kemampuan model besar Wenshengtu yang dikembangkan sendiri oleh Kuaishou telah diintegrasikan ke dalam Kuaishou. Hasil pengujian internal adalah pengguna menghasilkan rata-rata 500 juta+ gambar AI di area komentar setiap bulannya.


Gambar dihasilkan oleh Keling, kata cepatnya: Alien berdiri di tepi Sungai Yangtze

Motivasi kuat yang dibawa oleh permintaan tentu merupakan syarat penting bagi munculnya Keling, namun Kuaishou bukan satu-satunya yang memiliki kondisi tersebut. Jika ada faktor penting lain yang mempengaruhi kemunculan Ke Ling, mungkin itu adalah determinasi.

Tekad pertama datang dari manajemen puncak Kuaishou.

Sebelumnya, pergerakan Kuaishou pada model besar selalu terlihat setengah langkah lebih lambat. Ketika berbicara tentang model bahasa besar dalam negeri, semua orang pertama-tama akan memikirkan Wen Xin Yi Yan dan Tong Yi Qian Wen; ketika berbicara tentang aplikasi model bahasa besar, Kimi dan Doubao adalah yang paling populer di pasar. Di bidang grafis Vincentian, Ririxin 5.0 SenseTime adalah yang pertama keluar dari pasar domestik. Pada pagi hari setelah dirilis, harga saham SenseTime Technology naik lebih dari 30%, dan perdagangan dihentikan sementara.

Dalam rangkaian cerita sebelumnya, Kuaishou berada pada posisi yang terkesan marginal. Video model besar dan aplikasinya adalah simpul terpenting dalam persaingan dan bagian terpenting dari keseluruhan tata letak model besar.

Dalam pemberitaan sebelumnya oleh media teknologi Silicon Star, seorang teknisi dari tim Keling mengatakan: "Yang sering dikatakan Gai Kun adalah bahwa semua kartu perusahaan adalah untuk Anda gunakan, dan perusahaan mendukung penuhnya." wakil presiden senior Kuaishou, dan menjabat sebagai kepala eksekutif. Penanggung jawab bisnis jalur stasiun dan juga penanggung jawab jalur ilmu sosial. Setelah mantan CTO Chen Dingjia mengundurkan diri, Gai Kun menjadi salah satu pemimpin tertinggi di lini teknologi Kuaishou.

Wan Pengfei dan timnya mungkin memiliki tekad yang lebih besar.Salah satu detailnya adalah setelah memutuskan untuk mengambil alih proyek Keling, Wan Pengfei menyerahkan pekerjaan asli menjalankan kebutuhan bisnis semua pihak kepada orang lain yang bertanggung jawab pada level yang sama di tim Zhang Di.Sejalan dengan itu, anggota tim Keling lainnya juga telah menyerahkan bisnis asli yang ada dan mengabdikan diri sepenuhnya untuk penelitian dan pengembangan Keling. Bekerja lembur di akhir pekan adalah hal yang wajar.

Sebuah video selanjutnya dibuat berdasarkan gambar yang dibuat oleh Keling, kata-kata cepat: Alien berjalan di air, dua alien melakukan tos

“Sebenarnya, lebih dari sebulan sebelum rilis resmi, hasil tes Ke Ling tidak terlalu bagus.” Seorang praktisi di industri model besar mengatakan kepada Hedgehog Commune, “Lao Wan dan yang lainnya sedang berjuang melawan rintangan. sungguh 'hasil yang ajaib dengan kekuatan yang besar'. Banyak orang tidak mengharapkan efek seperti itu pada akhirnya.”

Jadi determinasi menjadi variabel terakhir.


Akumulasi mengarah pada kecepatan

Kuaishou, atau platform video pendek terkemuka lainnya, telah mengumpulkan pengalaman dalam mengembangkan video AI dalam dua aspek, konten dan teknologi.

Video diproduksi oleh pengguna, dan setelah diberi anotasi dan dipahami oleh platform, konten yang dapat didistribusikan disaring. Ini adalah jalur yang melekat dalam logika bisnis Kuaishou. Konten yang diproses menjadi semacam data. Dari deskripsi konten itu sendiri hingga popularitas setelah didistribusikan, Kuaishou telah menguasai sejumlah besar data konten.Dalam istilah awam, keduanya memiliki konten dan mengetahui “konten bagus” apa yang ingin dilihat pengguna.

Untuk pelatihan model video generatif berukuran besar, proses ini seperti menyiapkan hidangan terlebih dahulu.

Bahkan "juru masak" sudah jadi.

Sebagian besar anggota inti R&D tim proyek Keling adalah bawahan lama Wan Pengfei dari periode Y-tech. Pada awal tahun, anggota tim secara bertahap mendapatkan informasi dan materi yang relevan dan mulai mengerjakan penelitian dan pengembangan Keling.

Sebelumnya, tim Wan Pengfei terutama bertanggung jawab untuk memenuhi kebutuhan kreasi cerdas UGC di bawah ekosistem kreatif Kuaishou, dan bekerja sama dengan pihak bisnis seperti produksi stasiun utama, Kuaiying, dan Kamera Yitian. Bentuk produknya meliputi kecantikan potret, efek khusus audio dan video , avatar siaran langsung, dll.

Pada tahun 2021, Wan Pengfei memberikan pidato publik sebagai "Kepala Platform Teknologi AI di Departemen Y-tech" di Konferensi Teknologi Kecerdasan Buatan Global.Di antara kasus yang dibagikan pada saat itu adalah "efek khusus foto hidup" - video gameplay Tusheng di era pra-model besar. Saat itu, perpustakaan template Kuaishou dan Kuaiying meluncurkan efek khusus "memindahkan foto lama" setelah pengguna mengunggah foto, karakter dalam foto dapat melakukan gerakan seperti tersenyum, berkedip, dan mengangguk hingga membentuk efek video. Menurut laporan, efek khusus dinamis ini telah digunakan oleh lebih dari 3,44 juta orang di Kuaiying.


Foto dan video lawas bergerak yang dirilis netizen Kuaishou @senyuhelu pada tahun 2021

Pada tahun 2021, Wan Pengfei sangat yakin dengan perkembangan teknologi generatif dan mengusulkan bahwa "model generatif akan menjadi lebih kuat, konten yang dihasilkan akan lebih realistis, dan proses pembuatannya akan lebih stabil dan terkendali."

Tiga tahun kemudian, Keling kembali muncul dengan karyanya "Menghidupkan Kembali Foto-Foto Lama". Beberapa pengguna yang mengajukan izin menggunakannya menggunakan fungsi "Video Tusheng" untuk mengubah foto kerabat yang telah meninggal menjadi video. Dibandingkan dengan "efek khusus foto hidup" tiga tahun lalu, melalui instruksi terbuka, pengguna dapat membuat karakter dalam foto menyelesaikan tindakan yang lebih kompleks. Inilah perubahan yang dibawa oleh teknologi model besar yang baru.

Sora dirilis pada bulan Februari tahun ini, dan tim Kuaishou Keling mulai dibentuk dalam waktu dekat, namun pengembangan dan penerapan teknologi pembuatan video berbasis multi-modal selalu berada dalam lingkup pekerjaan Wan Pengfei dan timnya. .

Praktisi yang disebutkan di atas mengungkapkan pandangan serupa dengan Hedgehog Commune: "Faktanya, kemunculan Sora sama dengan membiarkan setiap orang menentukan rute atau rencana teknis pada titik tersebut, tetapi ada banyak penerapan teknologi visual, termasuk hal-hal multimodal. Itulah yang selalu mereka lakukan.”

Akumulasi teknis yang dibutuhkan Ke Ling berasal dari sini. Sang juru masak menemukan hidangan yang sudah disiapkan, dan setelah resep baru terlihat di seluruh dunia, Kuaishou menjadi salah satu tim yang paling cepat menyiapkan produk jadi.

Namun pada saat yang sama, para praktisi yang disebutkan di atas juga memiliki sikap menunggu dan melihat apakah Keling dapat menjadi pemimpin dalam teknologi dan produk untuk waktu yang lama. “Algoritme yang digunakan oleh semua orang saat ini serupa. Setiap perusahaan mungkin memiliki beberapa penyesuaian, namun perbedaannya tetap sama.” menghasilkan produk dengan efek serupa.

Oleh karena itu, kecepatan hanyalah keunggulan sementara Kuaishou. Mereka perlu benar-benar mengubah keunggulan mereka menjadi pelanggan yang stabil selama periode jendela terdepan.


Di mana ada keributan, di situ ada pelanggan

Pada tanggal 29 Desember 2020, Kuaishou secara resmi merilis "Fraksi Kuaishou" sebagai nilai perusahaan untuk pertama kalinya dalam surat internal kepada seluruh karyawan, yang menyatakan bahwa "terobsesi dengan pelanggan" adalah inti dari nilai-nilai Kuaishou.

Sebelumnya, baik di Kuaishou atau perusahaan Internet besar lainnya, konsep yang lebih sering disebutkan adalah "pengguna". Oleh karena itu, Kuaishou secara khusus menjelaskan alasan perubahan kosakata ini. Kompleksitas bisnis perusahaan semakin tinggi, berkembang dari 'pengguna' menjadi 'pelanggan'. Pelanggan mencakup produsen dan konsumen, pelanggan sisi B dan pengguna sisi C, pelanggan eksternal dan pelanggan internal. Kita perlu memperkuat pemahaman kita tentang produsen dan pelanggan internal. Pelanggan B-side. Untuk meningkatkan pemahaman dan kesadaran pelanggan, kami juga perlu menekankan kesadaran layanan kepada pelanggan internal.”

Melihat ke belakang pada tahun 2024, hal ini memang merupakan titik balik penting dalam perubahan struktur bisnis Kuaishou. Pada tahun 2020, di antara pendapatan tahunan Kuaishou, proporsi pendapatan siaran langsung turun dari 80,4% pada tahun sebelumnya menjadi 56,5%, dan proporsi pendapatan layanan pemasaran online meningkat dari 19% menjadi 37,2%. Lainnya, termasuk e-commerce, The proporsi pendapatan jasa dengan cepat naik menjadi 6,3% dari 1% pada tahun sebelumnya.

Seperti yang dijelaskan Kuaishou sendiri, produsen dan konsumen, pelanggan sisi B dan pengguna sisi C, pelanggan eksternal dan pelanggan internal semuanya adalah pelanggan penting Kuaishou, dan juga akan menjadi target pelanggan model besar Kuaishou.

Produsen dan konsumen bersama-sama membangun rantai bisnis paling dasar di Kuaishou. Produsen memproduksi konten dan konsumen mengonsumsi konten.Nilai produk model besar terletak pada penurunan ambang produksi sekaligus meningkatkan kualitas konten.

Yang pertama mudah dimengerti. Seperti yang bisa dicapai Keling saat ini, Anda bisa mendapatkan video dengan memasukkan teks atau gambar. Bagi orang-orang yang tidak memiliki kondisi pengambilan gambar dan kemampuan produksi, ambang batas produksi telah diturunkan secara signifikan.

Yang terakhir ini terdengar agak berlawanan dengan intuisi pada awalnya - dengan kemampuan simulasi dan panjang keluaran produk video AI saat ini, bagaimana kualitasnya bisa lebih baik daripada pengambilan gambar sebenarnya dan produksi profesional? Namun, pada platform terkemuka seperti Kuaishou dan Douyin, sebagian besar dari puluhan juta video pendek yang diproduksi setiap hari berasal dari pengguna biasa. Di mata produsen konten profesional, teknologi AI yang "belum cukup canggih" sudah cukup untuk membuat pengguna biasa ' Ambil bidikan acak untuk menambah materi dan kekayaan.

Pedagang sisi-B juga dapat menjadi pelanggan dari kemampuan model besar Kuaishou. Menurut data yang dirilis Kuaishou pada Konferensi Kecerdasan Buatan Dunia tahun ini, pendapatan iklan AI-nya telah melebihi 20 juta per hari. Materi iklan yang dihasilkan AI dapat mengurangi biaya per item menjadi 0,47 yuan dengan tetap mempertahankan RKT pada tingkat dasar.


Keling menghasilkan gambar, kata-kata cepat: materi iklan jus apel, ada segelas jus apel di atas meja putih, dengan dua buah apel merah di sampingnya

Bagi banyak produk model besar, menemukan skenario pendaratan merupakan masalah yang sulit sepanjang siklus hidup produk, namun Kuaishou jelas tidak kekurangan skenario.Seperti yang dikatakan Zhang Di, wakil presiden Kuaishou dan kepala model besar, kesuksesan Keling berasal dari “menambang nilai nyata dalam adegan nyata untuk memenuhi kebutuhan nyata pengguna.”

Masalah yang harus mereka hadapi adalah bagaimana membuat pengguna menjadi pengguna frekuensi tinggi model besar Kuaishou dalam skenario saat ini, dan bersedia untuk terus membayarnya, dan pertama-tama mewujudkan komersialisasi model besar dalam ekosistem mereka sendiri.

Pada tanggal 25 Juli, Keling membuka pendaftaran secara penuh. Di hari yang sama, Keling meluncurkan sistem keanggotaannya dan memasuki tahap penagihan.

Menurut informasi di situs resmi Keling, pengguna non-anggota bisa mendapatkan 66 poin inspirasi ketika mereka login setiap hari. Menurut "harga" saat ini, sekitar 6 video atau 330 gambar dapat dihasilkan secara gratis.

Ada dua model pembayaran. Yang pertama adalah model keanggotaan. Pengguna dapat membeli berbagai tingkat keanggotaan secara bulanan, triwulanan, setengah tahun, atau satu tahun model isi ulang, di mana pengguna dapat membayar langsung untuk mengisi ulang, biaya produksi pengguna untuk setiap video adalah 1 yuan, dan biaya produksi untuk setiap gambar adalah 2 sen.


Gambar yang dihasilkan oleh Keling, kata-kata cepatnya: matahari terbit, ada awan indah dan cahaya pagi di cakrawala, matahari tersembunyi di balik awan

Ada dua hal yang perlu diperhatikan mengenai sistem penetapan harga Keling.

Pertama, Kuaishou tidak menyediakan opsi keanggotaan yang dapat menghasilkan karya tanpa batas, yang berarti apakah mereka memilih mode isi ulang atau mode keanggotaan, pengguna sebenarnya "membayar uang untuk membeli waktu".Satu-satunya perbedaan adalah harga satuan setiap generasi, serta fungsi yang berbeda seperti penghapusan tanda air, ekstensi video, dan pergerakan cermin utama.

Biaya pembuatan video AI tinggi, dan Kuaishou tidak menyediakan anggota yang dapat menghasilkan waktu tanpa batas. Kuaishou jelas ingin menghindari kemungkinan pengendalian biaya dan membatasi produksi abu-abu sampai batas tertentu.

Kedua, nilai inspirasi sebagai "mata uang pembayaran" Keling setara dengan harga koin Kuai yang digunakan untuk memberi penghargaan kepada jangkar di ekosistem Kuaishou. Dengan 1 yuan RMB, Anda dapat membeli 10 koin cepat atau 10 poin inspirasi. Metode penetapan harga ini dapat menjaga kemungkinan terbukanya sistem pembayaran dalam ekosistem Kuaishou di masa depan.


Kuaishou bukanlah satu-satunya yang memiliki kebutuhan, skenario, pelanggan, peralatan, data, teknologi, dan cadangan bakat pada saat yang bersamaan.

Orang dalam industri yang disebutkan di atas memperkirakan bahwa dalam waktu dekat, Byte akan mampu menghasilkan produk video generatif dengan level yang sama. Sebelum itu, Kuaishou perlu menyelesaikan akumulasi pengguna dan akumulasi konten dalam periode jendela, sehingga konten AI dapat beroperasi secara efektif dalam ekosistem Kuaishou waktu yang lebih lama.

Sarana pertumbuhan dan operasional konvensional menjadi agendanya. Situs resmi Keling dengan cepat meluncurkan acara diskon 50% untuk anggota. Pada saat yang sama, pengguna bisa mendapatkan 66 poin inspirasi dengan login setiap hari untuk mengurangi dampak model pembayaran terhadap pertumbuhan dan retensi pengguna, sehingga semua pengguna setidaknya bisa mendapatkan 66 poin inspirasi. mencobanya tanpa ambang batas apa pun.

Selain itu, dalam pengoperasian situs Kuaishou, Keling tidak terlalu menekankan konsep-konsep seperti video generatif, solusi model difusi, dan cluster pelatihan terdistribusi waktu dan ruang" dan "kebangkitan 40 tahun yang lalu". "Foto sebelumnya" dan metode gameplay lainnya untuk menarik pengguna agar mulai menggunakannya terlebih dahulu, sehingga mengurangi biaya pemahaman pengguna.

Bagi pengguna awam, gameplay baru ini memiliki jalur kesulitan yang sama dengan gameplay efek khusus Kuaiying sebelumnya. Mereka memahaminya sebagai efek khusus yang lebih kuat. Entah mereka pernah mendengar tiga kata "model besar" atau tidak, hal itu tidak menghalangi mereka .Mereka menjadi pengguna sebenarnya dari produk model besar.

Ini adalah langkah terakhir bagi Kuaishou dan Byte untuk membuat video AI, jika penggunanya adalah milik mereka sendiri; ini juga merupakan krisis utama yang mereka hadapi di era AI, jika pengguna tertarik dengan produk baru yang tidak lagi diproduksi.

Daripada mengatakan bahwa mereka bersaing untuk memasuki era video AI, lebih baik dikatakan bahwa mereka semua adalah pembela. Produktivitas baru akan menciptakan bentuk konten baru dan pada akhirnya platform baru. Kisah ini akrab bagi Cheng Yixiao dan Zhang Yiming.

Mereka harus menjadi tingkat pertama.

(Gambar sampul dibuat oleh Keling.)


Kerjasama media hubungi ID WeChat |ciweimeijiejun

Jika Anda ingin berkomunikasi dengan kami, Anda dapat membalas "bergabung dengan grup" di latar belakang untuk bergabung dengan komunitas.