berita

Siapa yang dapat mengungguli Sora dalam hal pengalaman praktis dalam meluncurkan model besar video AI dalam negeri?

2024-08-10

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

Reporter berita sampul Xiong Yingying
Pada awal tahun ini, perusahaan Amerika OpenAI merilis model generasi video AI Sora, yang seperti guntur di lapangan, membawa kemungkinan baru pada aplikasi kecerdasan buatan. Saat itu, banyak netizen yang menyayangkan kesenjangan antara kita dan teknologi AI asing semakin lebar.
Namun, hanya dalam waktu setengah tahun, "Sora domestik" seperti Keling, PixVerse V2, Qingying, dan Vidu telah dirilis satu demi satu dan terbuka untuk pengguna secara gratis.
Model video domestik manakah yang terbaik? Ketika teknologi terus membuat terobosan, siapa yang dapat memimpin komersialisasi?
4 produk “Sora domestik” akan diluncurkan dalam bulan ini
Pengalaman tes reporter yang sebenarnya
Meskipun perang harga antara produsen besar dalam negeri dan model besar sangat sengit, beberapa perusahaan berfokus pada bidang pembuatan video AI dan melakukan upaya rahasia. Menurut statistik yang tidak lengkap, hingga saat ini, terdapat lebih dari 10 model video AI domestik berskala besar. Pada bulan Juli tahun ini saja, 4 "Sora domestik" dirilis secara online.
Pada tanggal 6 Juli, halaman web Kuaishou Keling AI secara resmi diluncurkan, menyediakan fungsi video Wensheng dan video Tusheng, yang dapat menghasilkan video hingga 10 detik. Ia juga menambahkan fungsi seperti kontrol pergerakan kamera dan penyesuaian frame pertama dan terakhir.
Pada tanggal 24 Juli, Aishi Technology secara resmi merilis PixVerse V2 yang akan dibuka untuk dunia secara bersamaan. Model ini dapat menghasilkan beberapa klip video sekaligus, dan dapat menghasilkan video berdurasi 8 detik untuk satu klip dan 40 detik untuk beberapa klip.
Selanjutnya, Qingying, yang dibuat oleh Perusahaan Zhipu AI, dan Vidu, yang dikembangkan secara independen oleh Teknologi Shengshu, juga dirilis satu demi satu. Diantaranya, Qingying berfokus pada pembuatan cepat dalam 30 detik; Vidu menambahkan pembuatan klip video bergaya animasi selain gaya realistis pada umumnya.
Model pembuatan video skala besar dari empat perusahaan di atas saat ini terbuka untuk pengujian. Setelah mendaftar dengan cepat melalui telepon, email, dll., reporter juga memiliki pengalaman nyata.
Untuk menguji fungsi "Video Gambar", reporter mengunggah gambar mawar yang sama yang belum mekar di empat situs model besar, dan memasukkan kata cepat "bunga mekar". Qingying dan Vidu berhasil menghasilkan mawar video bunga mekar. Dalam video yang dihasilkan oleh PixVerse dan Keling, terlihat bunga-bunga berayun, namun tidak ada efek dinamis "mekar". Namun saat reporter mengubah kata cepat menjadi "bunga mekar perlahan", Keling pun berhasil membuat video bunga mawar mekar. Terlihat bahwa model besar yang berbeda memiliki perbedaan dalam kemampuannya memproses dan memahami bahasa.
Tangkapan layar video dihasilkan oleh empat model besar domestik
Dilihat dari kecepatan pembuatan video, Vidu mencatatkan waktu tercepat dengan menghasilkan video berdurasi 3 detik dalam waktu kurang dari 1 menit. Tiga model besar lainnya menyelesaikan pembuatan video dalam waktu 5 menit. Meskipun Qingying mengiklankan "pembuatan cepat dalam 30 detik", mungkin karena terlalu banyak orang yang mencobanya, halaman pembuatan menunjukkan "diperkirakan mengantri selama 3 menit".
Dilihat dari pengalaman feedback dari netizen di platform sosial, semua model besar memiliki sedikit banyak masalah seperti distorsi karakter dan gambar yang hilang.
“Banyak yang menunggu dan melihat, tapi hanya sedikit yang mengambil tindakan.”
Investasi di bidang model besar cenderung hati-hati
Saat Sora lahir di awal tahun, masih ada suara-suara pesimistis di Internet, yang meyakini bahwa China sudah jauh tertinggal dari Amerika Serikat di bidang AI. Hanya setengah tahun kemudian, sejumlah model video AI besar yang menjadi tolok ukur Sora telah muncul di Tiongkok.
Tianyancha menunjukkan bahwa Zhipu AI yang didirikan pada tahun 2019 telah menyelesaikan pembiayaan Seri C dan saat ini bernilai lebih dari 10 miliar. Meskipun Aishi Technology dan Shengshu Technology baru didirikan pada tahun 2023, mereka masing-masing telah menyelesaikan tiga dan empat putaran pembiayaan. Apakah ini berarti kalangan investasi masih sangat antusias berinvestasi di trek balap model besar?
“Pada dasarnya, kami masih melihat lebih banyak dan berinvestasi sangat sedikit.” Guo Tao, seorang investor malaikat dan pakar di bidang kecerdasan buatan, mengatakan bahwa saat ini, investor terbesar adalah beberapa perusahaan Internet besar, yang telah banyak berinvestasi dalam berbagai model besar. proyek. Di satu sisi, produsen besar dapat menemukan beberapa skenario penerapan model video besar di bisnis mereka yang sudah ada, di sisi lain, jika model besar ini memiliki tingkat tumpang tindih tertentu dengan bisnis perusahaan itu sendiri, model tersebut dapat digunakan sebagai pelengkap; lini produk; produsen besar juga bisa Melalui sumber daya ekologi yang ada, perusahaan teladan besar ini akan diberdayakan sampai batas tertentu.
Perusahaan Zhipu AI telah mengumpulkan lebih dari 100 juta yuan dalam berbagai putaran pembiayaan
Secara keseluruhan, lembaga penanaman modal dalam negeri masih bersikap konservatif dan hati-hati terhadap model besar seperti Vincent Video dan Tush Video. Alasan utama dibalik hal ini adalah komersialisasi mereka menghadapi banyak tantangan.
Dalam pandangan Guo Tao, apakah itu Sora atau model domestik besar, video yang dihasilkan masih memiliki kekurangan tertentu. Misalnya, karakter yang dihasilkan AI terkadang memiliki jari ekstra, tidak dapat mengenai keranjang saat memotret, dll. Hal ini menunjukkan bahwa model besar kurang memahami hubungan spasial antar objek, dan model algoritme juga perlu lebih ditingkatkan.
Selain masalah teknis yang masih perlu diatasi, kendala terbesar dalam komersialisasi model video AI berukuran besar adalah kurangnya skenario aplikasi yang matang.
"Misalnya, Kuaishou sendiri memiliki platform dan konten, dan secara relatif, ia memiliki skenario penerapan tertentu. Banyak perusahaan media mandiri yang mungkin menggunakannya," kata Guo Tao, tetapi untuk beberapa perusahaan yang murni teknis, masih sulit menemukannya . Skenario permintaan yang sangat baik dan kaku di mana pengguna bersedia membayar.
Platform mempercepat eksplorasi komersialisasi
Pasar drama mikro-pendek diperkirakan akan memimpin dalam hal pendaratan
Meskipun ada tantangan dalam komersialisasi, platform model besar di dalam dan luar negeri secara aktif mengeksplorasi dan mencoba komersialisasi.
Reporter tersebut memperhatikan bahwa saat ini, model video AI domestik berukuran besar juga sudah mulai membayar di sisi konsumen. Pada tanggal 24 Juli, postingan WeChat resmi Keling AI mengungkapkan bahwa jumlah pengguna yang mengajukan izin telah melebihi 1 juta. Pada hari yang sama, sistem keanggotaan berbayar diluncurkan secara bersamaan, termasuk tiga kategori keanggotaan: emas, platinum, dan berlian. Harga keanggotaan tahunan berkisar lebih dari 500 yuan hingga lebih dari 5.000 yuan.
PixVerse mengadopsi model pembayaran berlangganan, termasuk versi dasar, versi standar, dan versi tidak terbatas, dengan harga satuan berkisar antara 5 yuan hingga 60 yuan.
Namun, banyak orang dalam industri mengatakan bahwa saat ini, model AI besar memiliki biaya daya komputasi dan biaya akuisisi pelanggan yang sangat tinggi. Kebiasaan pembayaran pengguna belum terbentuk, dan persaingan pasar sangat ketat. Tidak mudah untuk mencapai profitabilitas hanya dengan mengandalkan saja pada pembayaran sisi C.
Menurut pemberitaan media, pada bulan Juni tahun ini, merek mainan anak-anak terkenal di dunia "Toys R Us" bekerja sama dengan OpenAI untuk menggunakan film komersial berdurasi 1 menit "The Origin of Toys R Us" yang diproduksi oleh Sora menghasilkan iklan komersial yang layak. Seksualitas ditunjukkan lebih lanjut.
Pada bulan Juli, drama mikro-pendek fantasi asli AIGC domestik pertama "Mountains and Seas Strange Mirror: Breaking the Waves" secara resmi diluncurkan , Kunpeng yang fantastis dan binatang aneh, dll., semuanya Dihasilkan oleh AI.
Karena semakin banyak perusahaan produksi dan platform mulai menjajaki jalur integrasi "AI + mikro-drama pendek", model besar video AI mungkin menjadi yang pertama dikomersialkan di pasar drama mikro-pendek.
Laporan/Umpan Balik