berita

“Jimeng AI” sudah tersedia, bisakah Byte menyusul Kuaishou?

2024-08-13

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

Jurnalis: Yang Xinyi Editor: Wei Guanhong

"Tekanannya ada pada Douyin." Ketika produk AI (kecerdasan buatan) generatif yang fenomenal muncul pada bulan Juni tahun ini, diwakili oleh model generasi video besar yang dikembangkan sendiri oleh Kuaishou, Keling, dunia luar menantikan kinerja Byte selanjutnya.

Baru-baru ini, versi seluler "Jimeng AI", platform pembuatan AI terpadu yang dikembangkan oleh tim pengeditan ByteDance, secara resmi diluncurkan di Apple App Store.

Reporter "Daily Economic News" mengetahui bahwa aplikasi tersebut saat ini memiliki fungsi seperti gambar berbasis teks dan video berbasis teks/gambar. Selain itu, Jimeng telah meluncurkan sistem keanggotaan dan meluncurkan berbagai metode berlangganan.

Dengan membandingkan penerapan sebenarnya dari Ji Meng, Ke Ling dan Sora, reporter dari "Daily Economic News" menemukan bahwa tiga model pembuatan video besar lebih akurat dan lengkap dalam menangkap dan memahami kata-kata cepat, tetapi karakter Ji Meng Kemampuan seperti pembentukan, kekayaan konten, dan kelancaran video relatif kurang. Dari segi durasi konten yang dihasilkan, Jimeng mendukung pembuatan video hingga 12 detik.

"Jumlah detik yang diperlukan untuk menghasilkan video yang mulus merupakan faktor kunci dalam menilai kemampuan sebuah video untuk menghasilkan model yang besar." Seorang insinyur model besar berkata dalam sebuah wawancara dengan reporter dari "Daily Economic News", " 'Halus' perlu diukur dari berbagai dimensi. Lihat, misalnya, apakah ada kesalahan faktual dalam konten yang dihasilkan, seberapa baik ingatan Anda, dan apakah indra ruang Anda benar.”


Versi seluler "Jimeng AI" ada di rak. Sumber gambar: Tangkapan layar aplikasi


"Jimeng AI" ada di rak, bisakah efeknya menyusul Ling?

Pada awal tahun ini, kemunculan Sora mengantarkan "era video ChatGPT". Selanjutnya, "kuda hitam" Keling yang diluncurkan oleh Kuaishou meningkatkan ekspektasi masyarakat terhadap performa model video AI dalam negeri berskala besar. ByteDance, perusahaan induk Douyin, yang juga merupakan raksasa video pendek, dianggap sebagai salah satu pemain yang paling berpotensi mengejar ketertinggalan di jalur tersebut.


Sumber gambar halaman web Keling AI: Tangkapan layar situs resmi

Pada akhir Maret, platform kreasi AI "Jimeng AI" yang dikembangkan oleh tim mutakhir Byte dibuka untuk pengujian internal; pada 9 Mei, aplikasi diluncurkan dalam versi web fungsi utama: pembuatan gambar, kanvas pintar, dan pembuatan video. Saat ini, fungsi pembuatan cerita baru telah diluncurkan; pada tanggal 6 Agustus, versi seluler aplikasi tersebut secara resmi diluncurkan di Apple App Store, dan kini memiliki fungsi seperti teks- gambar berbasis gambar dan video berbasis teks/gambar.


Sumber gambar halaman web Jimeng AI: Tangkapan layar situs web resmi

Mengenai efek sebenarnya dari Jimeng, pada awal Juli tahun ini, serial pendek fiksi ilmiah narasi kontinu generatif AIGC pertama di negara itu "Sanxingdui: Future Apocalypse" diluncurkan di Douyin. Dalam serial pendek yang berjumlah 13 episode ini, Jimeng sebagai kepala pendukung teknologi AI menggunakan 10 teknologi AI yang meliputi pembuatan skrip AIGC, desain konsep dan storyboard, konversi gambar ke video, pengeditan video, dan peningkatan konten media.

Menurut pemberitaan media, dalam proses bekerja sama dengan Bona Pictures untuk meluncurkan "Sanxingdui: Future Apocalypse", Jimeng AI meningkatkan fungsi "pembuatan video", termasuk mendukung pengisian bingkai 24fps, 30fps, 60fps, dan kemampuan menggandakan skor super. , menambahkan gerakan horizontal lensa, gerakan ke atas dan ke bawah, dukungan untuk kontrol arah dan amplitudo pergerakan lensa, dll.


Sumber gambar: Tangkapan layar akun publik Jianying WeChat

Setelah Aplikasi Jimeng diluncurkan, reporter dari "Daily Economic News" memilih sejumlah kata-kata cepat video Sora yang resmi dirilis oleh OpenAI untuk melakukan uji perbandingan terhadap Jimeng, Keling dan Sora.

Dilihat dari hasil pengujian reporter, ketiga model pembuatan video besar tersebut relatif akurat dan lengkap dalam menangkap dan memahami kata-kata cepat, serta performa layar dari konten video yang dihasilkan juga koheren dan lancar.

Namun dari segi ketepatan penggambaran karakter, Sora memiliki keunggulan tertentu dibandingkan Ji Meng dan Ke Ling; dalam hal kealamian gerakan, Ji Meng sedikit kalah dengan ketiga produk uji tersebut Cuplikan video bertema Jalanan Tokyo" "" menunjukkan bahwa kepala dan leher karakter yang dihasilkan oleh mimpi tersebut sedikit terdistorsi saat memutar kepalanya, dan gerakan tangan membawa tas juga mengalami deformasi.


Sumber gambar: Tangkapan layar video dibuat oleh reporter

Dari segi kekayaan elemen dalam konten produksi, Sora juga tampil lebih baik di antara ketiganya. Misalnya saja pada konten video yang dihasilkan bertema "Astronaut", Sora banyak memberikan asosiasi terkait kata-kata cepat seperti pesawat luar angkasa dan adegan luar angkasa, sedangkan Ji Meng dan Ke Ling hanya menampilkan karakter laki-laki yang mengenakan pakaian luar angkasa.


Sumber gambar: Tangkapan layar video dibuat oleh reporter

Mitra Riset Analisis Analisis Chen Chen mengatakan dalam sebuah wawancara dengan reporter dari "Daily Economic News" bahwa dalam hal efek generasi, kualitas gambar AI Dream secara keseluruhan lebih baik, sedangkan video AI lebih baik dalam hal durasi, kekayaan elemen, tindakan. koherensi, dll. Detailnya masih kurang.

"(Konten elemennya tidak cukup kaya) Ini lebih tentang penyelarasan model, tetapi jika kemampuan untuk mengasosiasikan dari 'astronot' ke 'pesawat luar angkasa' hilang, itu adalah masalah dengan kemampuan model dasar." Seorang insinyur model besar mengatakan kepada reporter "Daily Economics" News bahwa jumlah detik yang diperlukan untuk menghasilkan video yang halus adalah faktor kunci dalam menilai kemampuan video untuk menghasilkan model besar. "'Halus' perlu dilihat dari berbagai dimensi, seperti apakah konten yang dihasilkan memiliki kesalahan faktual, seberapa bagus memorinya, dan rasa ruangnya tidak setara."

Wartawan "Daily Economic News" menemukan melalui uji coba bahwa ketika kata-kata cepat yang sama dimasukkan, semakin lama waktu yang dibutuhkan untuk membuat video, keakuratan dan kelancaran gambar dan pergerakan utama video kemungkinan besar akan rusak.

Saat ini, Jimeng mendukung pembuatan konten video berdurasi 3 detik, 6 detik, 9 detik, dan 12 detik, sesuai dengan konsumsi titik yang berbeda. Sora telah mampu mensintesis video berdurasi 1 menit sejak dirilis pada tanggal 21 Juni, Keling meluncurkan fungsi video Tusheng, yang mendukung konversi gambar statis menjadi video berdurasi 5 detik yang jelas berdasarkan konten teks yang berbeda, dan terus berlanjut. write Fungsinya dapat membuat video berdurasi sekitar 5 detik, dan video terpanjang dapat dihasilkan sekitar 3 menit.


Akankah video AI menjadi tambang emas bagi model besar?

Kemunculan Sora tidak diragukan lagi telah membuka lapangan bermain baru bagi model-model besar - pada bulan Juli tahun ini, Alibaba Damo Academy merilis platform pembuatan video AI terpadu "Xunguang", dan SenseTime meluncurkan platform pembuatan video AI pertama yang dapat dikontrol untuk C- pengguna akhir Vimi, model besar untuk pembuatan video karakter, dan Zhipu juga mengumumkan bahwa model video yang dihasilkan AI Qingying (Ying) akan diluncurkan secara resmi di Zhipu Qingyan⋯⋯

Ketika para pemain AI terkemuka secara kolektif melancarkan serangan sengit terhadap model-model besar yang dihasilkan video, sebuah pertanyaan yang tidak dapat dihindari muncul di hadapan kita: Dapatkah video AI membuat perusahaan model besar menghasilkan uang?

Ambil contoh OpenAI, sebuah perusahaan ternama di industri ini, setelah meluncurkan sejumlah model berskala besar dengan kemampuan terdepan seperti Sora, pada bulan Juli tahun ini, beberapa media mengutip orang-orang yang mengetahui masalah tersebut dan analisis data keuangan internal yang dirahasiakan. mengatakan bahwa OpenAI mungkin menghadapi kerugian hingga 5 miliar tahun ini. Dengan kerugian besar sebesar US$3,5 miliar, pendapatan setahun penuh perusahaan diperkirakan antara US$3,5 miliar dan US$4,5 miliar, yang jauh lebih rendah daripada biaya operasional.

Pada saat yang sama, model video skala besar dalam negeri juga tampak sedikit "cemas" dalam hal komersialisasi. Pada tanggal 30 Juli, Keling meluncurkan sistem keanggotaan global, serupa dengan sistem keanggotaan yang diluncurkan di pasar domestik, misalnya kartu bulanan dibagi menjadi tiga tingkatan: 10 dolar AS, 37 dolar AS, dan 92 dolar AS, yang bisa. menghasilkan sekitar 66, 300 dan 800 video berdurasi 5 detik.

Reporter "Daily Economic News" memperhatikan bahwa Jimeng telah meluncurkan sistem keanggotaan, dengan metode berlangganan yang berbeda untuk keanggotaan dasar sebesar 79 yuan untuk satu bulan, 69 yuan untuk langganan bulanan berkelanjutan, dan 659 yuan untuk langganan tahunan. Secara khusus, anggota dasar dapat menggunakan 505 poin per bulan untuk menghasilkan sekitar 2.020 gambar atau 168 video AI. Selain itu, terdapat layanan keanggotaan standar dengan 2020 poin per bulan dan layanan keanggotaan lanjutan dengan 6555 poin per bulan yang akan segera diluncurkan.

“Karena tingginya biaya pelatihan model dan inferensi model AI besar, ditambah dengan permintaan alat AI yang relatif tersebar dari pengguna C-end dan kurangnya kesediaan mereka untuk membayar, komersialisasi model video besar di pasar C-end akan terjadi. masih menghadapi masa pengembangan yang panjang." Chen Chen percaya bahwa untuk pasar C-end, komersialisasi model video skala besar masih memiliki jalan panjang.

Dimulai dari pasar sisi-B, Chen Chen mengatakan kepada reporter "Daily Economic News", "Untuk sisi-B, revolusi teknologi AI membentuk kembali alur kerja asli, mengompresi tautan yang berlebihan, dan memicu permintaan baru akan alat-alat kreatif. Dalam proses ini, model besar video AI dapat diintegrasikan secara bertahap dengan produksi film dan televisi yang ada, kreativitas periklanan, dan perencanaan konten media untuk membantu otomatisasi proses yang kompleks dan produksi konten yang cerdas, dan apakah kemampuan model tersebut dapat tertanam secara efektif di dalamnya. alur kerja yang sebenarnya akan menghasilkan substansi. Peningkatan efisiensi seksual dan pengurangan biaya merupakan faktor kunci dalam membangun kemampuan komersialisasi."

"Komersialisasi Kimi secara bertahap akan mulai dijajaki, namun bukan fokus saat ini. Fokus saat ini adalah membangun model generasi berikutnya dengan kemampuan yang lebih kuat." Pada bulan Agustus tahun ini, Dark Side of the Moon diwawancarai oleh a reporter dari "Daily Economic News" Shi Zeng mengatakan bahwa pada tahap ini, ini bukan waktunya untuk fokus pada komersialisasi.

Barangkali, hal yang sama juga berlaku untuk Impian "yang masih baru", yang masih memiliki tahapan demi tahap yang harus dicapai dan dilampaui. "Fungsi produk dan model bisnis Jimeng saat ini fokus pada penyajian UGC (konten buatan pengguna), dan integrasi ekologis dengan Douyin juga akan menjadi fokus pengembangan di masa depan." Chen Chen berkata, "Mungkin dalam hal durasi, kecepatan bingkai, gambar detail dan teknologi lainnya Pembandingan langsung pada parameter bukanlah hal yang paling perlu diperhatikan Jimeng pada tahap ini, kuncinya terletak pada implementasi aplikasi dan kemampuan integrasi ekologis.”