informasi kontak saya
surat[email protected]
2024-10-05
한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina
zuckerberg sedang sibuk "mencuri pusat perhatian" di seluruh dunia akhir-akhir ini.
belum lama ini, dia memulai "kewirausahaan keduanya" dan baru saja menunjukkan kepada kita kacamata ar paling kuat, meta orion, yang telah dia asah selama sepuluh tahun. meskipun ini hanyalah mesin prototipe yang bertaruh pada masa depan, namun telah mencuri perhatian visi pro apple.
tadi malam, meta kembali mencuri perhatian di jalur model pembuatan video.
meta mengatakan bahwa meta movie gen yang baru dirilis adalah"model fondasi media" tercanggih hingga saat ini.
namun, kita harus berhati-hati terlebih dahulu. pejabat meta belum memberikan jadwal pembukaan yang jelas.
para pejabat mengaku secara aktif berkomunikasi dan bekerja sama dengan para profesional dan pencipta di industri hiburan, dan diharapkan untuk mengintegrasikannya ke dalam produk dan layanan meta sendiri pada tahun depan.
ringkas secara singkat fitur-fitur meta movie gen:
ini memiliki fungsi seperti pembuatan video yang dipersonalisasi, pengeditan video yang tepat, dan pembuatan audio.
mendukung pembuatan video panjang definisi tinggi pada 1080p, 16 detik, dan 16 frame per detik
mampu menghasilkan audio berkualitas tinggi dan fidelitas tinggi hingga 45 detik
masukkan teks sederhana untuk mencapai kemampuan pengeditan video yang canggih dan tepat
demonya sangat bagus, tetapi produk tersebut diperkirakan belum tersedia secara resmi untuk umum hingga tahun depan
ucapkan selamat tinggal pada "pantomim" dan fokuslah pada fungsi yang besar dan komprehensif
jika dirinci, movie gen memiliki empat fungsi utama: pembuatan video, pembuatan video yang dipersonalisasi, pengeditan video yang presisi, dan pembuatan audio.
fungsi video vincent telah lama menjadi fitur standar model pembuatan video. namun, meta movie gen dapat menghasilkan video definisi tinggi dengan rasio aspek berbeda sesuai kebutuhan pengguna, yang merupakan yang pertama di industri.
ringkasan masukan teks: seekor sloth dengan kacamata hitam merah muda tergeletak di atas pelampung donat di kolam. sloth sedang memegang minuman tropis. dunia ini tropis. sinar matahari menimbulkan bayangan.
ringkasan masukan teks: kamera berada di belakang seorang pria. pria itu bertelanjang dada, mengenakan kain hijau di pinggangnya. dia bertelanjang kaki. dengan benda api di masing-masing tangannya, dia menciptakan gerakan melingkar lebar. latar belakang laut yang tenang. suasananya memesona, dengan tarian api.
selain itu, meta movie gen menyediakan fungsi pengeditan video tingkat lanjut, memungkinkan pengguna mencapai tugas pengeditan video yang kompleks melalui input teks sederhana.
mulai dari gaya visual video, efek transisi antar klip video, hingga operasi pengeditan yang lebih detail, model ini juga memberikan kebebasan yang cukup.
dalam hal pembuatan video yang dipersonalisasi,meta movie gen juga mengambil langkah maju yang besar.
pengguna dapat mengunggah gambar mereka sendiri dan menggunakan meta movie gen untuk menghasilkan video yang dipersonalisasi dengan tetap mempertahankan karakter dan gerakan.
ringkasan masukan teks: seorang cowgirl yang mengenakan celana denim sedang menunggang kuda putih di kota tua di barat. sabuk kulit terpasang di pinggangnya. kuda itu megah, bulunya berkilau di bawah sinar matahari. pegunungan rocky berada di latar belakang.
dari lentera kongming hingga gelembung berwarna transparan, anda dapat dengan mudah mengganti objek yang sama dalam video hanya dengan satu kalimat.
masukan teks: ubah lentera menjadi gelembung yang membubung ke udara.
meski banyak model video yang diluncurkan tahun ini, kebanyakan hanya bisa menghasilkan "pantomim". sayang sekali jika ditinggalkan jika meta movie gen tidak "mengulangi kesalahan yang sama".
masukan teks: karya orkestra indah yang membangkitkan rasa takjub.
pengguna dapat menyediakan file video atau konten teks dan membiarkan meta movie gen menghasilkan audio yang sesuai berdasarkan input ini. (ps: perhatikan dubbing pendaratan skateboard)
dan, ini tidak hanya dapat membuat satu efek suara, tetapi juga membuat musik latar atau bahkan soundtrack lengkap untuk keseluruhan video, sehingga sangat meningkatkan kualitas video secara keseluruhan dan pengalaman menonton penonton.
usai menyaksikan demo tersebut, lex fridman mengungkapkan kekagumannya secara ringkas.
banyak netizen sekali lagi "mendorong" masa depan openai sora, tapi lebih dari itunetizen yang sudah menantikannya pun mulai menantikan dibukanya kualifikasi pengalaman tes.
kepala ilmuwan meta ai yann lecun juga mempromosikan platform meta movie gen secara online.
kue yang dilukis oleh meta patut dinantikan
saat meta movie gen diluncurkan, tim peneliti meta ai juga sekaligus menerbitkan makalah teknis setebal 92 halaman.
menurut laporan, tim peneliti ai meta terutama menggunakan dua model dasar untuk mencapai fungsi ekstensif ini-model video gen film dan audio gen film.
diantaranya, movie gen video merupakan model dasar dengan parameter 30b, yang digunakan untuk pembuatan teks-ke-video dan dapat menghasilkan video hd berkualitas tinggi hingga 16 detik.
fase pra-pelatihan model menggunakan sejumlah besar data gambar dan video untuk memahami berbagai konsep dunia visual, termasuk gerak objek, interaksi, geometri, gerak kamera, dan hukum fisika.
untuk meningkatkan kualitas pembuatan video, model ini juga diawasi dengan baik (sft) menggunakan sekumpulan kecil video dan teks berkualitas tinggi yang dipilih dengan cermat.
laporan tersebut menunjukkan bahwa proses pasca pelatihan merupakan tahapan penting dalam pelatihan model movie gen video, yang selanjutnya dapat meningkatkan kualitas pembuatan video, terutama fungsi personalisasi dan pengeditan gambar dan video.
perlu disebutkan bahwa tim peneliti juga membandingkan model movie gen video dengan model generasi video mainstream.
karena sora saat ini tidak dibuka, peneliti hanya dapat menggunakan video dan tips yang dirilis secara publik sebagai perbandingan. untuk model lainnya, seperti runway gen3, lumalabs, dan keling 1.5, peneliti memilih untuk membuat video sendiri melalui antarmuka api.
dan karena video yang diposting oleh sora memiliki resolusi dan durasi yang berbeda, maka peneliti melakukan crop pada video dari movie gen video untuk memastikan bahwa video tersebut memiliki resolusi dan durasi yang sama jika dibandingkan.
hasilnya menunjukkan,efek evaluasi movie gen video secara keseluruhan jauh lebih baik daripada runway gen3 dan lumalabs, memiliki sedikit keunggulan dibandingkan openai sora, dan setara dengan keling 1.5.
di masa depan, meta juga berencana merilis beberapa tolok ukur secara publik, termasuk movie gen video bench, movie gen edit bench, dan movie gen audio bench, untuk mempercepat penelitian model pembuatan video.
model movie gen audio adalah model parameter 13b untuk pembuatan video dan teks-ke-audio, yang mampu menghasilkan audio berkualitas tinggi dan fidelitas tinggi hingga 45 detik, termasuk efek suara dan musik, dan disinkronkan dengan video.
model ini mengadopsi model generatif berdasarkan pencocokan aliran dan arsitektur model transformator difusi (dit), dan menambahkan modul kondisional tambahan untuk memberikan kontrol.
bahkan tim peneliti meta memperkenalkan teknologi perluasan audio yang memungkinkan model menghasilkan audio yang koheren melampaui batas awal 45 detik. artinya, model tersebut dapat menghasilkan audio yang cocok tidak peduli berapa lama videonya.
kemarin, tim brooks, kepala openai sora, secara resmi mengumumkan pengunduran dirinya dan bergabung dengan google deepmind, yang sekali lagi mengaburkan ketidakpastian masa depan proyek sora.
menurut bloomberg, wakil presiden meta connor hayes mengatakan meta movie gen saat ini belum memiliki rencana produk khusus. hayes mengungkapkan alasan signifikan atas penundaan peluncuran.
meta movie gen saat ini menggunakan perintah teks untuk menghasilkan video yang seringkali memerlukan waktu tunggu puluhan menit, yang sangat memengaruhi pengalaman pengguna.
meta berharap untuk lebih meningkatkan efisiensi pembuatan video dan meluncurkan layanan video di terminal seluler sesegera mungkin untuk lebih memenuhi kebutuhan konsumen.
padahal jika kita melihat dari bentuk produknya,desain fungsional meta movie gen berfokus pada ukuran yang besar dan komprehensif, dantidak ada "kaki pincang" seperti model video lainnya.
kekurangan yang paling menonjol adalah ia memiliki cita rasa "masa depan" yang sama dengan sora.
cita-citanya sangat penuh, kenyataannya sangat kurus.
bisa dibilang, sama seperti sora yang saat ini sedang diambil alih oleh model-model besar dalam negeri, ketika meta movie gen diluncurkan, lanskap persaingan di bidang pembuatan video mungkin akan berubah lagi.
tapi setidaknya untuk saat ini, kue yang dilukis oleh meta sudah cukup untuk ditelan orang.