berita

PixVerse V2 telah hadir!Hasilkan 5 "Sora" dalam satu tarikan napas, dan lagu "volume" pembuatan video akan terbang menjauh

2024-07-24

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina


Penulis |. Yoky

Surel |[email protected]

"Terlalu keriting!"

Sejak bulan Juni, produk generasi video telah mengalami ledakan besar. Dari Keling hingga Luma dan Runway Gen3, kemampuan model dan efek produksi menjadi semakin baik.

Baru saja PixVerse meluncurkan versi V2. Selain memperbarui arsitektur DiT, sebenarnya dapat menghasilkan lima konten video efek "Sora" berturut-turut!

Dalam pengujian kreatif seperti kucing makan mie dan anjing mengendarai sepeda motor, kejernihan video, kualitas dinamis, dan estetika PixVerse V2 semuanya berkinerja baik.

Menurut Silicon Star,Berdasarkan arsitektur DiT (Diffusion + Transformer) yang dikombinasikan dengan mekanisme perhatian spatiotemporal, PixVerse V2 telah mengalami peningkatan bertahap dalam kemampuan model.Ini mendukung pembuatan video berdurasi 8 detik sekaligus, sekaligus meningkatkan rentang dinamis, ekspresi detail, dan keaslian video secara signifikan. Pembaruan besar lainnya adalah PixVerse V2 mendukung pembuatan 1-5 konten video berkelanjutan dengan sekali klik, dan klip secara otomatis akan menjaga konsistensi gambar utama, gaya gambar, dan elemen pemandangan, yaitu, setiap orang dapat dengan mudah menghasilkan konten video berdurasi 40 detik!

Dari perspektif efek generasi, di satu sisi, konten yang dihasilkan video versi PixVerse V2 memiliki kepadatan informasi yang lebih tinggi dan dapat mengirimkan lebih banyak informasi dalam beberapa detik konten lebih bermanfaat; di sisi lain, desain produk V2 menyederhanakan fungsi kompleks sebanyak mungkin, memungkinkan pemula untuk berkreasi.

Kami menemukan bahwa dengan terus menerus mengulangi teknologi dan produk model pembuatan video, pengguna biasa, baik domestik maupun asing, telah menunjukkan permintaan yang besar. Pembuatan konten video AI tidak terbatas pada kelompok profesional saja. Pengguna biasa juga bersemangat untuk mengekspresikan kreativitas dan ide mereka melalui alat yang sederhana dan intuitif.

Melihat iterasi produk PixVerse V2 dari perspektif ini, Anda akan menemukan bahwa setiap fungsi berupaya untuk lebih dekat dengan pengguna.

1

1. Setiap iterasi selangkah lebih dekat dengan pengguna

Sejak diluncurkan, PixVerse telah menjadi salah satu produk pembuatan video terpopuler berdasarkan inovasi teknologi dan wawasan mendalam tentang kebutuhan pengguna.

Pada versi terbaru V2, salah satu fitur terobosannya adalah kemampuan menghasilkan banyak video sekaligus dengan tetap menjaga konsistensi dan koherensi elemen antar video. Fitur ini sangat penting untuk pembuatan konten video berdurasi panjang, yang memungkinkan pembuat konten menghasilkan serangkaian klip video yang saling terkait seputar tema atau alur cerita.


Dalam evaluasi kami, kami menemukan bahwa PixVerse V2 berkinerja baik saat menangani adegan kompleks dan rangkaian video panjang. Gambar karakter yang sama dapat dengan bebas berpindah antar latar adegan yang berbeda. Selain itu, koherensi tidak terbatas pada konsistensi visual, tetapi juga mencakup transisi mulus dalam aksi dan plot, yang sangat penting untuk video naratif.

Sorotan lainnya adalah peningkatan kegunaannya. Berbeda dengan "mainan kreatif" di pasaran yang hanya dapat menghasilkan klip pendek dan memerlukan "gambar kartu" dan pengeditan sekunder yang konstan, PixVerse V2 tidak hanya dapat menghasilkan klip video berkualitas tinggi, tetapi juga memperluas kreativitas klip pendek, sehingga menghasilkan secara langsung Output konten kreatif yang lengkap dan dapat digunakan.

Fitur ini membuat PixVerse V2 tidak lagi sebatas menghasilkan jepretan pendek untuk pengeditan sekunder, namun dapat langsung menghasilkan video lengkap yang dapat digunakan di berbagai platform dan berbagai adegan.

Dalam evaluasi sebenarnya, fitur PixVerse V2 ini secara signifikan meningkatkan efisiensi dan kenyamanan pembuatan video. Pengguna tidak perlu lagi menghabiskan banyak waktu untuk mengedit dan sintesis video, serta dapat lebih fokus pada kreativitas dan konten itu sendiri. Baik itu video pendek untuk dibagikan di media sosial atau video dramatis yang memerlukan kontinuitas, PixVerse V2 dapat memberikan solusi terpadu. Peningkatan kegunaan ini semakin memperluas cakupan penerapan teknologi pembuatan video AI, sehingga memungkinkan pengguna biasa dan pembuat konten profesional untuk mendapatkan manfaat darinya.


Kita dapat melihat inovasi teknologi PixVerse V2 dan berbagai penyempurnaan dalam pengalaman pengguna. Menurut Silicon Star, PixVerse V2 telah membuat terobosan dalam pemodelan spatiotemporal Difusi dengan memperkenalkan mekanisme perhatian spatiotemporal inovatif ke dalam model yang mendasarinya, sehingga secara signifikan meningkatkan kemampuan pemrosesan untuk pemandangan yang kompleks. Pada saat yang sama, kemampuan pemahaman teksnya yang kuat memungkinkan model untuk mencocokkan perintah teks dengan konten video secara lebih akurat, sehingga mencapai perpaduan multi-modal yang mendalam.

Selain itu, PixVerse V2 juga telah dioptimalkan dalam hal efisiensi komputasi. Dengan menyempurnakan model aliran tradisional dan memberi bobot pada fungsi kerugian, model dapat menyatu lebih cepat, sehingga meningkatkan kecepatan dan akurasi pembuatan video. Pengenalan model VAE 3D dan penerapan mekanisme perhatian spatiotemporal semakin meningkatkan kualitas kompresi dan rekonstruksi video, memastikan transmisi dan penyimpanan konten video yang efisien.

Melihat kembali beberapa tonggak penting PixVerse sejak dirilis, kita akan menemukan bahwa di balik hal ini bukan hanya kekuatan teknisnya, namun juga pemahamannya yang tajam terhadap pasar dan kebutuhan pengguna.

Pada bulan Mei, PixVerse meluncurkan fitur kuas gerak revolusionernya. Fitur ini memungkinkan pengguna untuk mengontrol pergerakan area tertentu dalam video hanya dengan menggambar lintasan, sehingga sangat meningkatkan fleksibilitas dan intuisi pembuatan video. Penggunaan skenario tertentu termasuk namun tidak terbatas pada produksi animasi, kreativitas periklanan, pembuatan konten media sosial, dll. Tanggapan dari pengguna secara umum positif, dengan mengatakan bahwa fitur ini sangat menyederhanakan proses pengeditan video, menjadikan pembuatan lebih bebas dan intuitif.

Dalam hal pengaturan fungsi produk, ketika pengguna pada dasarnya puas dengan hasil yang dihasilkan tetapi ingin menyesuaikan detailnya, PixVerse mendukung fungsi pengeditan sekunder dan transformasi gratis, memungkinkan pengguna untuk secara fleksibel menyesuaikan efek tampilan video sesuai dengan kebutuhan platform dan skenario yang berbeda. Selain itu, PixVerse juga dapat memilih gaya dan rasio aspek yang berbeda, memberikan pengguna kebebasan yang lebih tinggi dalam pembuatan video.


Dari kuas gerak hingga fungsi konsistensi karakter hingga pembuatan video yang koheren versi V2, setiap pembaruan selangkah lebih dekat dengan pengguna. Konsep inovatif yang berpusat pada pengguna ini menjadikan PixVerse tidak hanya sebagai produk yang diwujudkan oleh teknologi, namun juga menjadi mitra dalam mewujudkan kreativitas pengguna.

1

2. Kedalaman menentukan inovasi

Saat kami mengevaluasi apakah produk pembuatan video merupakan mainan atau alat produktivitas, kepadatan informasi merupakan indikator penting kualitas konten.

Jika sebuah bola kecil bergerak tidak teratur pada latar belakang kosong, bola tersebut dapat bergerak dalam waktu yang tidak terbatas, namun hanya memberikan sedikit informasi.

Di PixVerse V2, Teknologi Aishi berupaya meningkatkan kepadatan informasi pembuatan video melalui cara teknis, membebaskan pengguna dari pengeditan materi video yang membosankan dan langsung memasuki pembuatan konten video kreatif. Mengejar konsistensi, memastikan bahwa bagian utama dari beberapa klip tetap tidak berubah, dan fungsi lainnya ditujukan untuk beralih dari materi video langsung ke konten video yang dapat dipublikasikan.

Manajer produk PixVerse berkata: Tim selalu menganut ide produk "berjalan bersama pengguna". Pada tahap awal pengembangan produk, tim akan melakukan pra-penelitian mendalam, termasuk komunikasi dengan praktisi industri, observasi terhadap pengguna sebenarnya, dan pengumpulan masukan dari komunitas. Metode penelitian pengguna menyeluruh ini memungkinkan Aishi untuk menangkap kebutuhan pengguna yang halus namun penting. Bahkan poin fitur kecil yang diusulkan oleh pengguna akan ditanggapi dengan serius dan diuji.

Konsep inovatif yang digerakkan oleh pengguna ini menjadikan fungsi PixVerse lebih dekat dengan kebutuhan pengguna sebenarnya. Manajer produk Aishi berbagi proses lahirnya Magic Brush, yang merupakan representasi khas dari kreasi produk Aishi.

Pada awal tahun ini, Runway meluncurkan kuas pertamanya, Motion Brush. Pengguna dapat menyesuaikan lintasan pergerakan subjek dengan memilih kuas yang berbeda dan menyesuaikan tombol kontrol di bawahnya. Setelah melihat fungsi ini dan melalui riset pasar, wawancara pengguna, dan umpan balik komunitas, kami menemukan bahwa pengguna memang memiliki permintaan yang tinggi terhadap alat pengeditan video yang lebih fleksibel, namun metode interaksi Motion Brush tidak cukup fleksibel, dan proses debugnya tidak tepat dan cukup terkendali.


Setelah menemukan kebutuhan ini, tim produk PixVerse fokus membahas: Metode interaksi seperti apa yang memungkinkan pengguna menggunakan fungsi kuas dengan lebih intuitif dan ringkas?

Berdasarkan penelitian awal pengguna, tim produk menemukan bahwa pertama-tama, pengguna perlu men-debug lintasan gerak beberapa subjek, dan tidak ada fungsi pemilihan partisi di Motion Brush. Kedua, setelah memilih subjek, lintasan pergerakan subjek dapat diubah , atas, bawah, kiri, dan kanan. Tombol kontrol tidak dapat mensimulasikan efek gerakan nyata. Oleh karena itu, dalam pembuatan Magic Brush, tim produk memilih metode pengolesan, pemilihan partisi yang cerdas, dan metode interaktif yang memungkinkan pengguna menggambar lintasan gerak secara bebas dalam 360 derajat.


Namun, metode interaksi semacam ini nyaman bagi pengguna namun menimbulkan tantangan teknis yang lebih besar. Berdasarkan arsitektur DiT, tim teknis Aishi mengembangkan algoritme inti untuk mendukung fungsi Kuas Ajaib, yang menganalisis masukan guratan pengguna dan mengubahnya menjadi efek gerakan dalam video.

Magic Brush diluncurkan dengan cepat hanya dalam satu bulan mulai dari menemukan kebutuhan pengguna, pembuatan proyek produk, hingga solusi teknis. Hal ini tidak terlepas dari model operasi perusahaan Aishi yang "pendek, datar, dan cepat".

Departemen pemasaran dapat dengan cepat mengumpulkan umpan balik pengguna dan mengkomunikasikannya kepada tim produk dan teknis secara tepat waktu. Aliran informasi dan proses pengambilan keputusan yang cepat ini memungkinkan Aishi dengan cepat mempertimbangkan kelayakan kebutuhan, melakukan pengujian A/B, dan mengambil keputusan dengan cepat. Ketangkasan ini merupakan keunggulan unik dari startup dan juga merupakan kunci kemampuan Aishi dalam melakukan iterasi produk dengan cepat.

Dibandingkan dengan perusahaan teknologi besar, startup memiliki keunggulan tertentu dalam hal kecepatan respons dan fleksibilitas. Ketangkasan ini tidak hanya tercermin dalam pengembangan produk dan strategi pasar, namun juga sangat mempengaruhi budaya perusahaan dan struktur organisasi. Karena ukurannya yang lebih kecil, startup lebih fleksibel dalam mengalokasikan sumber daya. Mereka dapat dengan cepat memindahkan sumber daya dari satu tugas ke tugas lainnya, atau dari satu proyek ke proyek lainnya, sehingga memastikan pemanfaatan sumber daya secara maksimal.

Pada saat yang sama, kami lebih memperhatikan masukan pengguna dan menempatkan kebutuhan pengguna sebagai pusat pengembangan produk. Pendekatan pengembangan produk berbasis pengguna ini memungkinkan startup meluncurkan produk yang memenuhi kebutuhan pengguna dengan lebih cepat. Banyak startup yang mengadopsi metode pengembangan agile, yang menekankan iterasi cepat dan perbaikan berkelanjutan. Bawa produk ke pasar lebih cepat dengan rilis reguler fitur baru dan perbaikan bug, dan optimalkan berdasarkan masukan pengguna.

Kelincahan dan inovasi mendalam yang diwujudkan oleh Aishi menjadi keunggulan unik perusahaan start-up di era baru model besar.

1

3. Kita membutuhkan teknologi yang baik dan produk yang lebih baik lagi.

Saat ini, kami menyadari bahwa sebenarnya masih banyak jalan yang harus ditempuh sebelum teknologi menjangkau pengguna, dan produk adalah penghubung yang paling penting. Teknologi adalah kekuatan pendorong inovasi, namun nilainya hanya dapat benar-benar tercermin ketika teknologi terhubung dengan pengguna melalui produk.

Selama proses pengembangan PixVerse, tim Teknologi Aishi dengan cermat memoles setiap detailnya. Dalam versi V2, untuk meningkatkan kegunaan video, PixVerse mendukung pengeditan sekunder dari hasil yang dihasilkan. Melalui pengenalan konten cerdas dan fungsi asosiasi otomatis, pengguna dapat secara fleksibel mengganti dan menyesuaikan subjek, tindakan, lingkungan, dan pergerakan kamera video, semakin memperkaya kemungkinan kreatif seks.


Orang yang bertanggung jawab atas produk Aishi juga mengatakan: "Kekuatan dan perbedaan teknologi memang penting, namun hambatan produksi dan pengguna serta umpan balik teknis yang dibentuk dengan menghubungkan lebih banyak pengguna melalui produk bahkan lebih penting lagi."

Pada saat yang sama, pada tahap awal pengembangan teknologi, produk juga menjadi titik awal penerapan teknologi. Ubah teknologi AI canggih menjadi fungsi produk nyata yang dapat dipahami dan dioperasikan oleh pengguna. Transformasi dari teknologi ke produk ini tidak hanya mempercepat penerapan teknologi, namun juga memberikan kenyamanan dan kreativitas yang belum pernah ada sebelumnya kepada pengguna.

Terutama ketika teknologi belum mencapai tingkat target, promosi dua arah antara teknologi dan produk mempunyai arti yang lebih praktis.

Misalnya, mengenai Kuas Ajaib yang disebutkan di atas, beberapa pembuat konten melaporkan: "Pada tahap ini, ketika kemampuan model dasar tidak dapat mencapai titik di mana banyak subjek bergerak sesuai dengan dunia fisik, menyesuaikan kuas gerak dapat meningkatkan ruang kreatif. Beberapa karakter ' Berkedip, Ekspresi dan gerakan relatif yang kompleks semuanya dapat dicapai dengan kuas gerak.”

Pada tahap ini, Vincent Video, meskipun secara konseptual menarik, menghadapi keterbatasan dalam menghasilkan konten dalam praktiknya. Karena terbatasnya kepadatan informasi dalam teks itu sendiri, seringkali sulit untuk menyampaikan semua detail adegan kompleks dan perubahan dinamis saat mengubah deskripsi teks menjadi konten video secara langsung. Oleh karena itu, Video Tusheng muncul sebagai solusi bertahap.

Dibandingkan dengan video Vincent, video Tusheng dapat memberikan kepadatan informasi yang lebih tinggi karena dihasilkan berdasarkan informasi visual dan dapat menangkap dan mereproduksi kompleksitas pemandangan dengan lebih akurat. Ketika kemampuan model dasar belum mengatasi perbedaan kepadatan informasi antara teks dan video, pengenalan Video Tusheng tidak hanya mencerminkan kemajuan teknologi, tetapi juga merupakan inovasi dalam ide desain produk.

Pada masa awal teknologi, strategi Aishi tercermin dalam melakukan terobosan teknologi dengan lebih memperhatikan implementasi produk. Hambatan pengguna selain hambatan teknis dibentuk, dan hambatan produk ditetapkan melalui pemahaman dan wawasan pengguna, sehingga mendorong batas-batas teknologi dan batas-batas produk.

Hanya produk generasi video yang benar-benar bisa dimanfaatkan yang bisa tertinggal. Tidak hanya harus memenuhi kebutuhan pengguna saat ini, tapi juga fokus ke masa depan dan memilih jalur pengembangan teknologi berkelanjutan.

Baik itu "perjuangan mati" awal dengan teknologi konsistensi, iterasi Magic Brush, atau peningkatan baru versi PixVerse V2, strategi produk Aishi didasarkan pada masa kini dan penyelesaian masalah praktis di satu sisi; mereka melihat ke masa depan dan memilih jalur pembangunan jangka panjang dan berkomitmen untuk membangun masa depan yang berkelanjutan.

Melalui penelitian dan pengembangan teknologi yang berkelanjutan, wawasan pengguna yang mendalam, dan penyempurnaan detail produk secara cermat, dalam industri pembuatan video, perusahaan berapa pun ukurannya memerlukan terobosan teknologi berkelanjutan untuk menciptakan produk yang benar-benar berharga dan dapat menginspirasi kreativitas.

Seperti slogan PixVerse V2: Melepaskan Potensi Kreatif untuk Semua Orang, ini bukan hanya peluang bagi PixVerse, tapi juga peluang bagi seluruh kreator di era model besar.