berita

Mengungkap rahasia FancyTech: inovasi algoritme di balik “reduksi kuat” dan “hiperkonvergensi”

2024-08-25

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

Dalam gelombang perubahan teknologi baru-baru ini, AIGC (konten yang dihasilkan oleh kecerdasan buatan) menjadi alat penting untuk ekspresi diri dan kreasi masyarakat. Kekuatan pendorong gelombang inovasi teknologi ini bukan hanya model algoritme yang besar, namun juga solusi yang sangat disesuaikan dan berfokus pada kebutuhan bidang tertentu. Selama dua tahun terakhir, AIGC telah berkembang lebih cepat dari perkiraan banyak orang, dan penerapannya telah berkembang mulai dari pembuatan teks hingga berbagai macam gambar dan video.
Baru-baru ini, "Heart of the Machine" melakukan wawancara eksklusif dengan perusahaan startup Tiongkok bernama FancyTech. Perusahaan ini tidak hanya memperluas pasar dengan cepat dengan menyediakan produk pembuatan konten visual komersial standar, namun juga menjadi yang pertama membuktikan keunggulan model vertikal dalam aplikasi praktis.
"Heart of the Machine" juga memperkenalkan secara detail model vertikal video terbaru FancyTech, DeepVideo, yang berhasil menjawab tantangan tentang cara memulihkan secara akurat dan mengintegrasikan produk ke dalam video secara alami, memastikan bahwa produk tetap bergerak.
Model vertikal FancyTech didasarkan pada kerangka algoritme dasar sumber terbuka, ditumpangkan dengan anotasi datanya sendiri dan dilatih ulang, dan hanya memerlukan beberapa ratus GPU untuk iterasi pelatihan berkelanjutan guna mencapai hasil generasi yang baik. Sebaliknya, dua faktor yaitu "data produk" dan "metode pelatihan" lebih penting terhadap efek implementasi akhir.
Berdasarkan akumulasi sejumlah besar data pelatihan 3D, FancyTech memperkenalkan gagasan kecerdasan spasial untuk memandu model pembuatan konten 2D. Dalam hal pembuatan konten gambar, tim mengusulkan "perangkat fitur multi-modal" untuk memastikan pemulihan barang, dan memastikan integrasi alami barang dan latar belakang melalui pengumpulan data khusus. Dalam hal pembuatan konten video, tim membangun kembali tautan yang mendasari pembuatan video, kerangka desain terarah, dan rekayasa data untuk menghasilkan video yang berpusat pada produk.
Selain itu, "Heart of the Machine" mengungkap secara mendalam bagaimana FancyTech menerapkan ide penelitian kecerdasan spasial pada model generasi visual. Tidak seperti model generatif tradisional, kecerdasan spasial menganalisis data sensor dalam jumlah besar dan melakukan kalibrasi yang tepat, sehingga model dapat memahami dan memahami dunia nyata.
FancyTech menggunakan pemindaian lidar alih-alih pengambilan gambar studio tradisional, dan telah mengumpulkan sejumlah besar data 3D berkualitas tinggi. Data ini digabungkan dengan data 2D untuk dijadikan data pelatihan model, yang sangat meningkatkan pemahaman model tentang dunia nyata.
Untuk tugas menantang dalam membentuk efek cahaya dan bayangan dalam pembuatan konten visual, FancyTech menerapkan beberapa lampu dengan kecerahan dan suhu warna yang dapat disesuaikan di setiap lingkungan untuk mengumpulkan sebanyak mungkin data cahaya dan bayangan alami guna meningkatkan lapisan spasial gambar yang dihasilkan.
Pengumpulan data berintensitas tinggi ini mensimulasikan pencahayaan adegan pengambilan gambar sebenarnya, sehingga lebih sesuai dengan karakteristik adegan e-commerce. Menggabungkan akumulasi data 3D berkualitas tinggi, FancyTech telah membuat serangkaian inovasi dalam kerangka algoritme, menggabungkan algoritme spasial secara organik dengan algoritme gambar dan video, memungkinkan model untuk lebih memahami interaksi antara objek inti dan lingkungan.
Eksplorasi komersialisasi tidak pernah berhenti di bidang AIGC. Meski terdapat konsensus, terdapat juga arah pengembangan yang berbeda. "Heart of the Machine" terungkap dalam artikel inovasi algoritma FancyTech di balik "reduksi kuat" dan "hiper-fusi".
“Generator fitur multi-modal” FancyTech mengekstrak fitur produk dalam berbagai dimensi dan kemudian menggunakan fitur ini untuk menghasilkan gambar yang menyatu dengan pemandangan. Ekstraksi fitur dibagi menjadi fitur global dan fitur lokal: fitur global mencakup elemen dasar seperti garis besar dan warna produk, yang diekstraksi menggunakan encoder VAE; fitur lokal berfokus pada detail produk dan diekstraksi melalui jaringan saraf grafik. Metode ini dapat menangkap fitur internal produk secara detail. Hubungan antara detail dan piksel utama, sehingga meningkatkan akurasi pemulihan detail produk.
Dalam perjalanan menuju komersialisasi, baik model umum maupun model vertikal yang diadopsi, tujuan utamanya adalah mencapai kesuksesan komersial. FancyTech telah memanfaatkan kekayaan data unik dan keahlian industrinya untuk mendapatkan pengakuan luas di pasar domestik dan luar negeri dan telah menjalin hubungan kerja sama dengan mitra internasional seperti Samsung, LG, dan platform e-commerce Lazada Asia Tenggara di Amerika Serikat, yang telah diakuisisi Kate Somerville dan Disukai oleh merek lokal seperti Solawave; di Eropa, memenangkan Penghargaan Inovasi LVMH dan memiliki kerja sama yang mendalam dengan pelanggan Eropa.
Selain itu, FancyTech juga menyediakan fungsi penerbitan otomatis tautan penuh dan umpan balik data dari video pendek AI, yang secara efektif mendorong pertumbuhan penjualan produk yang berkelanjutan.
Keberhasilan penerapan model vertikal tidak hanya mendorong perkembangan pasar komersial, namun juga memudahkan masyarakat umum dalam menggunakan teknologi AIGC untuk meningkatkan produktivitas.
Dengan meluasnya teknologi, hampir semua orang kini dapat merekam video, merekam musik, dan berbagi kreasi mereka kepada dunia melalui ponsel mereka. Kami menantikan masa depan di mana teknologi AIGC akan sekali lagi melepaskan kreativitas pribadi - memungkinkan orang-orang biasa dengan mudah melewati batas profesional dan mengubah ide menjadi kenyataan, sehingga mendorong lompatan produktivitas di semua lapisan masyarakat dan melahirkan lebih banyak industri baru.
Teks/Lin Ke yang berfokus pada AI
Laporan/Umpan Balik