Motiff merilis model UI besar pertama di Tiongkok, dengan skor kinerja melampaui Apple dan GPT-4o

2024-08-17

Kecerdasan buatan berkembang lebih cepat dari yang Anda bayangkan. Sejak GPT-4 memperkenalkan teknologi multimoda ke publik, model multimoda besar telah memasuki tahap perkembangan pesat, secara bertahap beralih dari penelitian dan pengembangan model murni ke eksplorasi dan penerapan di bidang vertikal, dan terintegrasi secara mendalam dengan semua lapisan masyarakat. Di bidang interaksi antarmuka, raksasa teknologi internasional seperti Google dan Apple telah berinvestasi dalam penelitian dan pengembangan model UI multi-modal berukuran besar, yang dianggap sebagai satu-satunya jalan ke depan bagi revolusi AI ponsel.

Dalam konteks ini, lahirlah model UI berskala besar pertama di Tiongkok. Pada tanggal 17 Agustus, di Konferensi Desain Pengalaman Internasional IXDC2024, Motiff, alat desain di era AI, meluncurkan model multi-modal UI yang dikembangkan secara independen - Model Motiff. Ini adalah model berskala besar pertama di dunia yang dikembangkan oleh perusahaan alat desain UI, menandai kebangkitan kekuatan desain UI Tiongkok di panggung global.

Pada konferensi IXDC, Wakil Presiden Motiff memperkenalkan model UI besar pertama di Tiongkok - Model Motiff

Model Motiff memiliki pemahaman UI yang sangat baik dan kemampuan untuk menjalankan instruksi terbuka. Dalam lima tolok ukur kemampuan UI yang diakui industri, semua indikator model Motiff melampaui GPT-4o dan Ferret UI milik Apple. Model ini juga melampaui ScreenAI Google dalam hal indikator, dengan indikator Widget Captioning mencapai 161,77, yang merupakan SoTA yang menyegarkan. Dibandingkan dengan solusi yang ada seperti Ferret UI dan ScreenAI, model besar Motiff dapat secara fleksibel memahami elemen antarmuka berdasarkan konteks, mencapai tingkat "ahli desain" dan paling dekat dengan pemahaman manusia dan ekspresi antarmuka UI.

Dalam tinjauan indeks UI resmi, semua indikator model Motiff melampaui GPT-4o dan Ferret UI.

Model UI besar yang paling mudah dipahami, ekspresinya sangat mirip dengan manusia, dan merupakan landasan revolusi interaksi antarmuka di masa depan.

Pada konferensi IXDC, Wakil Presiden Motiff Zhang Haoran memperkenalkan model Motiff secara rinci. Model ini memiliki dua kemampuan yaitu memahami antarmuka pengguna dan navigasi interaktif, dan diharapkan dapat memimpin revolusi interaksi antarmuka. Penciptaan manusia dimulai dengan kognisi dan pemahaman, dan penciptaan UI di era AI juga akan dimulai dengan pemahaman penuh antarmuka pengguna dari model besar, kata Zhang Haoran.

Model Motiff unggul dalam memahami antarmuka pengguna dan sebanding dengan "ahli desain". Ini tidak hanya dapat mengidentifikasi semua gambar, ikon, teks, dan lebih dari 40 komponen UI terperinci di antarmuka, tetapi juga secara akurat menandai koordinat regional dari berbagai elemen pada antarmuka. Selain itu, dapat menjawab berbagai pertanyaan terkait antarmuka pengguna, membuat kesimpulan fungsional berdasarkan informasi antarmuka, dan menjelaskan konten antarmuka secara detail.

Dibandingkan dengan model besar seperti GPT-4o, Ferret UI, dan ScreenAI, model besar Motiff juga memiliki keunggulan signifikan dalam kemampuan analisis antarmuka. Misalnya, dalam antarmuka aplikasi APP Store, model Motiff dapat membagi halaman menjadi beberapa modul seperti bilah navigasi atas dan modul informasi aplikasi dari perspektif desain UI, dan menganalisis fungsi dan tata letak setiap modul secara detail, yang membantu untuk memberikan saran Desain, secara otomatis menghasilkan prototipe desain UI, dll. Motiff memimpin industri dalam kemampuan analisis antarmuka dan merupakan model multi-modal yang paling memahami desain UI.

Model Motiff dapat menjawab berbagai pertanyaan tentang antarmuka UI

Model Motiff juga paling dekat dengan manusia dalam hal pemahaman dan kemampuan berekspresi. Solusi sebelumnya (seperti Ferret UI dan ScreenAI) mengalami kesulitan dalam memahami arti ikon berdasarkan konteks. Model besar Motiff mengumpulkan sejumlah besar data lapangan UI berkualitas tinggi melalui anotasi manual dan metode lainnya, serta dapat memahami dan menunjukkan kelipatannya. penggunaan ikon yang sama dalam antarmuka yang berbeda, secara signifikan meningkatkan keakuratan dan relevansi kontekstual deskripsi.

Data pada Gambar 1 dihasilkan oleh Google ScreenAI, yang salah mengartikan ikon berbentuk hati sebagai "hati" dan bukan "koleksi"; data pada Gambar 2, 3, dan 4 dihasilkan oleh model Motiff, yang dapat mendeskripsikan secara akurat arti ikon berdasarkan informasi antarmuka.

Model Motiff juga memiliki kemampuan navigasi interaktif, yang dapat meminta langkah pengoperasian sesuai kebutuhan pengguna dan menyelesaikan operasi yang relevan atas nama pengguna setelah mendapat izin. Hal ini meletakkan dasar bagi revolusi interaksi antarmuka di masa depan. Di masa depan, pengguna tidak perlu mengklik layar secara manual, tetapi hanya memerlukan input suara atau gambar untuk mengoperasikan perangkat. Asisten seluler seperti Siri dapat menjadi pintu masuk baru ke semua aplikasi , mengantarkan paradigma baru aplikasi perangkat lunak dan era baru interaksi antarmuka juga akan terbuka.

Selain itu, model besar Motiff juga berhasil mengendalikan tingkat kesalahan dalam satu digit. Pendapat industri percaya bahwa penurunan tajam dalam tingkat kesalahan menandai kemajuan AI dari alat bantu menjadi "singularitas teknis" yang dapat menyelesaikan pekerjaan secara mandiri. Saat ini, salah satu masalah inti yang dihadapi oleh model besar adalah tingkat kesalahan yang tinggi. Misalnya, GPT-4 memiliki tingkat kesalahan sebesar 30% hingga 40% pada beberapa indikator, dan tingkat kesalahan bahkan melebihi 70% di bidang UI. Sebaliknya, model besar Motiff mengurangi tingkat kesalahan menjadi kurang dari 15%, dan tingkat kesalahan masing-masing indikator hanya 7%.

Mengapa perusahaan aplikasi AI dapat secara mandiri mengembangkan model besar yang terdepan di dunia? Zhang Haoran mengatakan pada konferensi tersebut bahwa hal ini berasal dari upaya berkelanjutan untuk "produk yang lebih baik". “Sebagai pemimpin dalam produk AI, Motiff berkomitmen untuk mendobrak hambatan teknis berdasarkan skenario aplikasi dan terus meningkatkan persyaratan kemampuan AI,” ujarnya.

Kemampuan Motiff untuk "mengalahkan" model internasional terkemuka seperti GPT-4o dan Ferret UI milik Apple di bidang UI juga mendapat manfaat dari akumulasi teknologi jangka panjangnya. Motiff telah berfokus pada interaksi dan desain antarmuka sejak didirikan pada tahun 2021. Perusahaan induknya, Yuanfudao Group, mendirikan Lab AI yang berfokus pada eksplorasi teknologi AI mutakhir pada tahun 2014. Pada tahun 2018, Yuanfudao Group memenangkan penghargaan mesin pembacaan yang terkenal kompetisi MSMAARCO. Peringkat pertama di dunia, kemampuan pemahaman membaca mesinnya pada saat itu telah melampaui Baidu dan Microsoft.

Peningkatan efisiensi + generasi AI menciptakan asisten terbaik bagi para desainer dan mengoptimalkan alur kerja pengembangan perangkat lunak

Tidak ada keraguan bahwa peluncuran model Motiff menandai momen GPT di bidang desain antarmuka. Desain UI memerlukan pemrosesan elemen visual yang tepat dan pemahaman mendalam tentang logika interaksi pengguna. Model Motiff secara signifikan meningkatkan efisiensi dan kemampuan pembuatan alat desain.

Dalam fungsi UI yang dihasilkan AI Motiff, pengguna hanya perlu memasukkan perintah, dan Motiff dapat menghasilkan dua versi draf desain dalam waktu kurang dari 30 detik. Menurut tinjauan buta baru-baru ini oleh lebih dari 30 profesional industri, kedua versi rancangan desain yang dihasilkan oleh Motiff lebih baik daripada alat UI generasi AI terkemuka sebelumnya, Galileo AI. Setelah fitur ini dirilis, dengan cepat ia menjadi pemimpin pasar. Keunggulan ini diperoleh langsung dari kemampuan profesional UI model besar Motiff. Kabarnya fungsi UI yang dihasilkan AI telah dibuka untuk pengguna global pada 17 Agustus. Anda hanya perlu mendaftarkan akun Motiff untuk merasakannya secara gratis.

Selain itu, keakuratan identifikasi komponen pada fungsi sistem desain AI juga telah ditingkatkan secara signifikan. Dengan dukungan model berukuran besar, desainer dapat menyelesaikan pekerjaan hanya dalam hitungan menit yang biasanya memakan waktu setidaknya berminggu-minggu. Fungsi AI copy dapat mengenali gambar dan copywriting dalam draf desain dengan akurasi lebih dari 97%.

"Motiff berencana untuk membuka kemampuan model besarnya untuk perusahaan menengah dan besar, dan bekerja dengan pelanggan untuk menciptakan hubungan produksi antarmuka baru di era AI." Zhang Haoran menunjukkan pada pertemuan tersebut bahwa model besar Motiff akan membantu mengoptimalkan pengembangan perangkat lunak alur kerja dan secara efektif mempersingkat proses produksi antarmuka yang ada.

Motiff telah menciptakan banyak "yang pertama" dalam industri desain antarmuka sebelumnya. Motiff tidak hanya memelopori berbagai fungsi AI, tetapi juga merupakan perangkat lunak desain antarmuka pertama di Tiongkok yang mengembangkan mesin rendering grafis yang dikembangkan sendiri dunia memiliki 1 juta lapisan dalam satu kanvas. Produk berperforma tinggi yang masih dapat diedit dengan lancar. Motiff dikenal sebagai "Figma versi AI" di media sosial luar negeri. Meskipun meningkatkan produktivitas lebih dari 100 kali lipat, harganya lebih dari 80% lebih rendah daripada Figma. Motiff telah terdaftar di platform penerbitan produk terkenal Product Hunt Daftar harian produk terpopuler bulan Juli dan daftar mingguan.

(Ada banyak postingan yang membandingkan Motiff dan Figma di platform sosial luar negeri. Motiff dianggap sebagai alat AI yang perlu diketahui oleh para desainer.)

berita