notizia

Motiff rilascia il primo grande modello di interfaccia utente della Cina, con punteggi prestazionali che superano Apple e GPT-4o

2024-08-17

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

L’intelligenza artificiale si sta sviluppando più velocemente di quanto potresti immaginare. Da quando GPT-4 ha introdotto la tecnologia multimodale agli occhi del pubblico, i grandi modelli multimodali sono entrati in una fase di rapido sviluppo, passando gradualmente dalla ricerca e sviluppo di modelli puri all’esplorazione e all’applicazione in campi verticali e sono profondamente integrati con tutti i ceti sociali. Nel campo dell’interazione dell’interfaccia, giganti tecnologici internazionali come Google e Apple hanno investito nella ricerca e nello sviluppo di grandi modelli di interfaccia utente multimodali, considerati l’unica via da seguire per la rivoluzione dell’intelligenza artificiale dei telefoni cellulari.

In questo contesto è nato il primo modello di UI su larga scala in Cina. Il 17 agosto, alla IXDC2024 International Experience Design Conference, Motiff, uno strumento di progettazione nell'era dell'intelligenza artificiale, ha lanciato il suo modello multimodale di interfaccia utente sviluppato in modo indipendente: Motiff Model. Si tratta del primo modello su larga scala al mondo sviluppato da un'azienda di strumenti di progettazione dell'interfaccia utente, che segna l'ascesa del potere di progettazione dell'interfaccia utente cinese sulla scena globale.



Alla conferenza IXDC, il vicepresidente di Motiff ha presentato il primo grande modello di interfaccia utente in Cina: Motiff Model

Il modello Motiff ha un'eccellente comprensione dell'interfaccia utente e la capacità di eseguire istruzioni aperte. In cinque benchmark di capacità dell'interfaccia utente riconosciuti nel settore, tutti gli indicatori del modello Motiff hanno superato GPT-4o e l'interfaccia utente Ferret di Apple. Ha anche superato ScreenAI di Google in termini di indicatori, con l'indicatore Widget Captioning che ha raggiunto 161,77, rinfrescando SoTA. Rispetto alle soluzioni esistenti come Ferret UI e ScreenAI, il modello di grandi dimensioni di Motiff può comprendere in modo flessibile gli elementi dell'interfaccia in base al contesto, raggiungendo il livello di "esperti di design" ed è il più vicino alla comprensione e all'espressione umana delle interfacce dell'interfaccia utente.



Nell’autorevole revisione dell’indice UI, tutti gli indicatori del modello Motiff hanno superato GPT-4o e Ferret UI.

Il grande modello di interfaccia utente più comprensibile, l'espressione è molto vicina agli esseri umani ed è la pietra angolare della futura rivoluzione dell'interazione dell'interfaccia.

Alla conferenza IXDC, il vicepresidente di Motiff Zhang Haoran ha presentato in dettaglio il modello Motiff. Ha le due capacità di comprendere le interfacce utente e la navigazione interattiva e si prevede che guiderà la rivoluzione dell'interazione dell'interfaccia. "La creazione umana inizia con la cognizione e la comprensione, e anche la creazione dell'interfaccia utente nell'era dell'intelligenza artificiale inizierà con la piena comprensione dell'interfaccia utente da modelli di grandi dimensioni", ha affermato Zhang Haoran.

Il modello Motiff eccelle nella comprensione delle interfacce utente ed è paragonabile a un "esperto di design". Non solo può identificare tutte le immagini, le icone, il testo e più di 40 componenti dell'interfaccia utente a grana fine nell'interfaccia, ma anche contrassegnare accuratamente le coordinate regionali dei diversi elementi sull'interfaccia. Inoltre, può rispondere a varie domande relative all'interfaccia utente, fare inferenze funzionali basate sulle informazioni dell'interfaccia e descrivere dettagliatamente il contenuto dell'interfaccia.

Rispetto ai modelli di grandi dimensioni come GPT-4o, Ferret UI e ScreenAI, il modello di grandi dimensioni Motiff presenta anche vantaggi significativi nelle capacità di analisi dell'interfaccia. Ad esempio, nell'interfaccia dell'applicazione APP Store, il modello Motiff può dividere la pagina in più moduli come la barra di navigazione superiore e il modulo di informazioni sull'applicazione dal punto di vista della progettazione dell'interfaccia utente e analizzare in dettaglio la funzione e il layout di ciascun modulo, il che aiuta per fornire suggerimenti di progettazione, generare automaticamente prototipi di progettazione dell'interfaccia utente, ecc. Motiff è leader del settore nelle capacità di analisi dell'interfaccia ed è il modello multimodale che comprende meglio la progettazione dell'interfaccia utente.





Il modello Motiff può rispondere a una serie di domande sulle interfacce dell'interfaccia utente

Il modello Motiff è anche il più vicino all’uomo in termini di capacità di comprensione ed espressione. Le soluzioni precedenti (come Ferret UI e ScreenAI) avevano difficoltà a comprendere il significato delle icone in base al contesto. Il grande modello di Motiff raccoglieva una grande quantità di dati sui campi dell'interfaccia utente di alta qualità attraverso l'annotazione manuale e altri metodi e riusciva a comprendere e evidenziare il multiplo. usi della stessa icona in interfacce diverse, migliorando significativamente l'accuratezza e la pertinenza contestuale della descrizione.



I dati nella Figura 1 sono stati generati da Google ScreenAI, che ha frainteso l'icona a forma di cuore come "cuore" anziché "raccolta"; i dati nelle Figure 2, 3 e 4 sono stati generati dal modello Motiff, che può descrivere accuratamente l'icona significato dell'icona in base alle informazioni dell'interfaccia.

Il modello Motiff dispone anche di funzionalità di navigazione interattiva, che possono suggerire passaggi operativi in ​​base alle esigenze dell'utente e completare le operazioni pertinenti per conto dell'utente dopo aver ottenuto l'autorizzazione. Ciò pone le basi per la futura rivoluzione dell'interazione dell'interfaccia. In futuro gli utenti non avranno più bisogno di cliccare manualmente sullo schermo, ma avranno solo bisogno dell'input vocale o di un'immagine per utilizzare il dispositivo. Assistenti mobili come Siri potrebbero diventare la nuova entrata in tutte le app. Da qui nasceranno veri smartphone e computer , inaugurando di conseguenza un nuovo paradigma di applicazioni software e una nuova era di interazione delle interfacce.

Inoltre, il modello grande Motiff ha controllato con successo anche il tasso di errore all'interno di una sola cifra. L’opinione del settore ritiene che il forte calo dei tassi di errore segni il progresso dell’intelligenza artificiale da strumento ausiliario a “singolarità tecnica” in cui può completare il lavoro in modo indipendente. Attualmente, uno dei problemi principali affrontati dai modelli di grandi dimensioni è l'elevato tasso di errore. Ad esempio, GPT-4 ha un tasso di errore compreso tra il 30% e il 40% su più indicatori e il tasso di errore supera addirittura il 70% nel campo dell'interfaccia utente. Al contrario, il modello large di Motiff riduce il tasso di errore a meno del 15% e il tasso di errore dei singoli indicatori è solo del 7%.

Perché le aziende di applicazioni AI possono sviluppare in modo indipendente modelli di grandi dimensioni leader a livello mondiale? Zhang Haoran ha affermato alla conferenza che ciò deriva dalla continua ricerca di “prodotti migliori”. "In qualità di leader nei prodotti IA, Motiff è impegnata a superare i colli di bottiglia tecnici basati sugli scenari applicativi e a migliorare continuamente i requisiti per le capacità IA", ha affermato.

La capacità di Motiff di "sconfiggere" modelli internazionali leader come GPT-4o e Ferret UI di Apple nel campo dell'interfaccia utente beneficia anche del suo accumulo di tecnologia a lungo termine. Motiff si è concentrato sull'interazione e sul design dell'interfaccia sin dalla sua fondazione nel 2021. La sua società madre, Yuanfudao Group, ha creato un laboratorio di intelligenza artificiale focalizzato sull'esplorazione all'avanguardia della tecnologia AI nel 2014. Nel 2018, Yuanfudao Group ha vinto il noto concorso di lettura automatica concorrenza MSMAARCO. Al primo posto nel mondo, le sue capacità di comprensione della lettura automatica a quel tempo avevano superato Baidu e Microsoft.

Il miglioramento e la generazione dell'efficienza dell'intelligenza artificiale creano il miglior assistente per i progettisti e ottimizzano il flusso di lavoro di sviluppo del software

Non c'è dubbio che il rilascio del grande modello di Motiff segni il momento GPT nel campo del design dell'interfaccia. La progettazione dell'interfaccia utente richiede un'elaborazione precisa degli elementi visivi e una profonda comprensione della logica di interazione dell'utente. Il modello Motiff migliora significativamente l'efficienza e le capacità di generazione degli strumenti di progettazione.

Nella funzione dell'interfaccia utente generata dall'intelligenza artificiale di Motiff, gli utenti devono solo inserire un comando e Motiff può generare due versioni della bozza di progetto in meno di 30 secondi. Secondo recenti revisioni cieche di oltre 30 professionisti del settore, entrambe le versioni delle bozze di progettazione generate da Motiff sono migliori rispetto al precedente strumento di interfaccia utente leader nella generazione di intelligenza artificiale Galileo AI. Dopo il rilascio di questa funzionalità, è diventato rapidamente leader nel mercato. Questo vantaggio deriva direttamente dalle capacità professionali dell'interfaccia utente del modello grande di Motiff. È stato riferito che la funzione dell'interfaccia utente generata dall'intelligenza artificiale è stata aperta agli utenti globali il 17 agosto. È sufficiente registrare un account Motiff per sperimentarla gratuitamente.



Inoltre, anche la precisione dell'identificazione dei componenti nella funzione del sistema di progettazione AI è stata notevolmente migliorata. Con il supporto di modelli di grandi dimensioni, i progettisti possono svolgere in pochi minuti un lavoro che prima richiedeva almeno settimane. La funzione di copia AI è in grado di riconoscere immagini e copywriting nelle bozze di progettazione con una precisione superiore al 97%.

"Motiff prevede di aprire le sue capacità di modello di grandi dimensioni alle medie e grandi imprese e di collaborare con i clienti per creare un nuovo rapporto di produzione di interfacce nell'era dell'intelligenza artificiale." Zhang Haoran ha sottolineato durante l'incontro che il modello di grandi dimensioni di Motiff aiuterà a ottimizzare lo sviluppo del software flusso di lavoro e abbreviare efficacemente il processo di produzione dell'interfaccia esistente.

Motiff ha già creato molti "primati" nel settore della progettazione di interfacce. Non solo è stato pioniere di molteplici funzioni di intelligenza artificiale, ma è stato anche il primo software di progettazione di interfacce in Cina a sviluppare un motore di rendering grafico auto-sviluppato mondo per avere 1 milione di livelli su una singola tela. Un prodotto ad alte prestazioni che può ancora essere modificato senza problemi. Motiff è conosciuta come la "versione AI di Figma" sui social media esteri. Pur migliorando la produttività di oltre 100 volte, il prezzo è inferiore di oltre l'80% rispetto a Figma. È stato elencato sulla nota piattaforma di pubblicazione di prodotti Product Hunt Elenco giornaliero ed elenco settimanale dei prodotti più popolari di luglio.



(Ci sono un gran numero di post che confrontano Motiff e Figma sulle piattaforme social straniere. Motiff è considerato uno strumento di intelligenza artificiale che i designer devono conoscere.)