Motiff lanza el primer modelo de interfaz de usuario grande de China, con puntuaciones de rendimiento que superan a Apple y GPT-4o

2024-08-17

La inteligencia artificial se está desarrollando más rápido de lo que imagina. Desde que GPT-4 introdujo la tecnología multimodal en el ojo público, los grandes modelos multimodales han entrado en una etapa de rápido desarrollo, pasando gradualmente de la investigación y el desarrollo de modelos puros a la exploración y aplicación en campos verticales, y están profundamente integrados en todos los ámbitos de la vida. En el campo de la interacción de interfaces, gigantes tecnológicos internacionales como Google y Apple han invertido en la investigación y el desarrollo de grandes modelos de UI multimodales, lo que se considera el único camino a seguir para la revolución de la IA en los teléfonos móviles.

En este contexto nació el primer modelo de UI a gran escala en China. El 17 de agosto, en la Conferencia Internacional de Diseño de Experiencias IXDC2024, Motiff, una herramienta de diseño en la era de la IA, lanzó su modelo multimodal de UI desarrollado de forma independiente: Motiff Model. Este es el primer modelo a gran escala del mundo desarrollado por una empresa de herramientas de diseño de UI, lo que marca el ascenso del poder de diseño de UI de China en el escenario global.

En la conferencia IXDC, el vicepresidente de Motiff presentó el primer modelo de interfaz de usuario grande en China: Motiff Model

El modelo Motiff tiene una excelente comprensión de la interfaz de usuario y la capacidad de ejecutar instrucciones abiertas. En cinco puntos de referencia de capacidad de interfaz de usuario reconocidos por la industria, todos los indicadores del modelo Motiff superaron GPT-4o y Ferret UI de Apple también superó a ScreenAI de Google en términos de indicadores, con el indicador de subtítulos de widgets alcanzando 161,77, actualizando SoTA. En comparación con las soluciones existentes como Ferret UI y ScreenAI, el modelo grande de Motiff puede comprender de manera flexible los elementos de la interfaz según el contexto, alcanzando el nivel de "expertos en diseño" y es el más cercano a la comprensión y expresión humana de las interfaces de UI.

En la revisión autorizada del índice UI, todos los indicadores del modelo Motiff superaron a GPT-4o y Ferret UI.

El modelo grande de interfaz de usuario más comprensible, la expresión es muy cercana a los seres humanos y es la piedra angular de la futura revolución de la interacción de la interfaz.

En la conferencia IXDC, el vicepresidente de Motiff, Zhang Haoran, presentó en detalle el modelo Motiff. Tiene las dos capacidades de comprender la interfaz de usuario y la navegación interactiva, y se espera que lidere la revolución de la interacción de la interfaz. "La creación humana comienza con la cognición y la comprensión, y la creación de UI en la era de la IA también comenzará con la comprensión completa de la interfaz de usuario a partir de modelos grandes", dijo Zhang Haoran.

El modelo Motiff sobresale en la comprensión de las interfaces de usuario y es comparable a un "experto en diseño". No solo puede identificar todas las imágenes, íconos, texto y más de 40 componentes detallados de la interfaz de usuario en la interfaz, sino que también marca con precisión las coordenadas regionales de diferentes elementos en la interfaz. Además, puede responder varias preguntas relacionadas con la interfaz de usuario, hacer inferencias funcionales basadas en la información de la interfaz y describir el contenido de la interfaz en detalle.

En comparación con modelos grandes como GPT-4o, Ferret UI y ScreenAI, el modelo grande de Motiff también tiene ventajas significativas en las capacidades de análisis de interfaz. Por ejemplo, en la interfaz de la aplicación APP Store, el modelo Motiff puede dividir la página en múltiples módulos, como la barra de navegación superior y el módulo de información de la aplicación desde una perspectiva de diseño de la interfaz de usuario, y analizar la función y el diseño de cada módulo en detalle, lo que ayuda para proporcionar sugerencias de diseño, generar automáticamente prototipos de diseño de interfaz de usuario, etc. Motiff lidera la industria en capacidades de análisis de interfaces y es el modelo multimodal que mejor comprende el diseño de UI.

El modelo Motiff puede responder una variedad de preguntas sobre interfaces UI

El modelo Motiff también es el más cercano a los humanos en términos de capacidades de comprensión y expresión. Las soluciones anteriores (como Ferret UI y ScreenAI) tenían dificultades para comprender el significado de los íconos según el contexto. El gran modelo de Motiff recopiló una gran cantidad de datos de campo de UI de alta calidad a través de anotaciones manuales y otros métodos, y pudo comprender y señalar los múltiples. usos del mismo icono en diferentes interfaces, mejorando significativamente la precisión y relevancia contextual de la descripción.

Los datos de la Figura 1 fueron generados por Google ScreenAI, que malinterpretó el ícono en forma de corazón como "corazón" en lugar de "colección"; los datos de las Figuras 2, 3 y 4 fueron generados por el modelo Motiff, que puede describir con precisión el significado del icono según la información de la interfaz.

El modelo Motiff también tiene capacidades de navegación interactiva, que pueden indicar pasos operativos de acuerdo con las necesidades del usuario y completar operaciones relevantes en nombre del usuario después de obtener el permiso. Esto sienta las bases para la futura revolución de la interacción de interfaces. En el futuro, los usuarios no necesitarán hacer clic manualmente en la pantalla, sino que solo necesitarán la entrada de voz o imagen para operar el dispositivo. Los asistentes móviles como Siri pueden convertirse en la nueva entrada a todas las aplicaciones. Los teléfonos inteligentes y las computadoras reales nacerán de esto. , marcando el comienzo de un nuevo paradigma de aplicaciones de software y, en consecuencia, también se abrirá una nueva era de interacción de interfaces.

Además, el modelo grande de Motiff también controló con éxito la tasa de error dentro de un solo dígito. La opinión de la industria cree que la fuerte caída en las tasas de error marca el avance de la IA de una herramienta auxiliar a una "singularidad técnica" donde puede completar el trabajo de forma independiente. Actualmente, uno de los problemas principales que enfrentan los modelos grandes es la alta tasa de error. Por ejemplo, GPT-4 tiene una tasa de error del 30% al 40% en múltiples indicadores, y la tasa de error incluso supera el 70% en el campo de la interfaz de usuario. Por el contrario, el modelo grande de Motiff reduce la tasa de error a menos del 15% y la tasa de error de los indicadores individuales es solo del 7%.

¿Por qué las empresas de aplicaciones de IA pueden desarrollar de forma independiente grandes modelos líderes en el mundo? Zhang Haoran dijo en la conferencia que esto se debe a la búsqueda continua de "mejores productos". "Como líder en productos de IA, Motiff está comprometido a superar los cuellos de botella técnicos basados en escenarios de aplicación y mejorar continuamente los requisitos para las capacidades de IA", afirmó.

La capacidad de Motiff para "derrotar" modelos internacionales líderes como GPT-4o y Ferret UI de Apple en el campo de la interfaz de usuario también se beneficia de su acumulación de tecnología a largo plazo. Motiff se ha centrado en la interacción y el diseño de interfaces desde su creación en 2021. Su empresa matriz, Yuanfudao Group, estableció un laboratorio de IA centrado en la exploración de vanguardia de la tecnología de IA en 2014. En 2018, Yuanfudao Group ganó el conocido concurso de lectura automática. competencia MSMAARCO Clasificado primero en el mundo, sus capacidades de comprensión de lectura automática en ese momento habían superado a Baidu y Microsoft.

La mejora y generación de la eficiencia de la IA crea el mejor asistente para los diseñadores y optimiza el flujo de trabajo de desarrollo de software.

No hay duda de que el lanzamiento del modelo Motiff marca el momento GPT en el campo del diseño de interfaces. El diseño de la interfaz de usuario requiere un procesamiento preciso de los elementos visuales y una comprensión profunda de la lógica de interacción del usuario. El modelo Motiff mejora significativamente la eficiencia y las capacidades de generación de las herramientas de diseño.

En la función de interfaz de usuario generada por IA de Motiff, los usuarios solo necesitan ingresar un comando y Motiff puede generar dos versiones del borrador del diseño en menos de 30 segundos. Según revisiones ciegas recientes realizadas por más de 30 profesionales de la industria, ambas versiones de los borradores de diseño generados por Motiff son mejores que la anterior herramienta de interfaz de usuario líder en generación de IA, Galileo AI. Después del lanzamiento de esta función, rápidamente se convirtió en el líder del mercado. Esta ventaja se deriva directamente de las capacidades profesionales de UI del modelo grande de Motiff. Se informa que la función de interfaz de usuario generada por IA se abrió a usuarios globales el 17 de agosto. Solo necesita registrar una cuenta de Motiff para experimentarla de forma gratuita.

Además, también se ha mejorado significativamente la precisión de la identificación de componentes en la función del sistema de diseño de IA. Con el apoyo de modelos grandes, los diseñadores pueden realizar en sólo minutos un trabajo que antes les llevaba al menos semanas. La función de copia AI puede reconocer imágenes y redacción en borradores de diseño con una precisión superior al 97%.

"Motiff planea abrir las capacidades de sus modelos grandes a medianas y grandes empresas y trabajar con los clientes para crear una nueva relación de producción de interfaces en la era de la IA. Zhang Haoran señaló en la reunión que el modelo grande de Motiff ayudará a optimizar el desarrollo de software". flujo de trabajo y acortar efectivamente el proceso de producción de la interfaz existente.

Motiff ha creado muchas "primicias" en la industria del diseño de interfaces antes. No solo fue pionero en múltiples funciones de IA, sino que también fue el primer software de diseño de interfaces en China en desarrollar un motor de renderizado de gráficos de desarrollo propio. mundo para tener 1 millón de capas en un solo lienzo. Un producto de alto rendimiento que aún se puede editar sin problemas. Motiff es conocido como la "versión AI de Figma" en las redes sociales extranjeras. Si bien mejora la productividad más de 100 veces, el precio es más de un 80% más bajo que el de Figma. Ha aparecido en la conocida plataforma de publicación de productos Product Hunt. Lista diaria de productos más populares de julio y lista semanal Número uno de la lista.

(Hay una gran cantidad de publicaciones que comparan Motiff y Figma en plataformas sociales extranjeras. Motiff se considera una herramienta de inteligencia artificial que los diseñadores deben conocer).

noticias