Mi información de contacto
Correo[email protected]
2024-08-12
한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina
Máquina Corazón Original
Autor: Zhang Qian
En marzo de este año, el director ejecutivo de Nvidia, Jensen Huang, celebró un evento muy especial. Invitó a los autores del innovador artículo "La atención es todo lo que necesita" a reunirse en el GTC para hablar sobre la dirección futura del desarrollo de la IA generativa.
"Todo lo que nuestro campo disfruta hoy se remonta a ese momento... Tú cambiaste el mundo...", dijo Huang Jenxun en el lugar.
Para una industria orientada a la investigación científica como la IA, la próxima oportunidad de cambiar el mundo también puede estar oculta en un determinado artículo.
por lo tanto,Hemos visto un fenómeno inusual en este círculo: algunos directores ejecutivos sin formación técnica también han comenzado a quedarse despiertos hasta tarde leyendo artículos, con la esperanza de reducir el costo de prueba y error de la toma de decisiones.。
Si esto es cierto para los directores ejecutivos, mucho menos para otros profesionales en el campo. Hace algún tiempo, OpenAI, Google y Meta han estado dando grandes pasos, y algunas nuevas empresas también lanzan constantemente nuevos modelos y métodos. Creo que muchos profesionales sentirán que hay demasiados artículos que cubrir.
Entregar artículos a AI para que los resuma es un método de lectura común hoy en día, pero muchos resúmenes de AI carecen de niveles claros y descripciones detalladas de las innovaciones y limitaciones. Necesitamos pasar por varias rondas de preguntas para tener una comprensión completa del artículo. Además, usted mismo debe encontrar algunos diagramas de arquitectura de modelos clave y diagramas de resultados experimentales en el documento, y el tiempo real ahorrado es muy limitado.
En Tencent"Yuanbao”En la última actualización, vimos las soluciones a estos problemas. Su nuevo "Modo de lectura profunda"apoyoLectura larga e intensiva.,Capacidad para generar análisis modulares e ilustrados., muy adecuado para leer artículos.
Para verificar el efecto de esta nueva función, Machine Heart realizó una prueba real de primera mano.
"Lectura intensiva" del artículo, ¿dónde está la esencia?
¿Cómo es utilizar la IA para leer artículos? Muchas veces lo es: le tiras un PDF, y te devuelve un resumen + varios resúmenes (a veces puede llegar a 10). Esta información es realmente útil, pero a veces es difícil distinguir cuáles son los aspectos más destacados, qué resuelve el documento y qué no, y qué cuestiones centrales vale la pena examinar.
Nuestras pruebas reales encontraron que "Yuanbao" resuelve estos problemas al proporcionar una serie de información modular y estructurada.
Tome como ejemplo un documento SIGGRAPH que probamos. Si le arroja el papel directamente, el resumen que devuelve no es muy diferente del de otras IA. Sin embargo, siempre que se desplace hacia abajo con paciencia, verá un botón para "leer el documento en profundidad". Este es el interruptor de "un clic" para una lectura intensiva del documento.
A diferencia de la interfaz anterior para resumir artículos,La lectura intensiva de la página dividirá el documento en muchas capas., los antecedentes de la investigación, los métodos de investigación, el diseño experimental, el análisis de resultados y la conclusión general están organizados en un módulo, muy similar al diseño del artículo que normalmente presenta Machine Heart. Se puede acceder rápidamente a todos estos a través del esquema de la izquierda.
Aunque no hay muchas palabras en cada módulo, estas palabras son en realidad muy informativas. Por ejemplo, en el módulo de antecedentes de investigación, el párrafo "Dificultades de la investigación" describe cuatro dificultades en sólo tres oraciones cortas, y "Trabajo relacionado" es una versión muy condensada del "trabajo relacionado" del Capítulo 2. En un párrafo, describe Se presentan claramente las cuatro dificultades en este campo. Por lo tanto, después de leer este módulo, básicamente podemos comprender qué problema estudia el artículo y a qué tipo de estado de investigación nos enfrentamos.
Además de esta información estructurada convencional, la lectura intensiva de Yuanbao también tiene un diseño llamativo——Enumerará las fortalezas y debilidades del artículo., para que los investigadores puedan comprender rápidamente qué pueden aprender de este artículo y qué cuestiones vale la pena seguir estudiando.
¿Por qué es tan importante esta característica? Peng Minghui, profesor de la Universidad de Tsinghua en Taiwán, escribió una vez en un artículo sobre la lectura en papel que los artículos son diferentes de los libros de texto y proporcionan conocimiento sistemático compilado y organizado por otros, mientras que los artículos requieren que los lectores recuperen y organicen el conocimiento no organizado por sí mismos. Filtrar y organizar el conocimiento. en,La capacidad de analizar las fortalezas y debilidades de la investigación existente es particularmente importante. Esta es una parte clave del pensamiento crítico y una forma importante de mejorar en la investigación académica.. Al analizar y resumir rápidamente las ventajas y desventajas de los artículos, Yuanbao puede ayudar a los investigadores a ahorrar mucho tiempo en la selección y la comprensión preliminar, permitiéndoles centrarse más rápidamente en artículos directamente relacionados con su investigación.
Sin embargo, si crees que la información anterior te resulta demasiado tediosa, también puedes saltar directamente a la última.Módulo "Preguntas y respuestas clave". Estas son algunas de las preguntas más críticas que le ayudarán a comprender rápidamente el valor del artículo y luego determinar si vale la pena dedicar tiempo a leer el texto original. Por supuesto, muchos asistentes de IA anteriores también presentarán algunas preguntas clave al final de la respuesta, y usted puede obtener la respuesta con un solo clic. Sin embargo, si es un principiante o un lector con experiencia interdisciplinaria, puede que no sea fácil. para que usted pueda juzgar qué preguntas son más críticas. La presentación directa de Yuanbao parece más intuitiva.
La imagen original es el número original. ¿Quién dijo que la IA no puede agregar imágenes al leer artículos?
Al leer un artículo, muchas personas tienen la costumbre de leer la descripción del artículo mientras miran las imágenes. Es más rápido y más fácil de entender de esta manera. Sin embargo, la mayoría de las aplicaciones de IA en el mercado ahora devuelven resultados de texto. Si desea ver imágenes, debe buscarlas en el texto original.
En nuestras pruebas encontramos queYuanbao es una de las pocas IA que puede recortar directamente las imágenes en papel y colocarlas en las posiciones correspondientes de los párrafos.. Por ejemplo, si un módulo habla de arquitectura, pondrá el diagrama de arquitectura correspondiente:
Si hablas de resultados experimentales en un determinado módulo, pondrá el cuadro correspondiente:
Como todos sabemos, no hay forma de resolver por completo el problema de la ilusión de los modelos grandes. Por lo tanto, esta presentación de cifras originales es en realidad un método de salida más confiable, lo que facilita a los lectores verificar las respuestas del modelo en cualquier momento y es más seguro cuando se usa como referencia.
Además, también descubrimos que si necesita escribir un blog u otro resultado externo, Yuanbao también puede ayudarlo a dibujar gráficos y no necesita decirle dónde encontrar los datos. Puede ubicar las tablas relevantes en el. papel por sí solo y poner los datos. Extraerlo y dibujarlo. Esta función se puede invocar a través del botón "Hacer una pregunta" en el lado derecho de la página de lectura intensiva.
Puedes leer cuando y donde quieras. ¿Quién dijo que existen muchos obstáculos para leer artículos?
Además de información estructurada y salida con imágenes y textos, también descubrimos durante la prueba que Yuanbao en realidad tiene algunas funciones pequeñas muy prácticas que pueden hacer que la lectura de artículos sea más conveniente.
primero esTraducción y búsqueda de palabras.Estas son dos pequeñas funciones prácticas de la interfaz de lectura del "texto original". La traducción de palabras cruzadas puede ayudar a los lectores con un inglés deficiente a eliminar las barreras del idioma en cualquier momento y en cualquier lugar, y la búsqueda de palabras cruzadas va un paso más allá. Por ejemplo, la función de búsqueda de Yuanbao se ha convertido en un complemento para que pueda realizar búsquedas. para obtener información relevante en cualquier momento. Además, la explicación dada por Yuanbao no es sólo un breve resumen, sino también una expansión modular. Es realmente "estructurada" e "informativa" en cada detalle.
seguido de "Lectura sin conexión”. La practicidad de esta función es que permite revisar el contenido de lectura intensiva y el texto original en "modo avión" sin perder tiempo fragmentado. Esto permite a las aerolíneas recuperar algo de terreno en la competencia con el tren de alta velocidad. Quizás la próxima inspiración de los investigadores provenga de revisar la lectura intensiva en el avión.
La última pequeña función es "calculadora”. Hace algún tiempo, la IA causó mucha discusión porque no podía decir cuál era más grande, 9.9 o 9.11. En Yuanbao encontramos que tiene una función de calculadora integrada que asegura que las respuestas se generen en base a cálculos precisos. Esta característica es muy útil cuando leemos datos experimentales.
Detrás de la lectura intensiva de artículos extensos: resulta que hay orientación experta
Según información oficial, esta actualización de Tencent Yuanbao se centra en la "lectura intensiva de textos largos" y puede admitir de forma nativa la entrada de hasta casi 500.000 palabras. Los papeles que utilizamos en la prueba están lejos de alcanzar esta longitud, y la mayoría de los papeles con los que entramos en contacto a diario no pueden alcanzar esta longitud. Por lo tanto, cuando se utiliza Yuanbao para leer artículos de forma intensiva, la ventana de contexto es suficiente en la mayoría de los casos. Su modularidad, salida de gráficos y texto y pequeñas funciones como búsqueda de palabras y traducción también hacen que la lectura de artículos sea realmente conveniente y eficiente, acercándose un paso más a la "practicidad".
Esta evolución es inseparable del modelo detrás de ella: la actualización del modelo grande Hunyuan de Tencent. Se informa que para mejorar la profesionalidad y la practicidad del modelo en el campo profesional, el equipo de Tencent HunyuanSe invita especialmente a expertos en el campo a delinear las habilidades básicas de cada campo profesional y formular estándares para responder preguntas profesionales., lo que permite que el modelo actúe como un verdadero experto en el dominio. Entonces, después de usarlo, sentimos que Yuanbao sabe qué información necesitan los lectores y cómo debe presentarse.
Además de los artículos, esta nueva función también se puede utilizar para lectura intensiva.Informes financieros, informes de investigación.Texto de igual longitud. En estos escenarios, puede clasificar información de múltiples dimensiones y generar gráficos profesionales, como gráficos de análisis de DuPont, basados en el contenido del informe, lo que permite a las personas que no comprenden estos documentos comprender el estado financiero de la empresa y otra información.
Sin embargo, para el escenario de lectura de una tesis, Yuanbao todavía tiene margen de mejora, como la falta de una comparación completa de la traducción del texto original en la interfaz de lectura del texto original y, a veces, la identificación de fórmulas no es lo suficientemente precisa. También esperamos que Yuanbao pueda mejorar estos problemas en futuras actualizaciones.
Pero como aplicación que solo lleva más de dos meses lanzada, el desempeño de Tencent Yuanbao ya ha superado las expectativas. Su trayectoria evolutiva nos permite ver cómo los modelos de gran tamaño se irán convirtiendo paso a paso en nueva productividad. También esperamos que esta APP nos traiga más sorpresas.