Informe semanal de AI | El modelo grande no puede determinar si 9.11 o 9.9 es más grande OpenAI lanza el modelo liviano GPT-4o mini

Informe semanal de AI | El modelo grande no puede determinar cuál es más grande, 9.11 o 9.9 OpenAI lanza el modelo liviano GPT-4o mini;

2024-07-21

El modelo grande no puede determinar cuál es más grande, 9,11 o 9,9

Un problema matemático que resulta difícil para los estudiantes de primaria ha dejado perplejos a muchos grandes modelos de IA en el país y en el extranjero. ¿Cuál es más grande, el 9.11 o el 9.9? Con respecto a este tema, el 17 de julio, los reporteros de China Business News probaron 12 modelos grandes, entre los cuales Alibaba Tongyi Qianwen, Baidu Wenxinyiyan, Minimax y Tencent Yuanbao respondieron correctamente, pero ChatGPT-4o, Byte Doubao, Dark of the Moon Mian kimi, Zhipu Qingyan , Zero One All Things Knowledge, Step Stars Yuewen, Baichuan Zhibai Xiaoying, Shangtang Discussion obtuvieron respuestas incorrectas y las formas incorrectas son diferentes. La mayoría de los modelos grandes comparan erróneamente números después del punto decimal en sus preguntas y respuestas, pensando que 9,11 es mayor que 9,9.

Comentario: Detrás de los errores, la escasa capacidad matemática de los modelos grandes es un problema de larga data. Algunos expertos de la industria creen que los modelos de lenguaje generativo están diseñados para parecerse más al pensamiento literal que al pensamiento numérico. Sin embargo, el entrenamiento de corpus dirigido puede mejorar gradualmente la capacidad del modelo para responder preguntas científicas en el futuro.

OpenAI lanza el modelo liviano GPT-4o mini, el costo del modelo se redujo en un 99% en dos años

El 18 de julio, hora local, OpenAI lanzó un nuevo modelo grande y liviano GPT-4o mini. Según los informes, GPT-4o mini reemplazará a GPT-3.5 Turbo en el robot de preguntas y respuestas ChatGPT a partir de ahora, y los usuarios empresariales podrán acceder a GPT-4o mini a partir de la próxima semana. "Esperamos que GPT-4o mini amplíe la aplicación de la inteligencia artificial y la haga más asequible. Según un artículo en el sitio web oficial de OpenAI, el precio de entrada de GPT-4o mini es de 15 centavos (0,15 dólares)/millón de tokens". (elementos de palabras), el precio de salida es de 60 centavos (0,6 USD)/millón de tokens, un 60% más barato que GPT-3.5 Turbo. OpenAI dijo que la compañía también continuará reduciendo costos mientras mejora el rendimiento del modelo. En comparación con el modelo text-davinci-003 de 2022, el costo del GPT-4o mini se ha reducido en un 99%.

Comentario: Aunque OpenAI no ha lanzado el modelo GPT-5 de próxima generación, todavía está actualizando el modelo en función de sus capacidades existentes y continúa reduciendo el costo de los modelos grandes. Otros grandes fabricantes de modelos también promocionan este año modelos ligeros. Google lanzó el modelo liviano Gemini 1.5 Flash en mayo de este año. La serie Claude 3 lanzada por Anthropic en marzo incluye el liviano Claude 3 Haiku. Los modelos grandes con parámetros más pequeños han mostrado un gran potencial este año. La capacitación puede mejorar el rendimiento al aumentar la cantidad de datos en lugar de aumentar la cantidad de parámetros.

Seis grandes fabricantes de modelos respondieron al problema de las deficientes capacidades digitales de los modelos grandes

Los reporteros de China Business News contactaron y entrevistaron recientemente a varios grandes fabricantes de modelos, incluidos Alibaba Tongyi, Tencent Hunyuan Team, Dark Side of the Moon Kimi, MiniMax Conch, Xueersi Jiuzhang, NetEase Youdao, etc. Durante la entrevista, respondieron preguntas importantes. Problema de modelos matemáticos deficientes. Wang Xiaoming, gerente de producto del Laboratorio Alibaba Tongyi, dijo que problemas similares son problemas comunes de cálculo matemático y razonamiento lógico, y también son casos que los desarrolladores a menudo prueban durante el proceso de entrenamiento y uso de modelos. Los modelos grandes pueden responder "correcto" o ". mal" "En realidad es una cuestión de probabilidad. El equipo Hunyuan de Tencent afirmó que el modelo grande en sí es un modelo probabilístico y que es difícil permitirle resolver de manera estable tales cálculos numéricos o problemas de comparación en diversas circunstancias.

Comentario: "¿Cuál es más grande, 9.11 o 9.9?" No es difícil para los humanos, pero para los modelos grandes, no es necesariamente una pregunta fácil de responder. A juzgar por las respuestas completas, las opiniones mencionadas por los responsables relevantes de los grandes fabricantes de modelos incluyen que los modelos grandes aún no controlan con precisión las reglas de cálculo o comparación entre números. Al mismo tiempo, la exploración humana de las capacidades de los modelos grandes es insuficiente. en una etapa muy temprana. Muchos expertos de la industria también creen que en el futuro, es necesario mejorar el nivel de inteligencia del modelo básico subyacente y resolver dichos errores desde el nivel de datos de entrenamiento y herramientas externas. La solución final puede ser mejorar las capacidades de la próxima generación. modelo. El descubrimiento de estos casos ayudará a los fabricantes a comprender mejor los límites de las capacidades de los modelos grandes.

La Ley de Inteligencia Artificial entrará en vigor en toda la UE el 1 de agosto

La primera Ley de Inteligencia Artificial del mundo (Ley de IA de la UE) emitida por la Unión Europea entrará en vigor en toda la UE el 1 de agosto. Este es también el proyecto de ley más completo dirigido a la regulación de la inteligencia artificial publicado en el mundo hasta ahora. La Ley de Inteligencia Artificial de la UE también sienta las bases para una regulación global de la inteligencia artificial, con el objetivo de lograr el mismo "efecto Bruselas" que el Reglamento General de Protección de Datos (GDPR). Según el último proyecto de ley, las empresas que violen la normativa estarán sujetas a multas administrativas de hasta 35 millones de euros o el 7% de los ingresos anuales máximos, lo que sea mayor.

Comentario: La UE siempre ha estado a la vanguardia de la regulación tecnológica. La Ley de Inteligencia Artificial de la UE es la primera ley regulatoria integral de inteligencia artificial del mundo, lo que demuestra la previsión y el liderazgo de la UE en el campo de la regulación tecnológica. Sin embargo, las reglas también aumentarán los costos operativos de las empresas. You Yunting, socio de Shanghai Dabang Law Firm, dijo que desde la implementación del GDPR, los costos de las empresas, especialmente los costos de cumplimiento, han aumentado significativamente. Se espera que la Ley de Inteligencia Artificial sea la misma, lo que significa que las empresas deben invertir en nuevas regulaciones y designar personal especializado para estudiar las políticas de cumplimiento. Además, el procesamiento de notificaciones de violaciones, sistemas de divulgación pública, etc., también aumentará los costos.

Se publican los puntajes de los siete modelos principales luego de participar en el "Examen de ingreso a la universidad": solo se pueden tomar dos materias de ciencias

Anteriormente en junio, OpenCompass, el sistema de evaluación de Sinan del Laboratorio de Inteligencia Artificial de Shanghai, publicó los primeros resultados de la evaluación en papel completo del examen de ingreso a la universidad de IA, lo que muestra que los candidatos de IA podían obtener un máximo de 303 puntos en tres materias además del idioma. y matemáticas, y reprobó todas las matemáticas. El 17 de julio, OpenCompass publicó además una evaluación que amplió el alcance de las materias. El equipo probó siete grandes modelos de IA en las nueve materias del examen de ingreso a la universidad, para que puedan compararse con los puntajes de admisión del examen de ingreso a la universidad.

Si AI toma el examen de ingreso a la universidad, ¿en qué universidad puede ser admitido? La prueba OpenCompass encontró que si el modelo grande toma el examen de artes liberales, la mejor puntuación puede ser "admitida" en un libro, pero si toma el examen de ciencias, sólo puede ser "admitida" en dos libros como máximo (según (la puntuación de la provincia de Henan, que tiene el mayor número de exámenes de ingreso a la universidad este año) como referencia).

Comentario: A juzgar por la evaluación de los profesores calificados, en comparación con los candidatos humanos, el gran modelo actual todavía tiene importantes limitaciones. Después de completar la calificación, los profesores coincidieron en que, aunque el modelo grande funcionó bien en el dominio de los conocimientos básicos, todavía era insatisfactorio en términos de razonamiento lógico y aplicación flexible de los conocimientos. Específicamente, al responder preguntas subjetivas, los modelos grandes a menudo no pueden comprender completamente la raíz de la pregunta y no comprenden la dirección de los pronombres, lo que resulta en respuestas incorrectas. Al responder preguntas matemáticas, el proceso de resolución de problemas es mecánico y poco lógico. A menudo se producen problemas con la lógica espacial.

Li Feifei incuba "unicornio", la valoración de World Labs supera los mil millones de dólares

El 17 de julio, se informó que la valoración de World Labs, una startup de "inteligencia espacial" fundada por el famoso informático chino Li Feifei, había superado los mil millones de dólares. La startup utiliza principalmente tecnología de procesamiento de datos visuales similar a la humana para dotar a la IA de capacidades de razonamiento avanzadas.

Desde su creación en abril de este año, World Labs ha llevado a cabo dos rondas de financiación, con inversores que incluyen al principal inversor en tecnología Andreessen Horowitz y el fondo de inteligencia artificial Radical Ventures. Se entiende que la última ronda de financiación de la empresa puede alcanzar aproximadamente los 100 millones de dólares. Li Feifei, Andreessen Horowitz y Radical Ventures no respondieron a las solicitudes de comentarios.

Comentario: Como figura legendaria, las tendencias empresariales de Li Feifei también han atraído mucha atención de la industria. Li Feifei se convirtió en profesor titular en el Departamento de Ciencias de la Computación de Stanford a la edad de 33 años, académico de la Academia Nacional de Ingeniería a la edad de 44 años y actualmente es director del Instituto de Inteligencia Artificial Centrado en las Personas de Stanford (HAI). ). ImageNet, el logro de referencia en el campo de la visión por computadora, también fue impulsado por ella. Tiene muchos discípulos, como Andrej Karpathy, que ha trabajado en OpenAI y Tesla, y Jim Fan, que actualmente trabaja en Nvidia, etc. También son figuras influyentes en el campo de la IA.

Los gigantes fabricantes de chips y nubes de IA "captan" empresas globales de IA

Según las estadísticas de Crunchbase, una empresa de bases de datos de servicios empresariales, la financiación para nuevas empresas globales de IA en el primer semestre de este año aumentó un 24% interanual a 35.600 millones de dólares. El segundo trimestre ha sido el trimestre con el mayor número de. Inversiones en IA en los últimos años. Según estadísticas públicas de China Business News, Nvidia ha invertido o adquirido no menos de 16 empresas relacionadas con la IA este año, y la mayoría de las rondas de financiación ascendieron a más de 100 millones de dólares estadounidenses. Después de que Microsoft invirtiera en OpenAI, también participó en múltiples rondas de financiación por un total de más de 100 millones de dólares este año. Google ha desplegado ampliamente el ecosistema de IA a través de sus múltiples plataformas de inversión y ha participado en nada menos que 31 rondas de financiación. En esta ronda de auge de la inversión en IA, las figuras activas incluyen AMD, Amazon, SoftBank, etc.

Comentario: La popularidad de la IA se refleja intuitivamente en la inversión. Los estilos de inversión y las preferencias de los grandes gigantes no son exactamente los mismos. Vale la pena reflexionar: ya sean fabricantes cuyo negocio principal es el hardware de semiconductores como Nvidia y AMD, o fabricantes de nube como Microsoft, Google y Amazon, todos ellos. Espero invertir en algunas grandes empresas. Los proveedores de modelos y los proveedores de nube están más dispuestos a vincular fuertemente a las grandes empresas emergentes. Al observar las rondas de financiación más grandes de la industria este año, podemos encontrar que los modelos básicos grandes, la conducción autónoma, los datos de inteligencia artificial y los robots humanoides son los puntos más importantes.

El Reino Unido inicia una investigación antimonopolio sobre el acuerdo entre Microsoft y Inflection AI

El regulador antimonopolio británico, la Autoridad de Mercados y Competencia (CMA), declaró recientemente que ha iniciado una investigación antimonopolio formal sobre la transacción Microsoft-Inflection AI. En marzo de este año, Microsoft acordó pagar 650 millones de dólares a la startup de inteligencia artificial Inflection AI para obtener la licencia de su software de inteligencia artificial. Además, Microsoft anunció la contratación de los cofundadores de Inflection AI, Mustafa Suleyman y Karén Simonyan, así como de la mayoría de los empleados de la empresa.

Comentario: La valoración de Inflection AI es de aproximadamente 4 mil millones de dólares. Los conocedores de la industria dicen que el comportamiento de Microsoft equivale a anexar Inflection AI a un precio bajo. A diferencia de la adquisición, Inflection AI aún conserva su tecnología patentada. Además del Reino Unido, el mes pasado hubo informes de que la Comisión Federal de Comercio de Estados Unidos (FTC) también estaba revisando el acuerdo. Según los informes, la FTC ha emitido citaciones a Microsoft e Inflection AI, solicitando documentos relevantes de los últimos dos años.

La empresa de robots humanoides Zhuji Dynamics completa la financiación Serie A

El 15 de julio, China Business News se enteró de que la startup general de robots humanoides Zhuji Dynamics completó la financiación de la Serie A, liderada por China Merchants Venture Capital, la plataforma de inversión de capital privado de SAIC Group, Shangqi Capital, y los antiguos accionistas Fengrui Capital, Oasis Capital y Mingshi Capital también participaron en la inversión, y el monto del financiamiento no ha sido revelado. Anteriormente, Alibaba también invirtió en Zhuji Dynamics. Zhuji Dynamics se fundó en 2022. El fundador, Zhang Wei, es profesor titular en la Universidad de Ciencia y Tecnología del Sur. Los productos de Zhuji Dynamics incluyen robots humanoides de tamaño completo, robots cuadrúpedos, robots bípedos y soluciones relacionadas.

Comentario: Muchas empresas de robots humanoides todavía se encuentran en proceso de financiación. Este año, ha habido constantes eventos de financiación en la pista de robots humanoides. En enero de este año, Xingdong Era anunció la finalización de la financiación de la ronda ángel de más de 100 millones de yuanes. Posteriormente, Yushu Technology anunció la finalización de la financiación de la ronda ángel B2 de mil millones de yuanes, Kepler Exploration Robot completó la financiación de la ronda ángel y Galaxy Universal Robots completó la financiación ángel. Financiación redonda de 700 millones de yuanes. Los gigantes de Internet Tencent, Baidu y Alibaba han invertido en UBTECH, Zhiyuan Robot y Zhuji Dynamics respectivamente, mientras que Meituan ha invertido en Galaxy Universal Robots y Yushu Robot. Una vez que las empresas de robots humanoides hayan recaudado fondos, el siguiente paso es cómo implementar la producción en masa.

NVIDIA y Mistral AI lanzan el modelo grande Mistral-NeMo

Según noticias del 19 de julio, NVIDIA y la startup francesa Mistral AI lanzaron el modelo de lenguaje grande Mistral-NeMo AI, que tiene 12 mil millones de parámetros y una ventana de contexto (la cantidad máxima de tokens que el modelo AI puede procesar al mismo tiempo). de 128.000 tokens. El modelo grande de Mistral-NeMo AI está dirigido principalmente a entornos empresariales e implementa soluciones de inteligencia artificial sin utilizar una gran cantidad de recursos en la nube.

Comentario: Mistral AI ha completado una financiación de 600 millones de euros este año, y en la lista de inversores se encuentran Nvidia y Samsung. Microsoft también ha anunciado previamente una inversión de 15 millones de euros en Mistral AI, que se convertirá en capital en la próxima ronda de financiación de Mistral AI. Mistral AI se ha asociado con Nvidia para lanzar modelos de gran tamaño y la empresa también equilibrará y buscará la cooperación entre los principales gigantes. Nvidia se está involucrando cada vez más en el ecosistema de IA. Anteriormente, abrió el modelo de la serie Nemotron-4 340B para que los desarrolladores lo utilicen para generar datos sintéticos para entrenar modelos de lenguaje grandes.

noticias

Informe semanal de AI | El modelo grande no puede determinar cuál es más grande, 9.11 o 9.9 OpenAI lanza el modelo liviano GPT-4o mini;

Introducción

Mi información de contacto