noticias

Youdi Robot aumenta el capital a 350 millones; se rumorea que el autor de ResNet, Zhang Xiangyu, se unirá a la investigación y el desarrollo de OpenAI;

2024-08-06

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

Noticias financieras de hoy

La startup de chips de inteligencia artificial Groq recauda 640 millones de dólares en financiación para desafiar a Nvidia

Groq, una startup que desarrolla chips para ejecutar modelos de IA generativa más rápido que los procesadores tradicionales, dijo el lunes que había recaudado 640 millones de dólares en una nueva ronda de financiación liderada por Blackrock. También participaron Neuberger Berman, Type One Ventures, Cisco, KDDI y Samsung Catalyst Fund.

La financiación eleva la financiación total de Groq a más de mil millones de dólares y eleva la valoración de la empresa a 2.800 millones de dólares, lo que supone una gran victoria para Groq, que inicialmente esperaba conseguir una valoración ligeramente inferior de 2.500 millones de dólares.

Yann LeCun, el científico jefe de inteligencia artificial de Meta, se desempeñará como asesor técnico de Groq, y Stuart Pann, ex director del negocio de fundición de Intel y ex CIO de HP, se unirá a la startup como director de operaciones.

Youdi Robot se transformó en sociedad anónima y aumentó su capital hasta los 350 millones

Youdi Robot (Wuxi) Co., Ltd. ha experimentado cambios industriales y comerciales. El tipo de entidad de mercado ha pasado de ser una sociedad de responsabilidad limitada (con inversiones de Hong Kong, Macao y Taiwán, no unipersonal) a una sociedad de responsabilidad limitada. (con inversiones de Hong Kong, Macao y Taiwán, que no cotiza en bolsa), y su nombre se cambió a Youdi Robot (Wuxi) Co., Ltd., y su capital registrado aumentó de aproximadamente 17.079 millones de RMB a 350 millones de RMB. Según el sitio web oficial, Youdi Technology se centra en la investigación, el desarrollo y la comercialización aplicados de tecnologías centrales para robots de reparto.

La startup de robótica DELIVERS.AI está valorada en 36 millones de dólares tras una nueva ronda de financiación

La plataforma de movilidad autónoma de DELIVERS.AI utiliza vehículos y robots de reparto en carretera avanzados, impulsados ​​por IA y de bajas emisiones, diseñados para hacer que la logística de última milla sea asequible y sostenible.

DELIVERS.AI ha sido valorado en 36 millones de dólares y ha levantado una nueva ronda de financiación, con un monto no revelado. La empresa con sede en Warwick, Reino Unido, recibió financiación de Japan Post Capital, el Fondo de Desarrollo de Turquía, Propulsion Capital de Bulgaria y la Universidad Técnica de Estambul. Los inversores anteriores incluyen Driventure, Arz Portföy, StartupFON, Plug and Play Ventures, Inveo Ventures, StartersHUB y Kalyon Ventures.

La empresa de joyería impulsada por IA Stepin recibe decenas de millones de yuanes en financiación de ronda ángel

Stepin es una marca de joyería transfronteriza que se centra en el comercio electrónico transfronterizo de joyería con IA. Aprovecha la tecnología de IA y las ventajas de la cadena de suministro de China para lograr un nuevo lanzamiento rápido y un modelo de alta rotación de "devoluciones rápidas para pedidos pequeños". Stepin completó una ronda de financiación ángel de 10 millones de yuanes, liderada por Xinyue Capital y Jiujiu Capital. Otras instituciones industriales e inversores ángeles participaron en la inversión de seguimiento. Inspur Capital actuó como asesor financiero exclusivo. Actualmente, la aplicación de IA dentro de Stepin es principalmente la generalización creativa y la generación de modelos 3D relativamente rudimentarios para que los diseñadores los ajusten. (36 criptón)

(Bienvenido a agregar WeChatAlyanxishe2, obtenga más información sobre AIGC y la financiación, y charle sobre nuevos productos de IA con amigos de ideas afines)

Los rumores de las grandes fábricas de hoy

Se rumorea que el autor de ResNet, Zhang Xiangyu, se une a Step Star

Noticias de Qubit, Zhang Xiangyu, un experto en inteligencia artificial posterior a los 90, se unió a Step Star. Es uno de los cuatro autores de ResNet, el primer estudiante de doctorado en aprendizaje profundo de Sun Jian y el ganador del Future Science Award. Zhang Xiangyu recibió una licenciatura en ingeniería de software de la Universidad Xi'an Jiaotong y colaboró ​​​​con Sun Jian, He Kaiming y Ren Shaoqing en Microsoft Research Asia para completar ResNet. El artículo ganó el premio CVPR Best Paper Award en 2016 y Future Research. Premio en 2023. Premio Científico de Matemáticas e Informática.

Además de Zhang Xiangyu, Step Star también reclutó a otros dos expertos de Wanyin, Tencent Yu Gang y MSRA Duan Nan. Yu Gang es un estudiante universitario de la Universidad de Shandong, una maestría de la Universidad Jiao Tong de Shanghai y un doctorado de la Universidad Tecnológica de Nanyang. Una vez realizó una pasantía en Microsoft Research y completó una serie de resultados de investigación mientras trabajaba en Megvii. Duan Nan es investigador principal senior en MSRA y se dedica principalmente al procesamiento del lenguaje natural y otras investigaciones. Ha trabajado en MSRA durante 17 años y 9 meses. Los resultados de su investigación se han aplicado a varios productos de inteligencia artificial de Microsoft.

OpenAI admite que está desarrollando la marca de agua de texto ChatGPT, pero enfrenta desafíos

OpenAI ha desarrollado una herramienta que puede reconocer texto generado por ChatGPT con alta precisión, pero aún no se ha lanzado. OpenAI respondió a esto, admitiendo que está estudiando la tecnología de marcas de agua de texto, pero dijo que esta tecnología todavía tiene muchos desafíos.

OpenAI prevé tejer una “huella digital” invisible (una marca de agua de texto) entre líneas ajustando sutilmente las opciones de palabras en el texto generado por ChatGPT. La sutileza de este diseño es que en el futuro se podrán utilizar herramientas específicas para identificar y verificar fácilmente la fuente original del texto, abriendo nuevos caminos para la protección de los derechos de autor y la trazabilidad del contenido. La marca de agua de texto es sólo una parte de la matriz de soluciones diversificadas de OpenAI. También están estudiando la tecnología de clasificación y las estrategias de metadatos en paralelo, con el objetivo de construir un sistema integral de autenticación de identidad de texto de múltiples niveles para garantizar que la fuente de información sea claramente rastreable.

La figura muestra la segunda generación de nuevos robots humanoides, con un sabor más humano y un hardware más potente.

Figure lanzó el avance de la Figura 02 y declaró que lanzará oficialmente el producto el 7 de agosto, hora de Beijing. En comparación con la demostración en video de la Figura 01 equipada con Open AI GPT4, el enfoque de esta demostración está en el hardware y se espera que las capacidades del hardware mejoren enormemente. El fundador y director ejecutivo, Brett Adcock, habló con confianza: la Figura 02 es el mejor robot humanoide del planeta.

El gran recorte de precio de la API Google Gemini es la mitad del precio del GPT-4o mini

El costo de entrada del modelo Gemini 1.5 Flash se redujo directamente a la mitad, cayendo aproximadamente un 85%, seguido por el costo de salida, que se redujo aproximadamente un 80%. Esto significa que el costo de usar la API Gemini es ahora casi un 50% menor que el de su principal competidor, GPT-4o mini. El nuevo precio de Gemini Flash tiene un costo de entrada de solo $0,075 por millón de tokens y un costo de salida de solo $0,3. Gemini 1.5 Flash y Gemini 1.5 Pro ahora admiten más de 100 idiomas y Google ha introducido tecnologías innovadoras como el almacenamiento en caché de contexto y las API por lotes.

Baichuan Intelligent y la Universidad Renmin de China establecieron un "laboratorio conjunto de modelos grandes"

La Universidad Renmin de China y Baichuan Intelligence establecieron conjuntamente el "Laboratorio conjunto de modelos grandes" para promover la innovación y el desarrollo de tecnología de modelos grandes. El establecimiento del laboratorio conjunto marca que las dos partes llevarán a cabo una cooperación profunda en campos de tecnología de vanguardia, como el preentrenamiento de modelos grandes, la alineación, la mejora de la recuperación, los agentes y la multimodalidad. La Universidad Renmin de China aprovechará sus talentos y ventajas tecnológicas en la investigación de modelos a gran escala y los combinará con la fortaleza de Baichuan Intelligent en ingeniería e investigación y desarrollo de productos para promover conjuntamente la investigación y aplicación de tecnologías relacionadas.

Alibaba lanza Tora, la "versión de Sora con trayectoria controlable" para hacer que la generación de vídeo sea más consistente con las leyes físicas

Tora es la primera arquitectura DiT orientada a trayectorias que integra simultáneamente condiciones textuales, visuales y de trayectoria para generar videos. El diseño de Tora encaja perfectamente con la escalabilidad de DiT, permitiendo un control preciso del contenido de vídeo con diferentes duraciones, relaciones de aspecto y resoluciones. Amplios experimentos han demostrado que Tora destaca por lograr una alta fidelidad de movimiento y al mismo tiempo simular en detalle el movimiento del mundo físico.

Se dice que Meta está en conversaciones con estrellas de Hollywood sobre proyectos de voz de IA y proporcionará millones de dólares para obtener la licencia.

Según informes de los medios que citan fuentes, las negociaciones entre Meta y los representantes de algunos actores han experimentado múltiples interrupciones y reinicios porque las dos partes no pudieron ponerse de acuerdo sobre los términos de uso de las voces de los actores. Meta está acelerando las negociaciones para tener tiempo suficiente para desarrollar herramientas de inteligencia artificial, que espera lanzar en la conferencia Connect en septiembre. No está claro cómo Meta usará estas voces, probablemente para actuar como un asistente digital. Por ejemplo, los usuarios pueden chatear con un chatbot que tiene la voz de Awkwafina.

hoyNoticias de producto

Búsqueda de productosLista Caliente, Arquitecto Avatar

Avatar Architect es un sistema que combina inteligencia artificial y Notion. Está diseñado para ayudar a emprendedores, especialistas en marketing y desarrolladores de productos a mejorar las estrategias de marketing y el rendimiento de ventas a través de una comprensión profunda de los grupos de clientes objetivo. También proporciona una serie de herramientas y guías para construir. y Gestionar retratos de clientes.

La fortaleza de Avatar Architect radica en su eficiencia impulsada por la inteligencia artificial, su conocimiento profundo de los mercados objetivo y la información detallada de los clientes que guía el desarrollo de productos. El sistema es adecuado para empresarios independientes, especialistas en marketing y desarrolladores de productos, especialmente aquellos que desean comprender profundamente a sus clientes y mejorar sus estrategias de marketing. Los usuarios pueden personalizar la funcionalidad del sistema según sus necesidades comerciales y los datos de los clientes deben actualizarse periódicamente para obtener mejores resultados.

https://gcproductivity.gumroad.com/l/avatararchitect/ProductHunt?ref=producthunt

Recomendaciones de desarrolladores

1. Consejos sencillos para crear fácilmente código de programa pequeño LlamaCoder

LlamaCoder es una plataforma basada en el modelo Llama3.1405B. A través de sus poderosas capacidades de automatización, los desarrolladores pueden generar rápidamente aplicaciones y componentes completos de React simplemente proporcionando instrucciones simples. La plataforma utiliza una pila de tecnología moderna, que incluye tecnologías populares como Next.js y Tailwind, para proporcionar una interfaz hermosa y fácil de usar. El diseño funcional de LlamaCoder tiene en cuenta todos los aspectos, incluido el uso de código sandbox, la integración de Helicone y herramientas Plausible para mejorar la eficiencia del desarrollo y la optimización del producto. La barrera de entrada es baja. Los usuarios solo necesitan clonar la base del código y configurar la clave API para iniciar el proyecto mediante el comando npm. Ahora es de código abierto.

https://llamacoder.together.ai/

2.Proyecto de base de conocimientos personales de supermemoria

El proyecto permite a los usuarios guardar información en línea, como páginas web, tweets y notas, y utilizar sus capacidades de inteligencia artificial integradas para realizar búsquedas y preguntas eficientes. Organice la información en forma de lienzo bidimensional para ayudar a los usuarios a comprender y relacionar mejor los puntos de conocimiento. Proporciona una función de escritura asistida por IA basada en datos guardados. Admite la integración con Telegram, Twitter y otras plataformas.

github https://github.com/supermemoryai/supermemory

Sitio web https://supermemory.ai/onboarding

Atención especial

Jim Fan: La amplificación de los datos de los robots es una cuestión clave para resolver el desarrollo de la tecnología robótica

Jim Fan, científico investigador senior de NVIDIA, jefe de inteligencia incorporada y jefe de Embodied AI (GEAR Labs), publicó el último progreso del Proyecto GR00T, proponiendo un método sistemático para amplificar los datos robóticos establecidos a través de humanos en robots reales. combinado con la tecnología de simulación, expande el volumen de datos 1000 veces o más para resolver el problema del cuello de botella de datos en robótica.

Utilice la tecnología Apple Vision Pro para lograr el control en primera persona de un robot humanoide por parte de un operador humano. Vision Pro es capaz de analizar los gestos de la mano humana en tiempo real y asignarlos a la mano del robot, lo que hace que el operador se sienta como si estuviera inmerso en otro cuerpo y, aunque la operación remota es lenta, se puede recopilar una pequeña cantidad de datos de alta calidad. .

Utilice RoboCasa, un marco de simulación generativa de código abierto, para extender datos de demostración únicos del mundo real a una variedad de entornos cambiando la apariencia visual y el diseño del entorno, generando así grandes cantidades de datos de demostración diversos. Esto permite ampliar los datos de una cocina física a un número ilimitado de escenas de cocina simuladas.

La tecnología MimicGen se aplica para generar una gran cantidad de nuevas trayectorias de acción basadas en datos de demostración humana sin procesar y filtrar los intentos fallidos, lo que da como resultado un conjunto de datos más grande y rico.

A través de este método, a partir de una trayectoria humana, RoboCasa puede generar datos de N efectos visuales diferentes, y MimicGen los mejora aún más a datos de NxM acciones diferentes. Este enfoque resuelve el problema de la costosa recopilación de datos humanos a expensas de la potencia informática mediante simulaciones aceleradas por GPU, rompiendo las barreras tradicionales de recopilación de datos limitadas al mundo atómico.

https://x.com/DrJimFan/status/1818302152982343983

Estén atentos a las últimas noticias mañana

¡La Oficina de Inteligencia de IA está reclutando socios de inteligencia para recopilar pistas valiosas exclusivas! Si puede proporcionar información sobre los últimos logros de la IA, información privilegiada de la industria y productos únicos, agregue su cuenta operativa de WeChat:Alyanxishe2Tenga en cuenta las posiciones de la industria.

Google adquiere CharacterAI por más de 2.500 millones de dólares; el chip Nvidia AI está expuesto a importantes defectos de diseño y decenas de miles de millones de dólares en pedidos se verán afectados 丨AI Intelligence Bureau

Eston Robot recibió un aumento de capital de 450 millones de yuanes; el experto en inteligencia artificial Zhou Zhihua fue nombrado vicepresidente de la Universidad de Nanjing. ¡También se pueden publicar artículos!La plataforma impresa en línea de Stanford es popular 丨 AI Intelligence Agency

Stardust Intelligence ha recibido decenas de millones de dólares en financiación para centrarse en la comercialización de robots de IA; OpenAI abre parcialmente la voz GPT-4o y se ampliará a todos los usuarios de pago este otoño 丨AI Intelligence Bureau