Llama se convierte en la top model entre las grandes modelos, Zuckerberg inicia un debate: jugando al código abierto, los tiempos han cambiado

2024-07-24

Informe del corazón de la máquina

Editor: Asia Oriole, Big Pan Chicken, Du Wei

La disputa entre código abierto y código cerrado se ha prolongado durante mucho tiempo y ahora puede haber alcanzado un nuevo clímax.

Cuando se trata de modelos grandes de código abierto, la serie Llama ha sido un representante típico desde su nacimiento. Su excelente rendimiento y sus características de código abierto han mejorado enormemente la aplicabilidad y accesibilidad de la tecnología de inteligencia artificial. Cualquier investigador y desarrollador puede beneficiarse de él, ampliando la investigación y las aplicaciones.

Ahora, se lanza oficialmente Meta Llama 3.1 405B. En el blog oficial, Meta dijo: "Hasta hoy, los modelos de lenguajes grandes de código abierto se han quedado rezagados con respecto a los modelos cerrados en términos de funcionalidad y rendimiento. Ahora, estamos marcando el comienzo de una nueva era liderada por el código abierto".

Al mismo tiempo, el fundador y director ejecutivo de Meta, Zuckerberg, escribió personalmente un largo artículo explicando la importancia del código abierto para todos los desarrolladores, para Meta y para el mundo. Dijo que el código abierto es una condición necesaria para el desarrollo positivo de la IA. Tomando como ejemplo el desarrollo de Unix y Linux, la IA de código abierto será más propicia para la innovación, la protección de datos y la rentabilidad.

También cree que el modelo Llama de código abierto puede establecer un ecosistema completo para asegurar el progreso tecnológico y no perder ventajas por la competencia. Meta tiene una historia exitosa de código abierto. A través de modelos de inteligencia artificial de código abierto, Zuckerberg espera promover la igualdad y la aplicación segura de la tecnología global.

Enlace original: https://about.fb.com/news/2024/07/open-source-ai-is-the-path-forward/

El siguiente es el contenido original:

Zuckerberg inyecta genes de código abierto en Meta

En los primeros días de la informática de alto rendimiento, las principales empresas de tecnología invirtieron mucho en el desarrollo de sus propias versiones de código cerrado de Unix. En aquel momento era difícil imaginar otra forma de desarrollar un software tan avanzado.

Sin embargo, Linux de código abierto se hizo popular gradualmente: inicialmente porque permitía a los desarrolladores modificar libremente el código y era más asequible, pero luego se volvió más avanzado, más seguro y tenía un ecosistema más amplio que cualquier Unix de código cerrado, admitiendo más funciones. Hoy en día, Linux es la base estándar de la industria para la computación en la nube y el sistema operativo que ejecuta la mayoría de los dispositivos móviles, y todos se benefician de sus productos superiores.

Creo que el desarrollo de la inteligencia artificial seguirá una trayectoria similar.Hoy en día, algunas empresas de tecnología están desarrollando modelos líderes de código cerrado, pero el código abierto está cerrando rápidamente la brecha.

El año pasado, el Llama 2 sólo era comparable a un modelo de generación anterior. Y este año, Llama 3 ya está compitiendo o incluso por delante de los modelos líderes de la industria en algunas áreas. A partir del próximo año, esperamos que los futuros modelos Llama sean los modelos grandes más avanzados de la industria. Llama también ha liderado el camino en apertura, modificabilidad y rentabilidad.

Hoy estamos dando el siguiente paso: hacer de la IA de código abierto el estándar de la industria. Lanzamos el primer modelo de IA de código abierto de vanguardia, Llama 3.1 405B, así como versiones mejoradas de los modelos Llama 3.1 70B y 8B. En comparación con los modelos de código cerrado, estos modelos de código abierto son significativamente más rentables, especialmente la naturaleza de código abierto del modelo 405B, lo que lo convierte en la mejor opción para ajustar y destilar modelos pequeños.

Además de lanzar estos modelos, también estamos trabajando con varias empresas para expandir el ecosistema más amplio. Amazon, Databricks y Nvidia están lanzando conjuntos completos de servicios para permitir a los desarrolladores ajustar y sintetizar sus propios modelos. Innovadores como Groq han creado servicios de inferencia de bajo costo y baja latencia para todos los modelos nuevos.

Estos modelos estarán disponibles en todas las principales plataformas en la nube, incluidas AWS, Azure, Google, Oracle y otras. Scale.AI, Dell, Deloitte y otros ya están listos para ayudar a las empresas a adoptar Llama y entrenar modelos personalizados utilizando sus propios datos. A medida que la comunidad crece y más empresas desarrollan nuevos servicios, juntos podemos hacer de Llama el estándar de la industria y llevar los beneficios de la IA a todos.

Meta está comprometido con la IA de código abierto. Estas son las razones por las que creo que el código abierto es la mejor plataforma de desarrollo, por qué Llama de código abierto es bueno para Meta y por qué la IA de código abierto es buena para el mundo y existirá durante mucho tiempo. .

IA de código abierto para desarrolladores

Cuando hablo con desarrolladores, directores ejecutivos y funcionarios gubernamentales de todo el mundo, normalmente escucho algunos temas:

Necesitamos entrenar, perfeccionar y destilar nuestros propios modelos. Cada organización tiene diferentes necesidades que se satisfacen mejor mediante el uso de modelos entrenados o ajustados a diferentes escalas y con datos específicos. Las tareas en el dispositivo y las tareas de clasificación requieren modelos pequeños, mientras que las tareas más complejas requieren modelos grandes. Ahora puede tomar modelos Llama de última generación, continuar entrenándolos con sus propios datos y luego reducirlos al tamaño de modelo que mejor se adapte a sus necesidades, sin que nosotros ni nadie más vea sus datos.
Necesitamos controlar nuestro propio destino y no estar "encerrados" por proveedores de código cerrado. Muchas organizaciones no quieren depender de un modelo que no pueden ejecutar y controlar por sí mismas. No quieren que los proveedores de modelos de código cerrado puedan cambiar el modelo, cambiar los términos de uso o incluso detener el servicio por completo. Tampoco quieren quedar atrapados en una única plataforma en la nube con derechos exclusivos sobre sus modelos. El código abierto permite un amplio ecosistema de cadenas de herramientas compatibles entre las que puede cambiar fácilmente.
Necesitamos proteger nuestros datos. Muchas organizaciones manejan datos confidenciales que deben protegerse y no pueden enviarse a un modelo de código cerrado a través de API en la nube. Algunas organizaciones simplemente no confían sus datos a los proveedores de modelos de código cerrado. El código abierto resuelve estos problemas porque le permite ejecutar el modelo en cualquier lugar que desee. Es bien sabido que el software de código abierto es más seguro porque el proceso de desarrollo es más transparente.
Necesitamos un modelo que sea eficiente y económico.Los desarrolladores pueden ejecutar Llama 3.1 405B en su propia infraestructura para realizar inferencias a aproximadamente el 50% del costo de usar modelos de código cerrado (como GPT-4), adecuados para tareas de inferencia fuera de línea y del lado del usuario.
Queremos invertir en ecosistemas que se conviertan en el estándar a largo plazo.Muchos ven que el código abierto evoluciona más rápido que los modelos cerrados y quieren construir sus sistemas sobre una arquitectura que proporcione las mayores ventajas a largo plazo.

IA de código abierto para Meta

El modelo de negocio de Meta es crear las mejores experiencias y servicios para las personas. Para lograrlo, debemos asegurarnos de tener siempre acceso a la mejor tecnología y no quedar atrapados en un ecosistema cerrado de competidores para que no puedan limitar lo que desarrollamos.

Quiero compartir una experiencia importante: aunque Apple nos permite crear contenido en su plataforma, todavía estamos limitados en lo que respecta a la creación de servicios. Ya sean los impuestos que imponen a los desarrolladores, las reglas arbitrarias que imponen o toda la innovación de productos que impiden, está claro que si podemos crear las mejores versiones de nuestros productos y los competidores no pueden limitar lo que creamos, Meta y muchos otros las empresas podrán brindar mejores servicios a las personas. A nivel filosófico, esta es una gran razón por la que creo firmemente en la construcción de un ecosistema abierto para la próxima generación de computadoras en las áreas de IA y AR/VR.

La gente a menudo me pregunta si me preocupa perder la ventaja técnica del código abierto de Llama, pero creo que esto pasa por alto el panorama general por varias razones:

Primero, para garantizar que podamos mantener el liderazgo tecnológico a largo plazo y no quedar atrapados en un ecosistema de código cerrado, Llama debe evolucionar hacia un ecosistema completo que incluya herramientas, mejoras de eficiencia, optimizaciones de hardware y otras integraciones. Si nuestra empresa fuera la única que utilizara Llama, el ecosistema no crecería y no estaríamos mejor que con las variantes de código cerrado de Unix.

En segundo lugar, espero que el desarrollo de la IA siga siendo altamente competitivo, lo que significa que abrir el código fuente de un modelo en un momento dado no nos cuesta una gran ventaja en la competencia contra el siguiente mejor modelo.El camino de Llama para convertirse en un estándar de la industria es permanecer competitivo, eficiente y abierto generación tras generación.

En tercer lugar, una diferencia clave entre Meta y los proveedores de modelos de código cerrado es que vender acceso a modelos de IA no es nuestro modelo de negocio. Esto significa que hacer pública Llama no afectará nuestros ingresos, sostenibilidad o capacidad de invertir en investigación, mientras que los proveedores de código cerrado sí lo harían. (Esta es una de las razones por las que algunos proveedores de código cerrado han estado presionando a los administradores públicos contra el código abierto).

Finalmente, Meta tiene una gran experiencia exitosa con proyectos de código abierto. Hemos ahorrado miles de millones de dólares al compartir nuestros diseños de servidores, redes y centros de datos con Open Compute Project y estandarizar la cadena de suministro. Al abrir herramientas líderes como PyTorch, React y más, nos beneficiamos enormemente de la innovación en el ecosistema. Este enfoque ha sido extremadamente eficaz durante mucho tiempo.

IA de código abierto para el mundo

Creo que el código abierto es necesario para el futuro de la IA. La IA tiene el potencial de aumentar la productividad, la creatividad y la calidad de vida humanas más que cualquier otra tecnología moderna, y de hacer avanzar la investigación médica y científica al tiempo que acelera el crecimiento económico.El código abierto garantizará que más personas en todo el mundo puedan obtener beneficios y oportunidades del desarrollo de la IA, que el poder no se concentre en manos de unas pocas empresas y que la tecnología pueda implementarse de manera más uniforme y segura en toda la sociedad.

Existe un debate en curso sobre la seguridad de los modelos de IA de código abierto. Mi punto es que la IA de código abierto será más segura que las alternativas. Creo que los gobiernos eventualmente llegarán a la conclusión de que apoyan el código abierto porque hará que el mundo sea más próspero y seguro.

En el marco de seguridad que entiendo, debemos protegernos contra dos tipos de daños: no intencionales e intencionales.

El daño involuntario se refiere a la posibilidad de que un sistema de IA pueda causar daño involuntariamente mientras está en funcionamiento. Por ejemplo, los modelos modernos de IA pueden dar consejos de salud incorrectos sin darse cuenta. O, en escenarios futuros, existe la preocupación de que los modelos puedan replicarse a sí mismos sin darse cuenta o optimizar excesivamente sus objetivos, en detrimento de los humanos.
El daño intencional se produce cuando los malos actores utilizan un modelo de IA con la intención de causar daño.

Vale la pena señalar que el daño involuntario cubre la mayoría de las preocupaciones que la gente tiene sobre la IA, desde el impacto de los sistemas de IA en miles de millones de usuarios hasta la mayoría de los escenarios de ciencia ficción verdaderamente catastróficos. En este sentido, la seguridad que ofrece el código abierto es aún más significativa porque el sistema es más transparente y puede ser examinado ampliamente.

Históricamente, el software de código abierto ha sido más seguro por este motivo. Asimismo, utilizar Llama y sus sistemas de seguridad, como Llama Guard, puede ser más seguro y confiable que un modelo de código cerrado. Como resultado, la mayoría de las discusiones sobre la seguridad de la IA de código abierto se centran en el daño intencional.

Nuestro proceso de seguridad incluye pruebas rigurosas y evaluaciones del equipo rojo para verificar si nuestros modelos tienen el potencial de causar daños materiales, con el objetivo de mitigar los riesgos antes de su lanzamiento. Dado que estos modelos son de código abierto, cualquiera puede probarlos por sí mismo. Debemos tener en cuenta que estos modelos se entrenan con información que ya está disponible en Internet, por lo que al considerar el daño, el punto de partida debe ser si el modelo puede causar más daño que la información obtenida rápidamente de Google u otros resultados de búsqueda.

Sería útil razonar sobre el daño intencional al distinguir lo que pueden hacer los actores individuales o de pequeña escala de lo que pueden hacer los actores de gran escala con vastos recursos, como los Estados.

En algún momento en el futuro, actores maliciosos individuales podrían aprovechar la inteligencia de los modelos de IA para crear nuevos tipos de daño a partir de información que ya está disponible en Internet. En este punto, el equilibrio de poder es fundamental para la seguridad de la IA.

Creo que sería mejor vivir en un mundo donde la IA esté ampliamente implementada, permitiendo a los grandes actores contrarrestar a los pequeños actores maliciosos. Así es también como gestionamos la seguridad en las redes sociales, con sistemas de IA más potentes que identifican y bloquean a actores menos sofisticados que a menudo utilizan sistemas de IA de menor escala.

En términos más generales, las grandes instituciones contribuirán a la seguridad y la estabilidad de la sociedad cuando implementen IA a escala. Mientras todos tengan acceso a un modelo generacional, los gobiernos y las instituciones con más recursos informáticos podrán contrarrestar a los actores maliciosos con menos recursos informáticos.

Al considerar oportunidades futuras, recuerde que la mayoría de las principales empresas de tecnología e investigación científica de la actualidad se basan en software de código abierto. Si invertimos juntos en IA de código abierto, la próxima generación de empresas y de investigación tendrá acceso a ella. Esto incluye empresas emergentes que recién están comenzando, así como personas en universidades y países que tal vez no tengan los recursos para desarrollar SOTA AI desde cero.

En conjunto, la IA de código abierto representa el mayor uso global posible de esta tecnología para crear oportunidades económicas y seguridad para todos.

La cooperación es estable y el código abierto tiene gran alcance.

En modelos Llama anteriores, Meta lanzó estos modelos para su propio desarrollo sin centrarse en construir un ecosistema más amplio. Para este lanzamiento, adoptamos un enfoque diferente. Estamos formando equipos internamente para que Llama esté disponible para tantos desarrolladores y socios como sea posible, y estamos creando asociaciones activamente para que más empresas del ecosistema puedan ofrecer capacidades únicas a sus clientes.

Creo que el lanzamiento de Llama 3.1 será un punto de inflexión en la industria y la mayoría de los desarrolladores comenzarán a utilizar tecnología de código abierto, y predigo que este enfoque comenzará con nuestro código abierto.

Espero que podamos trabajar juntos para llevar los beneficios de la IA al mundo.

Puedes acceder a estos modelos ahora en llama.meta.com.

Mark Zuckerberg

noticias

Llama se convierte en la top model entre las grandes modelos, Zuckerberg inicia un debate: jugando al código abierto, los tiempos han cambiado

Introducción

Mi informacion de contacto