noticias

Última entrevista con el fundador de DeepMind: AGI llegará dentro de diez años y remodelará el clima de la energía médica

2024-08-19

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

Tao Le se originó en el templo de Aofei.

Qubits | Cuenta pública QbitAI

¿Cuándo se implementará AGI? GoogleMente profunda El director ejecutivo Hassabis predijo en la última entrevista:

diez años.

siAGINo me sorprendería que apareciera en la próxima década.

En esta entrevista, Hassabis habló sobre las tendencias de desarrollo de la IA.

Hay algunos temas que interesan a todos, como por ejemplo:

Puede que la IA esté sobrevalorada en el corto plazo, pero su potencial y su impacto siguen subestimados en el largo plazo.

Como “súper equipo” de Google, Google DeepMind necesita encontrar un equilibrio entre los intereses comerciales y la investigación científica.

El código abierto es importante para el progreso tecnológico, pero cuando se encuentra con tecnología que puede ser mal utilizada, es posible que desee esperar un año antes de convertirla en código abierto para evaluar y limitar el uso indebido.

Para contenido más específico, consulte la versión de texto a continuación ~

El “problema de implementación” de la IA temprana

Q: Para la entrevista de hoy, invité a Hassabis, cofundador de DeepMind y actual director ejecutivo de Google DeepMind.

hassabis: Gracias, estoy muy feliz de poder participar en su entrevista. Anteriormente analizamos cómo se pueden utilizar los conceptos y el lenguaje en el mundo real, como en entornos simulados o como robots que poseen inteligencia real que puede ser necesaria para comprender el mundo que nos rodea.

Sin embargo, hay que reconocer que estos sistemas aún no se encuentran en ese nivel ideal, cometiendo muchos errores y no construyendo realmente un modelo completo del mundo. Aún así, han logrado avances mucho más allá de nuestras expectativas sólo a través del aprendizaje de idiomas.

Q: Sí, la última vez discutimos mucho sobre cómo implementar el lenguaje en el mundo real. ¿Pero puedes explicar brevemente qué significa "aterrizaje"? Por si acaso los amigos que ven nuestra entrevista por primera vez no lo entienden.

hassabis"aterrizaje"Este concepto,Con origen en sistemas de IA clásicos construidos en instituciones académicas como el MIT en las décadas de 1980 y 1990.La mayoría de estos sistemas son enormes sistemas lógicos, que pueden imaginarse como bases de datos gigantes que contienen muchas palabras interrelacionadas.

El problema, sin embargo, es que aunque se pueden encontrar declaraciones como "Los perros tienen cuatro patas" en la base de datos, cuando el sistema se enfrenta a una foto de un perro real, no puede asociar esos píxeles con los símbolos de la base de datos. Este es el llamado "problema del aterrizaje".

En otras palabras, el sistema tiene representaciones simbólicas o abstractas pero no puede comprender el significado concreto de estas representaciones en el mundo real. Desde entonces, aunque la gente ha intentado solucionar este problema, nunca han podido alcanzar la perfección.

A diferencia de los sistemas del pasado, los sistemas de IA actuales aprenden directamente de los datos y establecen conexiones entre los datos y el mundo real desde el principio.

Curiosamente, incluso si estos sistemas aprenden inicialmente sólo basándose en el lenguaje, en teoría deberían carecer de mucha información necesaria para "despegar" porque no están conectados a simuladores, robots u otras formas de entrada del mundo real, sino sólo Es aprender en el espacio del lenguaje.

Sin embargo, sorprendentemente estos sistemas todavía son capaces de inferir algunos conocimientos sobre el mundo real.

Q: Esto puede deberse a que, a medida que las personas interactúan con el sistema, le dicen al sistema qué respuestas son correctas y cuáles son incorrectas. A través de esta retroalimentación, el sistema puede recibir parte de la información del "aterrizaje", estableciendo así gradualmente una conexión con el mundo real.

hassabis: De hecho, si el sistema en versiones anteriores daba respuestas incorrectas debido a la falta de información de "aterrizaje", como responder incorrectamente a una pregunta como "¿Cómo ladra un perro?", los comentarios de las personas lo corregirían.

Esta retroalimentación se basa en nuestro propio conocimiento "implementado", por lo que, hasta cierto punto,El sistema absorbe y aprende la información de esta retroalimentación.

Exaltado a corto plazo, subestimado a largo plazo

Q: Además, también quiero preguntarle sobre la exageración de la IA. ¿Crees que nuestra situación actual, la situación actual, está poco o demasiado publicitada?

hassabis: Creo que es más bien lo último. quiero decir,A corto plazo, el revuelo ha ido demasiado lejos.

Creo que la gente dice que la IA puede hacer todo tipo de cosas, pero en realidad no es tan poderosa como dice la gente. Hay muchas nuevas empresas y capitalistas de riesgo que persiguen ideas poco realistas que no están muy maduras.

Pero, por otro lado, creo que incluso ahora sigue infravalorado o no se le presta suficiente atención. Especialmente a medida que llegamos a las etapas AGI y post-AGI, todavía siento que la gente no comprende completamente el gran cambio que supondrá y las responsabilidades que conlleva.

entonces,Creo que a corto plazo definitivamente está sobrevalorado, pero a largo plazo todavía está infravalorado.

Del Gemini multimodal al agente universal de IA de Astra

Q: Bien, ahora quiero hacer una pregunta más importante en esta entrevista ¿Cuál crees que es la diferencia entre Gemini y los modelos de lenguajes grandes lanzados por otros laboratorios?

hassabis: Nos hemos fijado un objetivo desde el principio del proyecto Gemini, que es permitirle manejar múltiples tipos de datos al mismo tiempo. Esperamos que no solo pueda comprender texto, sino también analizar sonidos, videos, imágenes, códigos, etc., básicamente todas las formas de información.

Creemos firmemente que solo permitiendo que los sistemas comprendan y procesen diversa información en el mundo real podrán comprender verdaderamente el mundo y construir un modelo mundial más preciso y completo.

En realidad, esto es una extensión del problema de "aterrizaje" que mencionamos anteriormente, pero esta vez usamos el lenguaje como base para lograrlo.

Q: ¿Entonces la "implementación" sigue siendo la clave de todo el proyecto?

hassabis: De hecho, esto es crucial.

También tenemos un objetivo final, que esCrea un asistente completo. Hemos desarrollado una herramienta llamadaAstroPrototipo del proyecto, Astro no sólo comprende sus aportaciones, sino que también percibe el contexto de su entorno.

Imagínese cuánto más poderoso sería su asistente personal o asistente digital si tuviera una comprensión más profunda del contexto de su pregunta o de la situación en la que se encuentra. Por eso, siempre creemos firmemente que este tipo de sistema será más práctico.

Para hacer esto, incorporamos funcionalidad multimodal en el sistema desde el comienzo del proyecto. En ese momento, este era el único modelo con esta característica y ahora otros modelos están tratando de ponerse al día.

QProject Astro es un agente emergente de inteligencia artificial de uso general capaz de procesar datos de video y audio.Recuerdo que en la conferencia Google I/O mostraste un ejemplo de cómo Astro ayuda a los usuarios a recordar dónde están sus gafas. Me interesan los orígenes de esta tecnología. ¿Es solo una evolución avanzada de las antiguas Google Glass?

hassabis: Google tiene una larga trayectoria en el desarrollo de dispositivos basados ​​en gafas, ya que participó alrededor de 2012. Por lo tanto, tienen una importante ventaja como pioneros en esta área. Puede ser que faltara la tecnología necesaria para que el asistente inteligente entendiera lo que estaba viendo. Pero ahora,Con este asistente digital a tu lado, podrá comprender el mundo que te rodea, se siente muy natural.

Q: Quiero rastrear los orígenes de Gemini porque se originó en dos departamentos separados dentro de la organización y fue hecho por ellos.

hassabis: De hecho, el año pasado pusimos Alphabet(empresa matriz de Google)Los dos departamentos de investigación del original.Mente profundayCerebro de Google, fusionado en un nuevo departamento, lo llamamos"Súper Departamento"

De esta manera reunimos a todos los mejores talentos de la empresa en un solo equipo y combinamos los mejores conocimientos de todas las áreas de investigación, especialmente en los modelos lingüísticos.

Hemos tenido algunos proyectos anteriores, como Trin Chilla y Gopher, que han participado en el desarrollo de modelos de lenguaje tempranos, como Palm y Lambda. Cada uno de estos modelos tiene sus propias fortalezas y debilidades, y las hemos integrado en el proyecto Gemini, que es el primer proyecto muy importante después de la fusión.

Además, hay otro punto particularmente importante, y es queIntegre todos los recursos informáticos juntos. De esta manera, podemos realizar ejecuciones de capacitación a gran escala, que en realidad reúnen toda la potencia informática.Haz que Gemini sea más poderoso y eficiente

Estos dos equipos siempre se han centrado en la vanguardia de la IA. Han colaborado mucho en investigaciones personales antes, pero es posible que no sean tan cercanos estratégicamente. Ahora el equipo combinado, lo describiría como el de Google."Sala de máquinas"

Creo que los métodos de trabajo de los dos equipos son bastante similares, sin mucha diferencia. A continuación, continuaremos fortaleciendo nuestras ventajas en la investigación básica, como pensar en el próximoTransformadorTodos queremos descubrir cómo será la arquitectura.

Hablando de eso, el Transformer anterior fue creado por Google Brain y lo combinamos con el aprendizaje por refuerzo profundo, pero creo que se necesita más innovación. Creo que, al igual que los últimos 10 años, ya sea Brain o DeepMind, seguiremos contribuyendo.

La "sala de máquinas" de Google

Q: Acabas de decir que Google DeepMind es ahora la "sala de máquinas" de Google. Esto es un gran cambio. Quiero saber si Google está apostando fuerte por ti ahora.

hassabis: Creo que sí. Creo que Google siempre ha sido clara sobre la importancia de la IA. Pichai dijo cuando asumió por primera vez como director ejecutivo:Google es una empresa que prioriza la IA

Discutimos este tema cuando asumió el cargo por primera vez. Vio el potencial de la IA como el próximo gran cambio de paradigma después de Internet móvil, y su impacto fue incluso más profundo que estos.

Pero creo que en los últimos dos años hemos empezado a comprender realmente lo que eso significa, no sólo desde una perspectiva de investigación sino también desde un producto y todo lo demás. Es un momento muy emocionante, pero creo que es la decisión correcta para nosotros reunir todo el talento y hacer todo lo posible.

Q: Desde otra perspectiva, para DeepMind, que ahora se está convirtiendo en la "sala de máquinas" de Google, ¿significa que hay que encontrar un mayor equilibrio entre la consideración de los intereses comerciales y la investigación científica pura?

hassabis: De hecho, ahora debemos considerar más los intereses comerciales, que se han convertido en parte de nuestras responsabilidades. Sin embargo, todavía quedan algunos puntos que es necesario aclarar. Continuaremos avanzando en nuestro trabajo de investigación científica y nuestra inversión en esta área sigue aumentando.

Creo,Esto es algo único que hacemos en Google DeepMindIncluso nuestros competidores ven estos resultados como beneficios generalizados de la IA.

El "código abierto" es necesario

Q: Bien, eso me lleva a mi siguiente pregunta: código abierto. Cuando la tecnología llega a manos de las masas, como dijiste, pueden suceder cosas bastante sorprendentes. Sé que DeepMind ha abierto muchos proyectos de investigación en el pasado, pero eso parece haber cambiado ahora. ¿Puedes hablar sobre tus puntos de vista sobre el código abierto?

hassabisEl código abierto es necesario y siempre hemos sido firmes defensores del código abierto y de la ciencia abierta.Como sabes, publicamos casi todos los proyectos de investigación que realizamos, incluidos proyectos como Transformer yAlfaGoHemos publicado proyectos como este en revistas importantes como Nature y Science.

AlphaFold también es de código abierto, todos estos están hechos por nosotrosElige sabiamente. Tienes razón, este enfoque funciona porque la tecnología y la ciencia pueden avanzar a mayor velocidad al compartir información. En la mayoría de los casos,El código abierto es universalmente beneficioso y así es como funciona la ciencia

Sin embargo, hay excepciones, y es cuando se trata de tecnologías de doble propósito, como AGI y la poderosa IA.

El problema es que se quiere poder habilitar todos los casos de uso benignos y que verdaderos científicos y tecnólogos puedan aprovechar y criticar estas ideas para impulsar un rápido progreso en la sociedad. Pero al mismo tiempo, la cuestión es cómo limitar a los malos actores que podrían abusar de estos sistemas.

Eso está bien ahora porque no creo que estos sistemas sean lo suficientemente poderosos, pero en dos o tres años, especialmente cuando comiences a tener sistemas que tengan comportamiento agente, podría causar daños graves.

Tenemos nuestros propios modelos Gemini de código abierto llamados Gemma, pero son modelos más pequeños y no modelos de vanguardia.

Sus capacidades siguen siendo muy útiles para los desarrolladores porque se pueden ejecutar en computadoras portátiles y porque tienen una menor cantidad de parámetros. Sus capacidades se conocen bien en esta etapa, ya que no son los últimos modelos de vanguardia.

Probablemente lo que terminaremos haciendo es que tendremos modelos de código abierto, pero estarán aproximadamente un año por detrás de los últimos modelos de vanguardia para que realmente podamos evaluar las capacidades de esos modelos en pruebas públicas con usuarios.

Un problema con el código abierto es que si algo sale mal, no puedes recuperarlo. Con un modelo propietario, si los malos comienzan a usarlo de mala manera, puedes apagarlo o incluso apagar todo el sistema en casos extremos. Pero una vez que abres algo, no puedes retirarlo. Es una puerta unidireccional.

AGI estará disponible dentro de diez años

Q: Hoy en día, los investigadores científicos desarrollan varios modelos de IA, pero quiero saber, si entramos en la etapa en la que la IA respalda toda la investigación científica, ¿todavía habrá espacio para que existan instituciones de I+D?

hassabis: Creo que todavía hay espacio. Ahora estamos en la etapa previa al surgimiento de una AGI general. Creo que esto requiere una estrecha cooperación entre la sociedad, la academia, el gobierno y los laboratorios industriales.

Realmente creo que esta es la única forma en que finalmente llegaremos allí. Si pregunta qué sucede después de AGI, probablemente eso sea lo que realmente quiera saber. AGI siempre ha sido algo que aspiro a construir porque podemos usarlo para explorar algunas de las preguntas más fundamentales sobre la naturaleza de la realidad, la física, la conciencia y más.

Q: El informático Stuart Russell me dijo una vez que estaba un poco preocupado de que una vez que alcancemos AGI, todos seamos como los aristócratas del pasado, simplemente disfrutando de una vida lujosa y sin preocupaciones, sin objetivos y sin pensar.

hassabis: Creo que el futuro va a ser muy interesante. Pero también aborda esa cuestión “infravalorada” que mencioné antes, que es la diferencia entre la exageración a corto y largo plazo. Si quieres llamarlo exageración, ciertamente está infravalorado hasta cierto punto.

Creo que el cambio en el futuro será enorme. Creo que eventualmente podremosCurar muchas enfermedades, incluso todas las enfermedades, resolver problemas energéticos y problemas climáticos.

Q: Hablando de eso, recuerdo que una vez dijiste que esperas que AGI pueda explorar los misterios del universo. ¿Crees que existen algunas posibilidades que aún no hemos imaginado, como fenómenos como los agujeros de gusano?

hassabis:ciertamente,Creo plenamente en esta posibilidad.. Realmente espero que los agujeros de gusano se hagan realidad. Me parece que todavía tenemos muchos malentendidos sobre la física y la naturaleza de la realidad.

Evidentemente, existen innumerables misterios sin resolver escondidos en la unificación de la mecánica cuántica y la gravedad, problemas del Modelo Estándar, teoría de cuerdas, etc. He tenido discusiones profundas con muchos amigos de la comunidad de la física y todos creen que hay muchas cosas en el marco teórico existente que no encajan perfectamente.

Personalmente, no soy un gran admirador de las explicaciones del multiverso, por lo que creo que sería sorprendente si pudiéramos idear nuevas teorías y probarlas con equipos a gran escala en el espacio.

La razón por la que estoy tan fascinado por la escala de tiempo y espacio de Planck es que parece representar la resolución última de la realidad, como la unidad más pequeña en la que todo se puede dividir.

Por lo tanto, creo que deberíamos realizar una exploración experimental en profundidad a este nivel, especialmente cuando tenemosCon AGI y abundantes recursos, tal vez podamos diseñar o construir dicho equipo experimental.

Q: Una vez dijiste que DeepMind es un proyecto de 20 años. ¿Hasta dónde hemos llegado ahora? ¿Sigues progresando según lo planeado?

hassabis: Sí, todavía estamos dentro del cronograma, lo que puede parecer increíble porque normalmente siempre parece que un proyecto de 20 años tardará otros 20 años en completarse. Pero hemos recorrido un largo camino.

Nuestro objetivo es lograrlo para 2030, por lo que no me sorprendería que podamos llegar allí en la próxima década.

  • Dirección del vídeo: https://www.youtube.com/watch?v=pZybROKrj2Q *