Mi información de contacto
Correo[email protected]
2024-08-17
한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina
Eric Schmidt, ex director ejecutivo de Google (Fuente de la imagen: medio)
El ex director ejecutivo de Google se retractó de sus comentarios anteriores en los que criticaba a su antiguo empleador por "no ser lo suficientemente bueno" y criticaba el trabajo remoto por arruinar a Google.
Recientemente, el ex director ejecutivo y presidente ejecutivo de Google, Eric Schmidt, dijo en un discurso en la Universidad de Stanford que Google perderá frente a empresas emergentes como OpenAI en la competencia de IA (inteligencia artificial) debido a que las políticas de oficina remota de Google no resultan en empleados. trabajando lo suficientemente duro.
"Google cree que el equilibrio entre la vida personal y laboral, salir temprano del trabajo y trabajar desde casa es más importante que ganar. Pero la razón por la que las nuevas empresas tienen éxito es porque la gente trabaja duro". Schmidt dijo sin rodeos que los empleados de Google ahora también "disfrutan" del trabajo. equilibrio de vida, pero como resultado, la empresa perdió su enfoque y perdió frente a OpenAI. El actual método de trabajo remoto de Google es el principal culpable. Los empleados piensan que volver temprano a casa para pasar tiempo con sus familias es más importante que lograr logros laborales. "Lamento ser tan directo, pero cuando te gradúas de la universidad y comienzas un negocio, entiendes que no permites que los empleados vengan a la empresa sólo un día a la semana".
Schmidt enfatizó que las nuevas empresas de inteligencia artificial pueden primero "copiar" los trabajos maduros de otras personas y luego "contratar una gran cantidad de abogados para limpiar el desorden" una vez que el producto se vuelve popular.
Sin embargo, un día después de la publicación del vídeo, Schmidt se disculpó por sus comentarios.
El 15 de agosto, Schmidt dijo en un correo electrónico al Wall Street Journal: "Cometí un error en mis comentarios sobre Google y su horario laboral, y lamento mi error".
La información pública muestra que Schmidt se desempeñó como director ejecutivo de Google de 2001 a 2011 y formó parte de la junta directiva hasta 2019. Posteriormente, Schmidt dejó la junta directiva de Alphabet, la empresa matriz de Google.
Pero a partir de ahora,Schmidt sigue siendo accionista de Alphabet y posee alrededor de 147 millones de acciones de Alphabet, casi el 1% de las acciones, por un valor aproximado de 24 mil millones de dólares. Schmidt vale 31.400 millones de dólares.
Los comentarios demasiado directos de Schmidt esta vez han sido muy controvertidos. Algunas personas lo acogieron con satisfacción, mientras que algunos internautas criticaron que la gestión de Google es el mayor problema de la empresa. Entre ellos, el sindicato de trabajadores de Alphabet publicó: La falta de ejecución es lo que frena a los empleados de Google todos los días”.
Apenas un día después de que Schmidt hiciera estos comentarios, rápidamente se disculpó públicamente y la Universidad de Stanford estableció el video relevante como un video privado.Antes de esto, el vídeo de Schmidt había sido visto más de 400.000 veces.
Vale la pena señalar que muchos empresarios estadounidenses de renombre tienen opiniones similares a las de Schmidt. Por ejemplo, el director ejecutivo de Tesla, Elon Musk, y el director ejecutivo de JPMorgan Chase, Jamie Dimon, se han quejado públicamente de las políticas de trabajo remoto. Dimon escribió una vez en su carta anual a los accionistas que los directivos de una empresa no pueden dirigir a sus equipos sentados frente a una pantalla.
"Mire a Musk, mire a TSMC. La razón por la que estas empresas tienen éxito es porque pueden reclutar empleados. Tienes que presionar a tus empleados lo suficiente para ganar. TSMC permitirá que los doctores en física trabajen en la fábrica durante el primer año. ¿Te imaginas a los estudiantes de doctorado estadounidenses yendo a la línea de montaje?", dijo Schmidt.
Además, Schmidt también compartió algunos consejos de inversión sobre Nvidia, diciendo que ha visto una tendencia clara en el mercado de valores, es decir, las grandes empresas de tecnología están planeando realizar inversiones cada vez mayores en Nvidia. "Estoy hablando con grandes empresas y me dicen que necesitan 20 mil millones de dólares, 50 mil millones de dólares, 100 mil millones de dólares, muy, muy urgentemente", añadió Schmidt, CEO de OpenAI, Sam Alter, "amigo cercano" de Sam Altman.
Schmidt cree que aunque Nvidia no será la única ganadora en el campo de la IA, no hay muchas otras opciones. En su opinión, las empresas más grandes que puedan invertir más en chips y centros de datos de Nvidia estarán tecnológicamente por delante de sus rivales más pequeños.
"Sólo hay tres modelos de última generación y la brecha entre ellos y todo lo demás parece ser cada vez mayor. Hace seis meses estaba convencido de que la brecha se estaba reduciendo, así que invertí mucho dinero en empresas más pequeñas. Ahora "No estoy tan seguro", señaló Schmidt. "Solía pensar que CUDA de NVIDIA era un lenguaje de programación estúpido, pero ahora CUDA es el foso más poderoso de NVIDIA. Todos los modelos grandes deben ejecutarse en CUDA, y solo las GPU de NVIDIA admiten CUDA. Esto es algo que otros chips no pueden superar".
Schmidt enfatizó que las empresas de tecnología dominantes a menudo tienen dificultades para adaptarse a las nuevas olas de la industria, y las ideas innovadoras y una fuerte presencia de oficinas son muy importantes para Silicon Valley.
Por lo tanto, la perspectiva de Schmidt plantea una pregunta más amplia: ¿Cómo equilibrar la necesidad de innovación con el bienestar de los empleados en la era de la IA en rápida evolución?
Las palabras del ex director ejecutivo de Google, Schmidt, pueden representar los desafíos que enfrenta toda la industria tecnológica. Con el rápido desarrollo de la tecnología de inteligencia artificial, ¿cómo encuentran las grandes empresas el equilibrio entre mantenerse competitivas y mantener la satisfacción de los empleados? No se trata sólo del éxito de la empresa, sino también de la dirección de desarrollo futuro de toda la industria.
Al cierre de esta edición, el precio de las acciones de Google-A (NASDAQ:GOOGL) subió un 1,54 % a 163,77 dólares por acción, con un valor de mercado total de 2,02 billones de dólares. Desde principios de 2024, el precio de las acciones de Google ha aumentado aproximadamente un 16%.
El siguiente es un resumen breve del discurso de Schmidt, editado y abreviado:
Moderador: Los invitados de hoy no necesitan presentación. Conocí a Eric hace unos 25 años, cuando llegó a Stanford GSB como director ejecutivo de Novell. Desde entonces, ha ocupado puestos clave en Google, desde 2001 hasta unirse a Schmidt Futures en 2017. Además, también ha participado en muchos otros proyectos, y puedes consultar la información relevante. Entonces Eric, si me permites, comenzaré con eso. En primer lugar, ¿hacia dónde cree que se dirigirá la inteligencia artificial en el corto plazo? Creo que lo defines como los próximos uno o dos años.
Schmidt: Las cosas están cambiando tan rápido que siento que cada seis meses necesito dar un nuevo discurso sobre lo que va a pasar. Tengo un grupo de estudiantes de informática aquí. ¿Alguien puede explicarle al resto de la clase qué es la "ventana de contexto de un millón de tokens"? Nómbralo y cuéntanos qué hace.
Estudiante: Básicamente, te permite indicar con un millón de fichas o un millón de palabras.
Schmidt: Entonces puedes hacer una pregunta de un millón de palabras. Antrópico son 200.000 tokens, hasta 1 millón, y así sucesivamente. Puedes imaginar que OpenAI tenga un objetivo similar. ¿Alguien aquí puede dar una definición técnica de agente de IA? De nuevo, informática.
Estudiante: El agente AI puede ser algo que se comporta de cierta manera. Podría ser llamar a algo en la web para encontrar información en su nombre. Podrían ser muchas cosas diferentes en este sentido. En un proceso suceden todo tipo de cosas.
Schmidt: Entonces, un agente es algo que realiza algún tipo de tarea. Otra definición es que es un LLM, estado y memoria. A continuación, informáticos, ¿alguno de ustedes puede definir "texto a acción"?
Estudiante: En lugar de convertir texto en más texto, deje que la IA active acciones basadas en esto.
Schmidt: Otra definición es el lenguaje Python. No quiero que un lenguaje de programación sobreviva nunca. Todo en IA se hace en Python. Acaba de surgir un nuevo lenguaje llamado Mojo, y parece que finalmente han resuelto el problema de la programación de IA, pero veremos si realmente puede sobrevivir al dominio de Python. También hay un problema técnico. ¿Por qué NVIDIA vale 2 billones de dólares mientras otras empresas tienen dificultades?
Estudiante: La respuesta técnica es que la mayor parte del código debe ejecutarse utilizando optimizaciones CUDA que actualmente solo son compatibles con las GPU de NVIDIA, por lo que otras empresas pueden hacer lo que quieran, pero a menos que tengan 10 años de experiencia en software, no tendrán aprendizaje automático. mejoramiento.
Schmidt: Me gusta pensar en CUDA como un lenguaje de programación C para GPU y me siento cómodo con esa idea. CUDA se fundó en 2008. Aunque siempre pensé que era un mal lenguaje, ahora lo he asumido. Otra idea que vale la pena destacar: existe un conjunto de bibliotecas de código abierto que están altamente optimizadas para CUDA que ninguna otra biblioteca lo está. Todas las personas que construyen estas pilas de tecnología se pierden por completo este punto de la discusión. Estas bibliotecas se denominan técnicamente VLLM y hay muchas bibliotecas similares que también están altamente optimizadas para CUDA, lo que dificulta que los competidores las copien.
Entonces, ¿qué significa todo esto? El año que viene, veremos ventanas de contexto, agentes y aplicaciones de texto a acción muy grandes. Cuando estas tecnologías se distribuyan a escala, tendrán un enorme impacto en el mundo, mucho más allá del impacto de las redes sociales. He aquí por qué: en la ventana de contexto, puedes usarlo como memoria a corto plazo, y me sorprendió lo larga que era la ventana de contexto. Las razones técnicas tienen que ver con el servicio y la dificultad computacional. Lo interesante de la memoria a corto plazo es que cuando ingresas información y haces una pregunta, por ejemplo, lees 20 libros y usas el texto de los libros como consulta y luego preguntas de qué tratan, se olvida la parte media, similar a cómo El cerebro humano funciona.
Con respecto a los agentes, ahora hay personas que están creando agentes LLM leyendo y entendiendo cosas en áreas como la química y luego probándolos y agregándolos nuevamente a su comprensión. Esto es muy poderoso. El tercer aspecto es el texto a la acción. Déjame darte un ejemplo: digamos que el gobierno está intentando prohibir TikTok. Si TikTok está prohibido, le sugiero que le diga lo siguiente a su LLM: copie TikTok por mí, ponga mis preferencias en él, cree esta aplicación y publíquela dentro de los próximos 30 segundos, y dentro de una hora, si no se puso de moda. , simplemente haz algo así. Ese es el orden. Puedes ver lo poderoso que es esto.
Si puedes traducir desde cualquier idioma a cualquier comando numérico, eso es esencialmente Python en este escenario. Imagínese que todos en el planeta tuvieran sus propios programadores que realmente hicieran lo que querían hacer, a diferencia de programadores que no trabajaran como era necesario. Los programadores aquí saben de lo que estoy hablando. Imagine un programador no arrogante que realmente hace lo que quiere sin que usted tenga que pagar un precio elevado. Y la oferta de estos programadores es ilimitada.
Anfitrión: ¿Sucederá todo esto en uno o dos años?
Schmidt: Pronto. Estoy seguro de que las tres cosas anteriores sucederán simultáneamente en la próxima ola. Entonces te preguntas qué más pasará. Fluctúo cada seis meses, por lo que estamos en una oscilación par-impar. De momento, la brecha entre los modelos punteras (ahora sólo hay tres) y el resto parece estar creciendo. Hace seis meses, estaba convencido de que la brecha se estaba cerrando, así que invertí mucho en algunas empresas más pequeñas. Sin embargo, ahora no estoy tan seguro de eso.
Estoy teniendo conversaciones con algunas grandes empresas y me dicen que necesitan 10.000 millones de dólares, 20.000 millones de dólares, 50.000 millones de dólares e incluso 100.000 millones de dólares. El proyecto Stargate requiere 100 mil millones de dólares y es muy difícil. Mi buen amigo Sam Altman cree que se podrían necesitar unos 300.000 millones de dólares, tal vez más. Le señalé que había calculado la energía necesaria.
En aras de una divulgación completa, fui a la Casa Blanca el viernes y les dije que teníamos que ser los mejores amigos de Canadá. Como los canadienses son gente muy agradable, ayudaron a inventar la inteligencia artificial y tienen mucha energía hidroeléctrica. Porque nosotros como país no tenemos suficiente poder para lograr este objetivo. Otra opción es que los países árabes financien el proyecto. Personalmente me gustan los árabes y paso mucho tiempo allí, pero es posible que no sigan nuestras reglas de seguridad nacional. Y Canadá y Estados Unidos son uno de los tres grandes en los que todos estamos de acuerdo.
Así, en estos centros de datos, que valen entre 100.000 y 300.000 millones de dólares, la energía está empezando a convertirse en un recurso escaso.
Por cierto, si sigue este razonamiento, puede preguntarse por qué estoy hablando de CUDA y NVIDIA. Si los 300 mil millones de dólares van a NVIDIA, ya sabes qué hacer en el mercado de valores. Sin embargo, esta no es una recomendación de acciones y no soy un otorgante de licencias.
Anfitrión: En parte porque vamos a necesitar más chips, pero Intel recibe mucho dinero del gobierno de Estados Unidos. AMD está intentando construir una fábrica en Corea del Sur.
Schmidt: Levanten la mano si tienen un chip Intel en cualquiera de sus dispositivos informáticos. Hasta aquí el monopolio.
Profesor: Pero ese es el punto. Una vez tuvieron un monopolio y ahora NVIDIA tiene un monopolio. ¿Son entonces estas barreras de entrada? Hablando de CUDA, ¿hay otras opciones? Estuve hablando con Percy Lange el otro día. Está cambiando entre TPU y chips NVIDIA, dependiendo de a qué tenga acceso. Esto se debe a que no tiene otra opción.
Schmidt: Si tuviera fondos ilimitados, hoy elegiría la arquitectura B200 de NVIDIA porque es más rápida. No estoy sugiriendo eso: la competencia es algo bueno. Tuve una larga conversación con Lisa Su de AMD. Han construido algo que puede convertir la arquitectura CUDA en su propia arquitectura, llamada Rokam. Aún no es completamente funcional, pero están trabajando en ello.
Moderador: Usted trabajó en Google durante mucho tiempo y ellos inventaron la arquitectura Transformer. Gracias a la gran gente de allí, como Peter, Jeff Dean y todos. En la actualidad, OpenAI parece haber perdido la iniciativa. En las últimas clasificaciones que vi, Claude de Anthropic encabezó la lista. Le pregunté a Sundar, pero no me dio una respuesta muy clara. Quizás tengas una explicación más directa u objetiva de lo que está pasando allí.
Schmidt: Ya no soy empleado de Google. El enfoque de Google en el equilibrio entre la vida laboral y personal se trata más de permitir que los empleados se vayan temprano a casa y trabajen desde casa, en lugar de buscar ciegamente la victoria. Por el contrario, las startups tienen éxito porque sus empleados trabajan duro. Si bien eso puede ser un poco contundente, la realidad es que si estás iniciando una empresa después de la universidad y quieres competir con otras nuevas empresas, no puedes tener empleados que vengan solo un día a la semana.
Moderador: En los primeros días de Google, lo mismo ocurría con Microsoft.
Schmidt: Ahora parece que en nuestra industria, durante mucho tiempo, las empresas siempre han ganado por ser realmente creativas y dominar un espacio en lugar de realizar la siguiente transformación. Esto está bien documentado. Creo que los fundadores son especiales y necesitan tener el control, aunque puede resultar difícil trabajar con ellos porque ejercen mucha presión sobre sus empleados. Por mucho que no nos gusten las acciones personales de Elon, mire lo que obtiene de sus empleados. Una vez cené con él y estaba volando. Yo estaba en Montana y él estaba en un vuelo a las 10 de la noche para una reunión de medianoche con x.ai. Piénsalo.
Diferentes lugares tienen diferentes culturas. Estoy impresionado por TSMC. Tenían la regla de que los estudiantes de doctorado recién graduados, buenos físicos, debían trabajar en el sótano de la fábrica. ¿Te imaginas que un doctorado estadounidense en física haga esto? No es probable. Es una ética de trabajo diferente.
El rigor con el que trabajo se debe a que estos sistemas tienen efectos de red, por lo que el tiempo es esencial. Y en la mayoría de las empresas, el tiempo no es tan importante, hay mucho. Coca-Cola y Pepsi-Cola seguirán existiendo, la competencia entre ellas continuará y todo estará helado. Cuando trato con empresas de telecomunicaciones, un acuerdo típico tarda 18 meses en firmarse. No hay razón para tardar 18 meses en hacer algo, hay que hacerlo lo más rápido posible. Estamos en un período de crecimiento y maximización de ingresos, pero también requiere ideas locas.
Por ejemplo, cuando Microsoft hizo el trato con OpenAI, pensé que era la idea más tonta que había escuchado en mi vida. ¿Subcontratar su liderazgo en IA a OpenAI y a Sam y su equipo? Esto es una locura. Nadie en Microsoft ni en ningún otro lugar hace eso. Hoy, sin embargo, se están convirtiendo en las empresas más valiosas, ciertamente en una posición de ojo por ojo con Apple. Apple no tiene una buena solución de IA, pero parece que la hicieron funcionar.
Patrocinador: ¿Cómo desempeñará la IA un papel en la seguridad nacional o los intereses geopolíticos, especialmente en la competencia con China?
Schmidt: Como presidente de un comité de inteligencia artificial, estudié esto en profundidad. Escribimos un informe de aproximadamente 752 páginas y lo resumimos de la siguiente manera: Actualmente estamos en una posición de liderazgo y necesitamos mantener esta ventaja, lo que requiere un apoyo financiero significativo. Nuestros principales clientes son el Senado y la Cámara de Representantes, lo que llevó a la introducción de la Ley CHIPS y otras políticas similares.
Si se siguen desarrollando modelos de vanguardia y algunos modelos de código abierto, es posible que sólo unas pocas empresas puedan competir en este campo. ¿Qué países tienen tales capacidades? Estos países deben estar bien financiados, ser talentosos, tener sistemas educativos sólidos y voluntad de ganar. Estados Unidos y China son dos de los principales países. En cuanto a si otros países pueden participar, no estoy seguro. Pero lo que es seguro es que en el futuro, la competencia entre Estados Unidos y China por la hegemonía intelectual será una lucha importante.
Básicamente, el gobierno de Estados Unidos ha prohibido las exportaciones de chips Nvidia a China, aunque no lo admitirán públicamente. Tenemos alrededor de 10 años de ventajas tecnológicas en chips DUV, que son chips de 5 nanómetros. Esta ventaja nos sitúa varios años por delante de China, para gran disgusto de China. Esta política fue desarrollada por la administración Trump y apoyada por la administración Biden.
Anfitrión: ¿El Congreso seguirá su consejo y realizará inversiones masivas? Obviamente, la Ley CHIPS es un ejemplo.
Schmidt: Además, también necesitamos construir un enorme sistema de inteligencia artificial. Dirijo un grupo informal, ad hoc y no legal de expertos comunes de la industria. El año pasado, estos miembros defendieron lo que se convirtió en el proyecto de ley de inteligencia artificial de la administración Biden, la directiva presidencial más larga de la historia.
Una vez discutimos una pregunta central: ¿Cómo detectar peligros en un sistema que ha aprendido pero no sabe qué preguntar? En otras palabras, es posible que el sistema haya aprendido algo malo, pero usted no sabe cómo preguntarlo. Por ejemplo, es posible que haya aprendido a mezclar productos químicos de alguna manera nueva, pero no sabes cómo pedírselo. Para abordar esto, nuestro memorando al gobierno recomendó establecer un umbral que llamamos 10 elevado a 26, que es una medida de cálculo técnico. Por encima de este umbral, las empresas deben informar sus actividades al gobierno. Para garantizar que sean diferentes, la Unión Europea establece 10 elevado a 25 como 10. Pero estas cifras son bastante cercanas. Creo que todas estas distinciones desaparecerán porque la tecnología existente quedará obsoleta. El término técnico se llama entrenamiento conjunto, que básicamente significa que las piezas se pueden fusionar. Por lo tanto, es posible que no podamos proteger a las personas de estas cosas nuevas.
Moderador: A continuación, quiero discutir una cuestión un tanto filosófica. El año pasado, usted fue coautor de un artículo con Henry Kissinger y Dan Huttenloch sobre la naturaleza del conocimiento y cómo se desarrolla. También hablé de este tema hace unas noches. Durante la mayor parte de la historia, la comprensión del universo por parte de la humanidad fue misteriosa, hasta el advenimiento de la Revolución Científica y la Ilustración. En su artículo menciona que los modelos actuales se han vuelto tan complejos y difíciles de entender que realmente no sabemos qué sucede dentro de ellos. Cito a Richard Feynman: “Lo que no puedo crear, no lo entiendo” El otro día me encontré con esta cita. Pero ahora la gente está creando lo que puede sin comprender realmente su funcionamiento interno. ¿Ha cambiado de alguna manera la naturaleza del conocimiento? ¿Tenemos que empezar a aceptar estos modelos al pie de la letra, que no pueden explicarnos?
Schmidt: Quiero darles un ejemplo de un adolescente. Si tienes un adolescente, sabes que es humano, pero no puedes entender lo que está pensando. Sin embargo, nosotros, como sociedad, hemos logrado adaptarnos a la existencia de los adolescentes y ellos eventualmente lo superarán. Esta es una pregunta seria. Así que podemos tener sistemas de conocimiento que no podemos describir completamente, pero entendemos sus límites y los límites de lo que pueden hacer, y eso es probablemente lo mejor que podemos conseguir. ¿Crees que entenderemos estas limitaciones? Si podemos hacer eso, eso es genial.
El consenso en las reuniones semanales de mi grupo es que eventualmente habrá la llamada IA adversaria, donde en realidad habrá empresas que te contraten y te paguen para que rompas tu sistema de IA. Como el equipo rojo. A diferencia de los equipos rojos humanos de hoy, habrá empresas enteras e industrias enteras de sistemas de IA cuyo trabajo será alterar los sistemas de IA existentes y encontrar vulnerabilidades en ellos, especialmente aquellas que no podemos descubrir. Esto tiene sentido para mí. También es un gran programa para Stanford. Si tienes un estudiante de posgrado que tiene que descubrir cómo atacar uno de estos grandes modelos y comprender lo que hace, esa será una habilidad importante para construir la próxima generación. Por eso tiene sentido combinar los dos.
Moderador: Ahora, respondamos las preguntas de algunos estudiantes. Hay un compañero de clase detrás de mí, por favor di tu nombre.
Estudiante: Mencionaste antes, y esto se relaciona con el comentario ahora, acerca de que la IA realmente haga lo que tú quieres que haga. Acabas de mencionar la IA adversaria y me preguntaba si podrías explicarlo con más detalle. Parece que, aparte del evidente aumento de la potencia informática, se pueden conseguir modelos de mayor rendimiento, pero la cuestión de conseguir que hagan lo que usted quiere parece estar parcialmente sin respuesta.
Schmidt: Bueno, hay que suponer que el problema actual de las alucinaciones disminuirá a medida que la tecnología mejore, etc. No digo que vaya a desaparecer. Y luego también hay que asumir que hay una prueba de eficacia, por lo que tiene que haber una manera de saber si esto tuvo éxito. En el ejemplo que mencioné de un competidor de TikTok, no estoy sugiriendo robar ilegalmente la música de otras personas. ¿Qué harías si fueras un emprendedor en Silicon Valley? Espero que todos ustedes sean emprendedores de Silicon Valley. Si su producto tiene éxito, contratará un ejército de abogados para encargarse de las consecuencias. Pero si nadie usa tu producto, no importará si lo robas todo. Por supuesto, no me cites sobre eso.
Silicon Valley normalmente realiza estas pruebas y maneja preguntas de seguimiento. Esta es una práctica común. Creo que veremos más y más sistemas de rendimiento e incluso mejores pruebas y, eventualmente, pruebas adversas, que lo mantendrán dentro de un marco. Este término profesional se llama razonamiento en cadena de pensamiento. Se cree que en los próximos años podrás generar una cadena de razonamiento de mil pasos, como si se elaborara una receta. Puede ejecutarlo y probar que produce los resultados correctos, así es como funciona el sistema.
Estudiante: En general, usted es muy optimista sobre el potencial de los avances en inteligencia artificial. Tengo curiosidad, ¿qué está impulsando este progreso? ¿Es más potencia informática? ¿Son más datos? ¿Es un cambio fundamental o real?
Schmidt: La respuesta es todo lo anterior. La cantidad de dinero invertida es increíble. Básicamente invertí todo porque no tenía idea de quién iba a ganar y la cantidad de dinero que seguía era enorme. Parte de la razón es que se ha ganado dinero temprano y aquellos que no saben mucho al respecto deben tener el componente de inteligencia artificial. Ahora todo es inversión en IA y no pueden notar la diferencia.
Defino la inteligencia artificial como un sistema de aprendizaje, un sistema que realmente aprende. Creo que este es uno de ellos. El segundo punto es que ahora existen algunos algoritmos nuevos muy complejos que son algo así como post-Transformer. Un amigo mío, también colaborador desde hace mucho tiempo, inventó una nueva arquitectura que no es Transformer. Un grupo que financié en París afirmó haber hecho lo mismo. Hay muchos inventos por ahí y hay mucha investigación en Stanford. El último punto es que el mercado cree que los inventos inteligentes tienen beneficios ilimitados. Digamos que inviertes 50 mil millones de dólares en una empresa, tienes que ganar mucho dinero con la inteligencia para devolverlo. Podríamos tener una enorme burbuja de inversión y luego se resolvería sola. Este ha sido siempre el caso y puede ser el caso ahora.
Profesor: Usted mencionó anteriormente que los líderes están creando distancia con los demás.
Schmidt: Ahora hay una empresa en Francia llamada Mistral y están haciendo un muy buen trabajo. Obviamente soy un inversor. Ya han fabricado una segunda versión y es probable que cierren el tercer modelo porque es demasiado caro. Necesitan ingresos y no pueden regalar su modelo. El debate sobre el código abierto versus el código cerrado continúa en nuestra industria. Toda mi carrera se ha basado en la voluntad de la gente de compartir software de forma abierta. Todo lo que hago se basa en código abierto. Gran parte de los cimientos de Google también se basan en código abierto. El trabajo que realizo es principalmente en el campo técnico. Sin embargo, los enormes costos de capital podrían cambiar fundamentalmente la forma en que se construye el software.
Mi opinión sobre los programadores de software es que su productividad al menos se duplicaría. Actualmente hay tres o cuatro empresas de software que intentan hacer esto y he invertido en todas ellas durante este tiempo. Todos intentan hacer que los programadores de software sean más productivos. Recientemente me encontré con una empresa muy interesante llamada Augment. A menudo pienso en programadores que dicen que ese no es el objetivo. Nuestro objetivo son esos equipos de programación de software de 100 personas con millones de líneas de código y nadie sabe lo que está pasando. Esta es una muy buena aplicación de la inteligencia artificial. ¿Ganarán dinero? Eso espero, pero hay muchos problemas aquí.
Estudiante: Al principio mencionaste que la combinación de extensiones de ventana de contexto, servidores proxy y texto a acciones tendría un impacto increíble. Primero, ¿por qué es importante esta combinación? En segundo lugar, sé que no eres un profeta y no puedes predecir el futuro, pero ¿por qué crees que está más allá de nuestra imaginación?
Schmidt: Creo que principalmente porque la ventana de contexto te permite resolver el problema de lo reciente. Los modelos actuales tardan unos 18 meses en entrenarse, incluidos seis meses de preparación, seis meses de formación y seis meses de ajuste, por lo que siempre están desactualizados. Y con la ventana de contexto, puedes escribir los últimos acontecimientos y hacer preguntas sobre la guerra entre Hamas e Israel en contexto, lo cual es muy poderoso y lo hace tan actualizado como Google.
En el caso de la agencia, te puedo dar un ejemplo. Creé una fundación para proporcionar financiación a una organización sin fines de lucro. No sé mucho sobre química, pero existe una herramienta llamada ChatCrow, que es un sistema basado en modelos de lenguaje grandes que pueden aprender química. Ejecutan el sistema para generar hipótesis químicas sobre las proteínas, luego el laboratorio las prueba durante la noche y el sistema aprende. Se trata de un enorme acelerador para campos como la química y la ciencia de materiales. Este es un modelo de agencia.
Creo que si hubiera muchos programadores baratos, el concepto de texto a acción podría entenderse. No creo que entendamos lo que sucede cuando cada uno tiene su propio programador. Esta también es su área de especialización. No me refiero a tareas sencillas como encender y apagar las luces. Me imagino otro ejemplo, digamos que no te gusta Google, podrías decir, constrúyeme un competidor de Google. Sí, puedes hacerlo personalmente. Constrúyame un competidor de Google que busque en la web, cree la interfaz de usuario, haga una buena copia y agregue IA generativa de maneras interesantes. Hágalo en 30 segundos y vea si funciona. Muchos creen que los operadores tradicionales, incluido Google, son vulnerables a este tipo de ataques.
Anfitrión: Ahora, echemos un vistazo. Slido envió muchas preguntas, algunas de las cuales se han subido. El año pasado discutimos cómo evitar que la IA influya en la opinión pública y difunda información errónea, especialmente durante las próximas elecciones.
Schmidt: Tenemos que pensar en soluciones a corto y largo plazo. En las próximas elecciones mundiales, la mayor parte de la información errónea aparecerá en las redes sociales, y las capacidades organizativas actuales de las empresas de redes sociales son insuficientes para controlar eficazmente esta información. A TikTok, por ejemplo, se le ha acusado de favorecer cierto tipo de desinformación, aunque no tengo pruebas. Creo que estamos en un lío.
El país necesita aprender a pensar críticamente, lo que puede ser un desafío difícil para Estados Unidos. Sólo porque alguien te diga algo no significa que sea verdad.
Anfitrión: ¿Vamos a llegar tan lejos que ya nadie creerá algunas de las cosas que son ciertas? Algunos lo llaman una crisis epistemológica. Ahora, Elon Musk dice que nunca hizo algo, pero ¿cómo demostrarlo?
Schmidt: Podemos utilizar el ejemplo de Donald Trump. Creo que tenemos un problema de confianza en nuestra sociedad y la democracia puede fracasar a causa de ello. La mayor amenaza a la democracia es la desinformación, porque nos hemos vuelto muy buenos en eso.
Cuando administraba YouTube, el mayor problema que teníamos era que la gente subía videos falsos que provocaban la muerte de personas. Tenemos una política de no muerte y tratar de abordar este problema es impactante y horrible. Esto fue antes de la llegada de la inteligencia artificial generativa.
Estudiante: Tengo curiosidad por saber si has explorado las configuraciones distribuidas. Hago esta pregunta porque, por supuesto, crear un clúster grande es difícil, pero las MacBooks son poderosas. Hay muchas máquinas pequeñas en todo el mundo. Entonces, ¿crees que doblar en casa o algo así sería aplicable para entrenar estos sistemas?
Schmidt: Sí, hemos examinado este tema con mucha atención. Entonces, la forma en que funciona el algoritmo es que tienes una matriz muy grande y básicamente tienes una función de multiplicación. Así que considérelo como un ida y vuelta. Y estos sistemas están completamente limitados por la velocidad de la memoria de la CPU o GPU. De hecho, la próxima generación de chips NVIDIA ha integrado todas estas funciones en un solo chip. Los chips ahora son tan grandes que están pegados. De hecho, el paquete es tan sensible que tanto el paquete como el propio chip se ensamblan en una sala limpia. Entonces, la respuesta parece ser que las supercomputadoras y la velocidad de la luz, especialmente las interconexiones de memoria, realmente tienen la ventaja. Creo que por el momento es poco probable segmentar modelos de lenguajes grandes (LLM).
Moderador: En el campo de la IA, parece haber algunas grandes empresas que dominan el mercado, lo cual está relacionado con las leyes antimonopolio.
Schmidt: Participé en la desintegración de Microsoft en mi carrera, pero al final no tuvo éxito; también trabajé duro para evitar la desintegración de Google, pero también fracasé. Por tanto, creo que la tendencia es no dividirse. Mientras estas empresas no se conviertan en monopolios como John D. Rockefeller, es poco probable que el gobierno actúe.
Estas grandes empresas dominan porque sólo ellas tienen el capital para construir centros de datos. Tengo amigos Reed y Mustafa que tomaron la decisión de escindir su negocio a Microsoft porque no podían recaudar decenas de miles de millones de dólares. En cuanto a los números exactos, es posible que tengas que pedirle a Reed que te los diga.
Estudiante: Finalmente, me pregunto qué impacto tendrán estos desarrollos en los países que no participan en el desarrollo y cálculo de modelos de vanguardia.
Schmidt: Los países ricos se harán más ricos, mientras que los países pobres sólo pueden hacer lo mejor que puedan. En realidad, se trata de un juego para los países ricos, que requiere enormes capitales, talento técnico y un fuerte apoyo gubernamental. A nivel mundial, muchos países enfrentan diversos problemas, especialmente cuando los recursos son escasos. Necesitan encontrar socios y trabajar con otros para resolver estos problemas.
Moderador: Recuerdo la última vez que nos vimos, estabas participando en un hackathon en AGI House. Sé que dedicas mucho tiempo y te apasiona ayudar a los jóvenes a crear riqueza. ¿Tiene algún consejo para las personas que escriben planes de negocios para cursos o redactan propuestas de políticas o propuestas de investigación en sus carreras?
Schmidt: Doy un curso sobre esto en una escuela de negocios y usted debería venir y escucharlo. Me sorprende lo rápido que presentas nuevas ideas.
En un hackathon en el que participé, al equipo ganador se le asignó la tarea de volar un dron entre dos torres. Usaron Python para generar código en un espacio virtual de drones y completaron con éxito la tarea en el simulador. Un buen programador profesional puede necesitar una semana o dos para hacer esto. Creo que la capacidad de crear prototipos rápidamente es realmente importante porque parte del problema que enfrentan los emprendedores es la velocidad. Si no puedes crear un prototipo en un día con estas herramientas, debes reconsiderarlo porque eso es exactamente lo que están haciendo tus competidores.
Entonces, mi mayor consejo es que cuando empieces a pensar en iniciar una empresa, está bien que escribas un plan de negocios. De hecho, puedes hacer que una computadora lo escriba por ti, siempre y cuando sea legal. Es importante utilizar estas herramientas para crear prototipos de sus ideas lo más rápido posible porque es posible que haya alguien haciendo lo mismo en otra empresa, universidad o en algún lugar donde no haya estado.
Moderador: Muchas gracias Schmidt. (La parte abreviada proviene de la cuenta Web3 Sky City)
(Este artículo se publicó por primera vez en la aplicación Titanium Media, autor | Lin Zhijia, editor | Hu Runfeng)