mi información de contacto
correo[email protected]
2024-10-05
한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina
editor: eneas
[introducción a la nueva sabiduría]la función de podcast basado en texto de google notebooklm es simplemente asombrosa. una escritora de buscaminas reaccionó con sorpresa y alegría cuando escuchó que su libro se había convertido en un podcast. imagínese esos libros impopulares que nadie ha convertido en podcasts y el editor tiene una idea audaz...
la función notebooklm de google, que puede generar rápidamente podcasts a partir de texto, provocó una fuerte respuesta una vez que se lanzó.
¡y recientemente, un escritor de juegos descubrió que notebooklm había generado un libro sobre remoción de minas que publicó como un podcast de ia falso!
al ver que su libro estaba condensado en una conversación de 12 minutos y medio entre dos personas inexistentes, el autor kyle orland exclamó: ¡me sorprendió!
por supuesto, si escuchas con atención, encontrarás que todavía hay muchos problemas con el audio del podcast. obviamente, no puede reemplazar a los podcasts profesionales.
pero aun así, orland todavía se lamenta: los formatos de podcast son una forma más atractiva e interesante de recibir información compleja.
claramente apunta a un futuro más fascinante para la ia generativa que las aburridas respuestas que nos brindan los chatbots basados en texto.
googlenotebooklm
notebooklm de google se lanzó hace más de un año.
según google, funciona "como un asistente de investigación virtual que resume hechos, explica ideas complejas y genera nuevas conexiones basadas en fuentes de su elección".
pero la semana pasada, google agregó la función "descripción general de audio".
de repente, notebooklm tiene un nuevo punto de venta: ¡un documento frío se puede convertir en un audio atractivo!
curiosamente, google no utiliza la palabra "podcast" en ninguna parte, pero dice que la función puede ayudarle a "resumir material, establecer conexiones entre temas e incluso hacer algunos chistes divertidos".
cuando el profesor de wharton business school, ethan mollick, publicó una publicación, le dio al producto el nombre correcto: "podcast".
el profesor mollick calificó este podcast como "la mejor demostración de ia disponible actualmente".
también dijo que era inquietante.
por supuesto, en los podcasts de ia, el problema de las alucinaciones sigue siendo inevitable.
pero el profesor mollick dijo que la capacidad de resumir, refinar y procesar múltiples documentos grandes nos permite verificar la ia, que es su mayor valor.
inspirado por ethan mollick, orland decidió incluir su libro en notebooklm.
espera con ansias cómo se verá este libro de 30.000 palabras sobre el juego buscaminas si se convierte en un podcast virtual.
unos minutos más tarde, orland vio la imagen al principio del artículo.
experimentó de primera mano cómo sería aparecer en el programa "pop culture happy hour" de npr o ser invitado a aparecer en un podcast irónico.
el anfitrión de la ia empezó a inventar cosas.
orland descubrió que el resumen de notebooklm cubría la parte principal de su libro——
la prehistoria de los juegos que inspiraron minesweeper; la ardua batalla que microsoft, centrada en los negocios, libró por el windows entertainment pack en la década de 1990; el pánico moral que rodeó la preinstalación de minesweeper en millones de computadoras corporativas y gubernamentales; escena competitiva del juego.
en general, cualquiera que escuche este podcast puede tener una idea general de de qué trata mi libro, al igual que muchos podcasts reales.
aunque no hay alucinaciones a gran escala en este podcast falso, todavía hay algunos errores en pequeños detalles o suposiciones que no están respaldadas por el texto.
por ejemplo, al hablar del predecesor de buscaminas, mined-out, el ai podcast dijo: "así que aquí es donde esos bloques y banderas entran en juego..."
sin embargo, mined-out no tiene estas dos funciones, está todo compuesto por ia.
obviamente, si necesitamos utilizar el podcast de resumen de notebooklm para comprender un artículo académico o un informe de noticias, será muy desalentador si se producen ilusiones similares o si se omiten algunas partes clave del libro.
sin embargo, podemos utilizar este tipo de resumen para conseguir algo del estilo “cliff notes”, que no deja de resultar muy atractivo para aquellos libros de gran tamaño que no tenemos tiempo o interés para leerlos completos.
y, a diferencia de leer cliff notes, este estilo de podcast conciso proporciona un ruido de fondo agradable, perfecto para escuchar mientras sale a caminar o hace recados.
ai, de repente se calentó
es esta presentación natural y divertida lo que hace que la nueva característica de notebooklm se destaque de otros productos de inteligencia artificial que pueden generar resúmenes de texto.
orland dijo que se sintió como si estuviera en una cafetería y escuchó a dos personas discutiendo su libro.
sin embargo, estas dos personas no existen en la realidad.
además, es posible que sus elogios por el libro hayan sido diseñados algorítmicamente.
al principio, un "presentador de podcast" describió el libro como una historia de "la tierra de los disquetes y los módems de acceso telefónico".
el autor no ha utilizado una expresión tan interesante en el libro. el humor de la ia le hizo reír a carcajadas.
luego, el presentador bromeó diciendo que "bill gates estaba merodeando por las oficinas de microsoft", insinuando la anécdota favorita del autor en el libro.
posteriormente, los dos falsos presentadores comentaron esta anécdota en un diálogo muy natural.
anfitrión 1: es difícil negar el impacto de algo cuando su propio director ejecutivo está secretamente obsesionado con ello.
anfitrión 2: espera, ¿estamos hablando de bill gates?
el estilo de diálogo de ida y vuelta del formato de "podcast" de dos personas también permite algunos temas interesantes pero que se desvían de los puntos principales del libro.
por ejemplo, los dos presentadores de ia parecían un poco angustiados cuando hablaban de la damisela estrella de cine gusano en apuros de mined-out.
anfitrión 1: me gustaría preguntar, ¿qué otras películas ha protagonizado chong?
moderador 2: me temo que los detalles se han perdido en el polvo de la historia de los videojuegos.
luego, de manera casual, los dos "moderadores" propusieron una versión mejorada de buscaminas, que fue diseñada para resolver los problemas con el buscaminas original de microsoft.
moderador 1: finalmente, a la comunidad se le ocurrió una solución más elegante.
anfitrión 2: déjame adivinar. crearon una nueva versión de buscaminas.
anfitrión 1: así es.
anfitrión 2: eso es todo por los viejos tiempos.
la conversación entre ambos tiene un ritmo suave y relajado, pero la información presentada es muy densa.
además, las pausas y repeticiones que suenan naturales pueden ayudar a enfatizar los puntos clave.
por ejemplo, el presentador 1 habla de "este juego de rompecabezas increíblemente adictivo viene preinstalado en casi todas las computadoras" y otra voz responde: "¿en todas las computadoras?".
o un moderador diría: "encontramos un defecto en la forma en que el buscaminas original generaba tableros aleatorios", y otra voz intervendría y exclamaría: "¡un defecto!".
el equipo de ambiente es muy enérgico.
por supuesto, todavía hay algunos problemas con la conversación entre los dos muñecos de ia.
por ejemplo, las dos voces parecen saltar de un lado a otro entre "leí este libro" y "me sorprendieron los datos que compartiste en el libro". es difícil creer que cualquiera de las dos sea sincera.
y una reacción demasiado sorprendida también puede molestar un poco a las personas porque están cansadas de ser estúpidas.
además, la ia romperá frases en el lugar equivocado o provocará alguna risa extraña.
aun así, esto sorprendió a orland.
dijo, por ejemplo, que en ciertos momentos, la forma en que provocaba ciertas cosas apelaba sutilmente a su autoconciencia como autor, lo que le resultó muy útil.
finalmente, orland concluyó que después de escuchar el resumen de notebooklm, imaginaría que en un futuro cercano estos podcasts falsos se convertirían en su “comida principal”.
especialmente aquellos libros o temas profesionales que probablemente no interesen a los podcasters de la vida real.
al reenvasar el texto generativo de ia como un modelo de "dos personas charlando", google pone una cara afable a una tecnología que a veces parece impersonal.