mi información de contacto
correo[email protected]
2024-09-30
한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina
¡recomendado por el gran dios kapasi wall crack!
incluso predijo estoaplicación de ia, es posible abrir "una oportunidad tan grande como chatgpt".
es un producto de ia experimental de google,cuaderno lm, impulsado por gemini 1.5 pro, el modelo más potente de google en este momento.
recientemente, esta aplicación se ha vuelto tan popular como es posible, todo gracias al lanzamiento de una nueva función——
cargue un archivo (texto, audio, video) y la ia no solo puede ayudar a extraer puntos clave con texto, sino también convertir el archivo en un podcast de conversación generado por ia a través de la función descripción general de audio y llevar a cabo debates basados en el contenido del documento.
dos ia, utilizando voces y tonos de personas reales, discutieron apasionadamente el contenido del documento y formularon observaciones finales.
△
kapasi ingresó el código c para entrenar gpt-2 y produjo un podcast de conversación
¡esto es realmente genial!
y kapasi no es el único que se jacta. después de navegar por varias plataformas importantes de internet, los internautas generalmente están de acuerdo con notebook lm.
kol @elvis de la industria de la ia también dejó un mensaje en el área de comentarios de kapasi:
card god dijo que esto "recuerda un momento chatgpt", ¡lo cual definitivamente no es una exageración!
realmente permitir que varios modelos funcionen juntos desbloqueará formatos de contenido y experiencias de usuario únicos como notebook lm.
¿cómo jugar a notebook lm?
el modo de juego es muy simple, simplemente abra la página de prueba y arrastre y suelte los archivos que deben procesarse.
podría ser un documento de google, un enlace a un sitio web o un vídeo, o incluso simplemente pegar un gran bloque de texto.
cada cuaderno admite la carga de 50 archivos y el contenido de cada archivo está limitado a 500.000 palabras.
aquí hemos subido el documento de la tarjeta del sistema de openai o1 y luego podemos elegir el contenido que se debe crear.
soporte integrado para funciones de versión de texto como preguntas y respuestas, cuestionarios, tabla de contenido, línea de tiempo, resumen, etc., así como contenido de audio de conversación en profundidad entre dos anfitriones.
si tiene necesidades más personalizadas, también puede escribir el mensaje usted mismo.
intentamos hacer preguntas en chino y el resultado fue que la ia puede entenderlas.
es una pena que el notebook lmno se admite responder en chino, incluso si lo pides deliberadamente.
si elige crear audio, deberá esperar entre unos minutos y diez minutos, dependiendo de la longitud del documento.
tómese este tiempo para conocer el modelo gemini detrás de él ~
notebooklm es compatible con gemini 1.5 pro, que es el modelo grande insignia actual de google.
gemini 1.5 pro admite un contexto ultralargo de 128k, que es la base para interpretar documentos largos.
en una actualización reciente, las capacidades matemáticas y de razonamiento de gemini 1.5 pro superaron la versión preliminar de openai o1.
bien, el audio generado hace un momento ha sido procesado. los amigos que dominan el inglés pueden venir y escuchar.
los amigos que no dominan tan bien el inglés también pueden echar un vistazo a la versión de texto del podcast de ai transcrita y traducida por matryoshka ai para tener una idea.
simplemente cargar documentos y generar contenido es sólo una de las formas prácticas de utilizar notebook.
alguien también introdujo un método para que los estudiantes graben las clases y utilicen la ia para resolver los puntos clave en casa, lo que también fue muy elogiado.
(no quiero decir que no escucharé la clase)
en concreto, puedes seguir los siguientes pasos:,
utilice su teléfono móvil para grabar durante la clase;
no es necesario utilizar una computadora durante la clase, simplemente anotar breves puntos clave (papel y lápiz);
(después de clase) escanee la grabación y las notas, cárguelas en notebooklm y deje que expanda las notas según los detalles de la grabación.
además, también podrás crear una revisión de audio semanal de los puntos clave de lo aprendido.
un paradigma interactivo diferente al simple chat
de hecho, notebooklm no se convirtió en un éxito inmediatamente después de su debut.
ya había aparecido en la conferencia google i/o en mayo del año pasado, pero en ese momento, como proyecto de cuaderno de ia, también se llamabaproyecto viento de cola。
no fue hasta julio del año pasado que notebooklm cambió a su nombre actual.
al principio, sólo era compatible con usuarios de algunas zonas de estados unidos; las funciones todavía giraban en torno al modo de chat básico.
△
notebooklm genera automáticamente una guía de documentación (del sitio web oficial de google)
el 11 de este mes, notebooklm anunció repentinamente que estaría abierto a jugadores de todo el mundo y agregó nuevas características importantes.resumen de audio。
la introducción oficial de google es la siguiente:
"la nueva función de descripción general de audio convierte documentos, diapositivas, gráficos y más en debates interesantes con un solo clic".
debido a que la forma de interacción es muy nueva, la voz de la ia es realista y la discusión es realmente como un podcast en vivo, todos se divierten de inmediato.
a partir de estos dos días, notebook lm no sólo puede utilizar vídeos de youtube como entrada, sino que también admite más de 100 idiomas.
ahora, la “demostración de amor” de kapasi se ha sumado a la popularidad de notebook lm.
como dijo kapasi, la razón principal por la que notebook lm se hizo tan popular es que proporciona un paradigma de interacción que es diferente del simple chat.
kapasi dijo,notebook lm elimina dos barreras principales para disfrutar de modelos grandes:
en primer lugar, chatear es bastante difícil.
algunas personas tienen dificultades para comunicarse con otras personas en su vida diaria, y mucho menos conversar con un chatbot, donde tienen que seguir haciendo preguntas.
lo bueno de notebooklm es que uno de los dos podcasts de ia generados tendrá la función de hacer preguntas y guiar.
coloquemos los documentos, audio y video, esperemos a que se generen y meimei ting ai chateará según los archivos.
en segundo lugar, leer no es fácil.
en la era fragmentada de la explosión de la información, es mucho más fácil encontrar una posición cómoda o escuchar a otros discutir lo que necesito mientras conduzco que hacerlo por mi cuenta.
——incluso si estamos mirando la versión condensada que ai nos ha resumido (¡oye, sí, somos tan vagos! doge).
con el espíritu de luchar por la excelencia, algunos internautas también expresaron sus expectativas de que notebook lm lo lleve al siguiente nivel.
después de probarlo, yuchen jin, cofundador y cto de hyperbolic labs, resumió dos limitaciones:
uno es"no puede ver", es decir, la información de la imagen del documento no se puede procesar.
sin embargo, el gemini detrás de él es multimodal. en comparación con el notebook lm, no será demasiado tarde.
el otro eslos usuarios no pueden dirigir el contenido de los podcasts de ia。
yuchen jin le envió dos tweets y generó casi 13 minutos de contenido de audio, pero se dirigió de forma predeterminada a la audiencia general, por lo que habló sobre muchos conceptos muy básicos.
si puedes especificar el grupo objetivo para generar el podcast, o hablar sobre el tema, la dirección y el ángulo, eso es realmente una ventaja adicional.
una cosa más
es demasiado tarde, pero es demasiado tarde, se les ocurrió a los desarrolladoresversión de código abierto de notebooklm¡entiendo!
pero por el momento, sólo puedo enviarlo en formato pdf.
¡digamos que los humanos son realmente interesantes!
en el pasado, tenía problemas para convertir audio a texto y convertir transmisiones, grabaciones de conferencias, etc. en texto.
ahora estoy empezando a utilizar modelos grandes para convertir texto en podcasts nuevamente...
interesante guau interesante guau (cabeza de perro).
enlaces de referencia:
[1] https://notebooklm.google/
[2]https://x.com/karpathy/status/1840112692910272898
[3]https://x.com/omarsar0/status/1840145774874898506
[4]https://x.com/yuchenj_uw/status/1840203324571943403
[5]https://github.com/gabrielchua/open-notebooklm
— encima —