2024-09-30
한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina
recommandé par le grand dieu kapasi wall crack !
j'ai même prédit çaapplication d'ia, il est possible d'ouvrir "une opportunité aussi grande que chatgpt".
il s'agit d'un produit expérimental d'ia de google,carnet lm, propulsé par gemini 1.5 pro, le modèle le plus puissant de google à l'heure actuelle.
récemment, cette application est devenue aussi populaire que possible, tout cela grâce au lancement d'une nouvelle fonctionnalité——
téléchargez un fichier (texte, audio, vidéo) et l'ia peut non seulement aider à extraire les points clés avec du texte, mais également convertir le fichier en un podcast de conversation généré par l'ia via la fonction audio overview et mener des discussions basées sur le contenu du document.
deux ia, utilisant des voix et des tons réels, ont discuté avec passion du contenu du document et ont formulé des remarques finales.
△
kapasi a saisi le code c pour entraîner gpt-2 et a produit un podcast de conversation
c'est vraiment cool !
et kapasi n’est pas le seul à se vanter. après avoir parcouru plusieurs grandes plateformes internet, les internautes sont généralement d'accord avec notebook lm.
kol @elvis de l'industrie de l'ia a également laissé un message dans la zone de commentaires de kapasi :
card god a déclaré que cela "rappelle un moment chatgpt", ce qui n'est certainement pas une exagération !
permettre véritablement à plusieurs modèles de fonctionner ensemble débloquera des formats de contenu et des expériences utilisateur uniques comme notebook lm.
comment jouer à notebook lm ?
le gameplay est très simple, il suffit d'ouvrir la page d'essai et de glisser-déposer les fichiers à traiter.
il peut s'agir d'un document google, d'un lien vers un site web ou d'une vidéo, ou même simplement de coller un gros bloc de texte.
chaque bloc-notes prend en charge le téléchargement de 50 fichiers et le contenu de chaque fichier est limité à 500 000 mots.
ici, nous avons téléchargé le document system card d'openai o1, puis nous pouvons choisir le contenu qui doit être créé.
prise en charge intégrée des fonctions de version texte telles que questions-réponses, quiz, table des matières, chronologie, résumé, etc., ainsi que du contenu audio de conversation approfondie entre deux hôtes.
si vous avez des besoins plus personnalisés, vous pouvez également saisir l'invite vous-même.
nous avons essayé de poser des questions en chinois, et le résultat a été que l’ia peut le comprendre.
c'est dommage que notebook lmrépondre en chinois n'est pas pris en charge, même si vous le demandez délibérément.
si vous choisissez de créer de l'audio, vous devrez attendre quelques minutes à dix minutes selon la longueur du document.
prenez ce temps pour en savoir plus sur le modèle gemini qui se cache derrière ~
notebooklm est pris en charge par gemini 1.5 pro, qui est le grand modèle phare actuel de google.
gemini 1.5 pro prend en charge le contexte ultra-long de 128 ko, qui constitue la base de l'interprétation de documents longs.
dans une mise à jour récente, les capacités mathématiques et de raisonnement de gemini 1.5 pro ont dépassé la version préliminaire d'openai o1.
d'accord, l'audio généré tout à l'heure a été traité. les amis qui maîtrisent bien l'anglais peuvent venir écouter.
les amis qui ne sont pas très doués en anglais peuvent également jeter un œil à la version texte du podcast ai transcrit et traduit par matryoshka ai pour s'en faire une idée.
le simple fait de télécharger des documents et de générer du contenu n'est qu'un des moyens pratiques d'utiliser notebook.
quelqu’un a également introduit une méthode permettant aux étudiants d’enregistrer les cours et d’utiliser l’ia pour trier les points clés à la maison, qui a également été largement saluée.
(je ne veux pas dire que je n'écouterai pas le cours)
plus précisément, vous pouvez suivre les étapes suivantes :,
utilisez votre téléphone portable pour enregistrer pendant les cours ;
il n'est pas nécessaire d'utiliser un ordinateur pendant le cours, il suffit de noter de brefs points clés (papier et crayon) ;
(après le cours) numérisez l'enregistrement et les notes et téléchargez-les sur notebooklm, et laissez-le développer les notes en fonction des détails de l'enregistrement.
de plus, vous pouvez également créer une revue audio hebdomadaire des points clés de ce que vous avez appris.
un paradigme interactif différent du simple chat
en fait, notebooklm n’est pas devenu un succès immédiatement après ses débuts.
il était déjà apparu lors de la conférence google i/o en mai de l'année dernière, mais à cette époque, en tant que projet de notebook ai, il s'appelait égalementprojet vent arrière。
ce n’est qu’en juillet de l’année dernière que notebooklm a pris son nom actuel.
au début, il n'était pris en charge que pour les utilisateurs de certaines régions des états-unis ; les fonctions tournaient toujours autour du mode chat de base.
△
notebooklm génère automatiquement un guide de documentation (à partir du site officiel de google)
le 11 de ce mois, notebooklm a soudainement annoncé qu'il serait ouvert aux joueurs du monde entier et a ajouté de nouvelles fonctionnalités majeures.aperçu audio。
l'introduction officielle de google est la suivante :
"la nouvelle fonctionnalité de présentation audio transforme les documents, diapositives, graphiques et bien plus encore en discussions engageantes en un seul clic."
parce que la forme d'interaction est très nouvelle, la voix de l'ia est réaliste et la discussion ressemble vraiment à un podcast en direct, tout le monde s'amuse immédiatement.
depuis ces deux jours, notebook lm est non seulement capable d'utiliser des vidéos youtube comme entrée, mais prend également en charge plus de 100 langues.
aujourd’hui, la « démonstration d’amour » de kapasi a ajouté à la popularité de notebook lm.
comme l'a dit kapasi, la principale raison pour laquelle notebook lm est devenu si populaire est qu'il offre un paradigme d'interaction différent du simple chat.
kapasi a dit :notebook lm supprime deux obstacles majeurs à la jouissance des grands modèles :
premièrement, discuter est en fait assez difficile.
certaines personnes ont du mal à communiquer avec les autres dans leur vie quotidienne, encore moins à discuter avec un chatbot, où elles doivent sans cesse poser des questions.
l'avantage de notebooklm est que l'un des deux podcasts d'ia générés aura pour rôle de poser des questions et de guider.
mettons les documents, audio et vidéo, attendons qu'ils soient générés, et meimei ting ai discutera en fonction des fichiers.
deuxièmement, la lecture n’est pas facile.
à l’ère de la fragmentation et de l’explosion de l’information, il est beaucoup plus facile de trouver une position confortable ou d’écouter les autres discuter de ce dont j’ai besoin en conduisant que de tout ranger tout seul.
——même si nous regardons la version condensée que ai a résumée pour nous (hé, oui, nous sommes tellement paresseux ! doge).
dans un esprit de recherche de l'excellence, certains internautes ont également exprimé leurs attentes quant à notebook lm pour passer au niveau supérieur.
après l'avoir essayé, yuchen jin, co-fondateur et cto d'hyperbolic labs, a résumé deux limites :
on estil "ne peut pas voir", c'est-à-dire que les informations d'image contenues dans le document ne peuvent pas être traitées.
cependant, le gemini derrière lui est multimodal. par rapport au notebook lm, il ne sera pas trop tard.
l'autre estles utilisateurs ne peuvent pas diriger le contenu des podcasts ai。
yuchen jin lui a fourni deux tweets, et il a généré près de 13 minutes de contenu audio, mais il s'est adressé par défaut au grand public, il a donc parlé de nombreux concepts très basiques.
si vous pouvez spécifier le groupe cible pour générer le podcast, ou parler du sujet, de la direction et de l'angle, c'est vraiment un bonus supplémentaire.
encore une chose
c'est trop tard, mais c'est trop tard, les développeurs ont proposéversion open source de notebooklmj'ai compris!
mais pour l'instant je ne peux le nourrir qu'en pdf.
disons simplement que les humains sont vraiment intéressants !
dans le passé, j'avais du mal à convertir l'audio en texte, en poursuivant la conversion d'émissions, d'enregistrements de conférences, etc. en texte.
maintenant, je recommence à utiliser de grands modèles pour convertir du texte en podcasts...
intéressant wow intéressant wow (tête de chien).
liens de référence :
[1]https://notebooklm.google/
[2]https://x.com/karpathy/status/1840112692910272898
[3]https://x.com/omarsar0/status/1840145774874898506
[4]https://x.com/yuchenj_uw/status/1840203324571943403
[5]https://github.com/gabrielchua/open-notebooklm
— sur —