notizia

il grande maestro kapacianli fa esplodere l'applicazione ai, dicendo "potrebbe essere il prossimo chatgpt"

2024-09-30

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

consigliato dal grande dio kapasi wall crack!

anche questo lo aveva previstoapplicazione dell'intelligenza artificiale, è possibile aprire "un'opportunità grande quanto chatgpt".

è un prodotto ai sperimentale di google,taccuino lm, basato su gemini 1.5 pro, il modello più potente di google in questo momento.

di recente, questa app è diventata popolarissima, tutto grazie al lancio di una nuova funzionalità——

carica un file (testo, audio, video) e l'intelligenza artificiale non solo può aiutare a estrarre i punti chiave con il testo, ma anche convertire il file in un podcast di conversazione generato dall'intelligenza artificiale attraverso la funzione panoramica audio e condurre discussioni basate sul contenuto del documento.

due ia, utilizzando voci e toni di persone reali, hanno discusso appassionatamente il contenuto del documento e hanno formulato osservazioni conclusive finali.

kapasi ha inserito il codice c per l'addestramento gpt-2 e ha prodotto un podcast di conversazione

questo è davvero fantastico!

e kapasi non è l’unico a vantarsi. dopo aver esplorato diverse importanti piattaforme internet, i netizen generalmente concordano con notebook lm.

anche kol @elvis del settore ai ha lasciato un messaggio nell'area commenti di kapasi:

card god ha detto che questo "ricorda un momento chatgpt", il che non è sicuramente un'esagerazione!

permettere realmente a più modelli di lavorare insieme sbloccherà formati di contenuti ed esperienze utente unici come notebook lm.

come si gioca a notebook lm?

il gameplay è molto semplice, basta aprire la pagina di prova e trascinare e rilasciare i file che devono essere elaborati.

potrebbe trattarsi di un documento google, di un collegamento a un sito web o di un video o anche semplicemente di incollare un grande blocco di testo.

ogni notebook supporta il caricamento di 50 file e il contenuto di ciascun file è limitato a 500.000 parole.

qui abbiamo caricato il documento system card di openai o1, quindi possiamo scegliere il contenuto che deve essere creato.

supporto integrato per funzioni di versione testuale come domande e risposte, quiz, sommario, sequenza temporale, riepilogo, ecc., nonché contenuti audio di conversazioni approfondite tra due host.

se hai esigenze più personalizzate, puoi anche digitare tu stesso il messaggio.

abbiamo provato a fare domande in cinese e il risultato è stato che l’intelligenza artificiale riesce a capirlo.

è un peccato che notebook lmla risposta in cinese non è supportata, anche se lo chiedi deliberatamente.

se scegli di creare l'audio, dovrai attendere da alcuni minuti a dieci minuti a seconda della lunghezza del documento.

prenditi questo tempo per conoscere il modello gemini che c'è dietro~

notebooklm è supportato da gemini 1.5 pro, che è l'attuale modello di punta di google.

gemini 1.5 pro supporta un contesto ultra lungo da 128k, che costituisce la base per l'interpretazione di documenti lunghi.

in un recente aggiornamento, le capacità matematiche e di ragionamento di gemini 1.5 pro hanno superato la versione di anteprima di openai o1.

ok, l'audio generato proprio adesso è stato elaborato. gli amici che sono bravi in ​​inglese possono venire ad ascoltare.

gli amici che non sono così bravi in ​​inglese possono anche dare un'occhiata alla versione testuale del podcast ai trascritto e tradotto da matryoshka ai per farsi un'idea.

il semplice caricamento di documenti e la generazione di contenuti è solo uno dei modi pratici per utilizzare notebook.

qualcuno ha anche introdotto un metodo per consentire agli studenti di registrare le lezioni e utilizzare l'intelligenza artificiale per risolvere i punti chiave a casa, anch'esso ampiamente elogiato.

(non voglio dire che non ascolterò la lezione)

nello specifico, è possibile seguire i seguenti passaggi:,

usa il tuo cellulare per registrare durante la lezione;

non è necessario utilizzare il computer durante le lezioni, è sufficiente annotare brevi punti chiave (carta e matita);

(dopo la lezione) scansiona la registrazione e le note e caricale su notebooklm e lascia che espanda le note in base ai dettagli della registrazione.

inoltre, puoi anche creare una revisione audio settimanale dei punti chiave di ciò che hai imparato.

un paradigma interattivo diverso dalla semplice chat

in effetti, notebooklm non è diventato un successo subito dopo il suo debutto.

era già apparso alla conferenza google i/o di maggio dell'anno scorso, ma all'epoca, come progetto di notebook ai, si chiamava ancheprogetto tailwind

è stato solo nel luglio dello scorso anno che notebooklm è stato cambiato nel suo nome attuale.

inizialmente era supportato solo per gli utenti di alcune zone degli stati uniti, le funzioni ruotavano ancora attorno alla modalità chat di base;

notebooklm genera automaticamente la guida alla documentazione (dal sito ufficiale di google)

l'11 di questo mese, notebooklm ha improvvisamente annunciato che sarebbe stato aperto ai giocatori di tutto il mondo e ha aggiunto nuove importanti funzionalità.panoramica dell'audio

la presentazione ufficiale di google è la seguente:

"la nuova funzionalità di panoramica audio trasforma documenti, diapositive, grafici e altro in discussioni coinvolgenti con un clic."

poiché il modulo di interazione è nuovissimo, la voce dell'intelligenza artificiale è realistica e la discussione è davvero come un podcast dal vivo, tutti si divertono immediatamente.

a partire da questi due giorni, notebook lm non solo è in grado di utilizzare i video di youtube come input, ma supporta anche più di 100 lingue.

ora, la “dimostrazione d’amore” di kapasi ha aumentato la popolarità di notebook lm.

come ha detto kapasi, il motivo principale per cui notebook lm è diventato così popolare è che fornisce un paradigma di interazione diverso dalla semplice chat.

kapasi ha detto,notebook lm rimuove due principali ostacoli al godimento dei modelli di grandi dimensioni:

innanzitutto, chattare è in realtà piuttosto difficile.

alcune persone hanno difficoltà a comunicare con gli altri nella loro vita quotidiana, per non parlare di chattare con un chatbot, dove devono continuare a fare domande.

l'aspetto positivo di notebooklm è che uno dei due podcast ai generati avrà il ruolo di porre domande e guidare.

inseriamo i documenti, l'audio e il video, aspettiamo che vengano generati e meimei ting ai chatterà in base ai file.

in secondo luogo, leggere non è facile.

nell’era frammentata dell’esplosione delle informazioni, è molto più facile trovare una posizione comoda o ascoltare gli altri discutere di ciò di cui ho bisogno mentre guido, piuttosto che metterselo da solo.

——anche se stiamo guardando la versione condensata che l'intelligenza artificiale ha riassunto per noi (ehi, sì, siamo proprio così pigri! doge).

nello spirito di ricerca dell'eccellenza, alcuni netizen hanno anche espresso le loro aspettative affinché notebook lm lo porti al livello successivo.

dopo averlo provato, yuchen jin, co-fondatore e cto di hyperbolic labs, ha riassunto due limitazioni:

uno lo è"non può vedere", ovvero le informazioni sull'immagine nel documento non possono essere elaborate.

tuttavia, il gemini dietro è multimodale. rispetto al notebook lm, non sarà troppo tardi.

l'altro lo ègli utenti non possono dirigere il contenuto dei podcast ai

yuchen jin gli ha inviato due tweet e ha generato quasi 13 minuti di contenuto audio, ma per impostazione predefinita era rivolto al pubblico generale, quindi parlava di molti concetti basilari.

se puoi specificare il gruppo target per generare il podcast o parlare dell'argomento, della direzione e dell'angolazione, questo è davvero un ulteriore vantaggio.

ancora una cosa

è troppo tardi, ma è troppo tardi, hanno pensato gli sviluppatoriversione open source di notebooklmfatto!

ma per il momento posso solo alimentarlo in pdf.

diciamo solo che gli esseri umani sono davvero interessanti!

in passato, ho avuto difficoltà a convertire l'audio in testo, cercando di convertire in testo trasmissioni, registrazioni di conferenze, ecc.

ora sto iniziando a utilizzare nuovamente modelli di grandi dimensioni per convertire il testo in podcast...

interessante wow interessante wow (testa di cane).

link di riferimento:

[1]https://notebooklm.google/

[2]https://x.com/karpathy/status/1840112692910272898

[3]https://x.com/omarsar0/status/1840145774874898506

[4]https://x.com/yuchenj_uw/status/1840203324571943403

[5]https://github.com/gabrielchua/open-notebooklm

sopra