nachricht

der große meister kapacianli explodiert die ki-anwendung und sagt: „es könnte das nächste chatgpt sein.“

2024-09-30

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

empfohlen vom großen gott kapasi wall crack!

habe das sogar vorhergesagtki-anwendungist es möglich, „eine so große chance wie chatgpt“ zu eröffnen.

es handelt sich um ein experimentelles ki-produkt von google.notizbuch lm, angetrieben von gemini 1.5 pro, dem derzeit leistungsstärksten modell von google.

in letzter zeit erfreut sich diese app großer beliebtheit, und das alles aufgrund der einführung einer neuen funktion:

laden sie eine datei hoch (text, audio, video), und ki kann nicht nur dabei helfen, wichtige punkte mit text zu extrahieren, sondern die datei auch über die audioübersichtsfunktion in einen ki-generierten konversations-podcast umwandeln und diskussionen basierend auf dem dokumentinhalt führen.

zwei kis diskutierten mit stimmen und tönen realer personen leidenschaftlich den inhalt des dokuments und machten abschließende schlussbemerkungen.

kapasi gab den c-code für das gpt-2-training ein und produzierte einen konversations-podcast

das ist wirklich cool!

und kapasi ist nicht der einzige, der prahlt. nach dem durchsuchen mehrerer großer internetplattformen stimmen internetnutzer im allgemeinen notebook lm zu.

auch kol @elvis aus der ki-branche hinterließ eine nachricht im kapasi-kommentarbereich:

card god sagte, dass dies „an einen chatgpt-moment erinnert“, was definitiv keine übertreibung ist!

durch die echte zusammenarbeit mehrerer modelle werden einzigartige inhaltsformate und benutzererlebnisse wie notebook lm freigeschaltet.

wie spielt man notebook lm?

das gameplay ist sehr einfach. öffnen sie einfach die testseite und ziehen sie die dateien, die verarbeitet werden müssen, per drag & drop.

dabei kann es sich um ein google-dokument, einen link zu einer website oder ein video oder einfach um das einfügen eines großen textblocks handeln.

jedes notizbuch unterstützt das hochladen von 50 dateien und der inhalt jeder datei ist auf 500.000 wörter begrenzt.

hier haben wir das systemkartendokument von openai o1 hochgeladen und können dann den inhalt auswählen, der erstellt werden muss.

integrierte unterstützung für textversionsfunktionen wie fragen und antworten, quizze, inhaltsverzeichnis, zeitleiste, zusammenfassung usw. sowie ausführliche audioinhalte für konversationen zwischen zwei moderatoren.

wenn sie persönlichere anforderungen haben, können sie die eingabeaufforderung auch selbst eingeben.

wir haben versucht, fragen auf chinesisch zu stellen, und das ergebnis war, dass die ki sie verstehen kann.

schade, dass notebook lmantworten auf chinesisch werden nicht unterstützt, auch wenn sie bewusst danach fragen.

wenn sie audio erstellen möchten, müssen sie je nach länge des dokuments einige bis zehn minuten warten.

nehmen sie sich die zeit, mehr über das gemini-modell dahinter zu erfahren

notebooklm wird von gemini 1.5 pro unterstützt, dem aktuellen flaggschiff-großmodell von google.

gemini 1.5 pro unterstützt ultralangen 128k-kontext, der die grundlage für die interpretation langer dokumente bildet.

in einem kürzlich durchgeführten upgrade übertrafen die mathematik- und denkfähigkeiten von gemini 1.5 pro die openai o1-vorschauversion.

okay, der gerade erzeugte ton wurde verarbeitet. freunde, die gut englisch können, können vorbeikommen und zuhören.

freunde, die nicht so gut englisch können, können sich auch die von matryoshka ai transkribierte und übersetzte textversion des ai-podcasts ansehen, um ein gefühl dafür zu bekommen.

das einfache hochladen von dokumenten und das generieren von inhalten ist nur eine der praktischen möglichkeiten, notebook zu nutzen.

jemand hat auch eine methode eingeführt, mit der schüler den unterricht aufzeichnen und ki verwenden können, um die wichtigsten punkte zu hause zu klären, was ebenfalls viel lob erhielt.

(ich meine nicht, dass ich dem unterricht nicht zuhören werde)

im einzelnen können sie die folgenden schritte ausführen:

verwenden sie ihr mobiltelefon, um während des unterrichts aufzuzeichnen.

während des unterrichts ist es nicht nötig, einen computer zu benutzen. notieren sie sich einfach kurze kernpunkte (auf papier und mit bleistift).

(nach dem unterricht) scannen sie die aufzeichnung und notizen, laden sie sie auf notebooklm hoch und lassen sie die notizen basierend auf den aufzeichnungsdetails erweitern.

darüber hinaus können sie auch eine wöchentliche audio-review der wichtigsten punkte des gelernten erstellen.

ein interaktives paradigma, das sich vom einfachen chat unterscheidet

tatsächlich wurde notebooklm nicht unmittelbar nach seinem debüt ein hit.

es war bereits im mai letzten jahres auf der google i/o-konferenz erschienen, hieß damals aber auch als ai-notebook-projektprojekt rückenwind

erst im juli letzten jahres erhielt notebooklm seinen heutigen namen.

zunächst wurde es nur für benutzer in einigen gebieten der vereinigten staaten unterstützt; die funktionen konzentrierten sich noch auf den grundlegenden chat-modus.

notebooklm generiert automatisch einen dokumentationsleitfaden (von der offiziellen google-website)

am 11. dieses monats kündigte notebooklm plötzlich an, dass es für spieler auf der ganzen welt offen sein würde, und fügte wichtige neue funktionen hinzu.audioübersicht

die offizielle einführung von google lautet wie folgt:

„die neue audio-übersichtsfunktion verwandelt dokumente, folien, diagramme und mehr mit einem klick in spannende diskussionen.“

da die interaktionsform sehr neu ist, die ki-stimme lebensecht ist und die diskussion wirklich wie ein live-podcast ist, hat jeder sofort spaß.

seit diesen beiden tagen kann notebook lm nicht nur youtube-videos als eingabe verwenden, sondern unterstützt auch mehr als 100 sprachen.

jetzt hat kapasis „liebesbeweis“ zur popularität von notebook lm beigetragen.

wie kapasi sagte, ist notebook lm vor allem deshalb so beliebt geworden, weil es ein interaktionsparadigma bietet, das sich vom einfachen chat unterscheidet.

kapasi sagte:notebook lm beseitigt zwei große hindernisse für die freude an großen modellen:

erstens ist das chatten eigentlich ziemlich schwierig.

manchen menschen fällt es im alltag schwer, mit anderen zu kommunizieren, ganz zu schweigen davon, mit einem chatbot zu chatten, bei dem sie ständig fragen stellen müssen.

das gute an notebooklm ist, dass einer der beiden generierten ki-podcasts die rolle des fragenstellens und anleitens übernehmen wird.

legen wir die dokumente, audio- und videodateien ein, warten darauf, dass sie generiert werden, und meimei ting ai wird dann anhand der dateien chatten.

zweitens ist das lesen nicht einfach.

im fragmentierten zeitalter der informationsexplosion ist es viel einfacher, während der fahrt eine bequeme position zu finden oder anderen zuzuhören, wenn sie darüber diskutieren, was ich brauche, als es selbst zu erreichen.

——auch wenn wir uns die komprimierte version ansehen, die die ki für uns zusammengefasst hat (hey, ja, wir sind einfach so faul! doge).

im geiste des strebens nach exzellenz äußerten einige internetnutzer auch ihre erwartungen, dass notebook lm die nächste stufe erreichen würde.

nachdem er es ausprobiert hatte, fasste yuchen jin, mitbegründer und cto von hyperbolic labs, zwei einschränkungen zusammen:

einer istes „kann nicht sehen“, d. h. die bildinformationen im dokument können nicht verarbeitet werden.

da der gemini dahinter jedoch multimodal ist, wird es noch nicht zu spät sein.

der andere istbenutzer können den inhalt von ki-podcasts nicht steuern

yuchen jin fütterte es mit zwei tweets und es generierte fast 13 minuten audioinhalt, der sich jedoch standardmäßig an das allgemeine publikum richtete und daher über viele sehr grundlegende konzepte sprach.

wenn sie die zielgruppe für die erstellung des podcasts angeben oder über das thema, die richtung und den blickwinkel sprechen können, ist das wirklich ein zusätzlicher bonus.

noch etwas

es ist zu spät, aber es ist zu spät, haben sich die entwickler ausgedachtopen-source-version von notebooklmhabe es!

aber vorerst kann ich es nur als pdf füttern.

sagen wir es so: menschen sind wirklich interessant!

in der vergangenheit hatte ich probleme mit der konvertierung von audio in text und verfolgte die konvertierung von sendungen, konferenzaufzeichnungen usw. in text.

jetzt fange ich wieder an, große modelle zu verwenden, um texte in podcasts umzuwandeln ...

interessant wow, interessant wow (hundekopf).

referenzlinks:

[1]https://notebooklm.google/

[2]https://x.com/karpathy/status/1840112692910272898

[3]https://x.com/omarsar0/status/1840145774874898506

[4]https://x.com/yuchenj_uw/status/1840203324571943403

[5]https://github.com/gabrielchua/open-notebooklm

über