2024-10-05
한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina
herausgeber: aeneas
[einführung in die neue weisheit]die textbasierte podcast-funktion von google notebooklm ist einfach großartig. eine minesweeper-autorin reagierte überrascht und erfreut, als sie hörte, dass ihr buch in einen podcast umgewandelt worden war. stellen sie sich diese unpopulären bücher vor, aus denen niemand podcasts gemacht hat, und der herausgeber hat eine mutige idee ...
die notebooklm-funktion von google, mit der aus texten schnell podcasts generiert werden können, sorgte nach ihrem start für große resonanz.
und erst kürzlich entdeckte ein spieleautor, dass ein von ihm veröffentlichtes minenräumbuch von notebooklm als gefälschter ki-podcast generiert worden war!
als der autor kyle orland sah, dass sein buch zu einem zwölfeinhalbminütigen gespräch zwischen zwei nichtexistenten personen zusammengefasst war, rief er aus: „ich war schockiert!“
wenn sie genau hinhören, werden sie natürlich feststellen, dass es beim podcast-audio immer noch viele probleme gibt. offensichtlich kann es professionelle podcasts nicht ersetzen.
trotzdem bedauerte orland immer noch: podcast-formate sind für uns eine ansprechendere und interessantere möglichkeit, komplexe informationen zu erhalten.
es deutet eindeutig auf eine faszinierendere zukunft für generative ki hin als die langweiligen antworten, die uns textbasierte chatbots geben.
googlenotebooklm
googles notebooklm wurde vor mehr als einem jahr auf den markt gebracht.
laut google fungiert es „als virtueller forschungsassistent, der fakten zusammenfasst, komplexe ideen erklärt und auf der grundlage von quellen ihrer wahl neue zusammenhänge erarbeitet.“
aber erst letzte woche hat google die funktion „audio-übersicht“ hinzugefügt.
plötzlich hat notebooklm ein neues verkaufsargument: ein kaltes dokument kann in ein ansprechendes audio verwandelt werden!
interessanterweise verwendet google das wort „podcast“ nirgendwo, sagt aber, dass die funktion ihnen dabei helfen kann, „material zusammenzufassen, verbindungen zwischen themen herzustellen und sogar ein paar spielerische witze zu reißen“.
als ethan mollick, professor an der wharton business school, einen beitrag veröffentlichte, gab er dem produkt den richtigen namen: „podcast“.
professor mollick bewertete diesen podcast als „die beste derzeit verfügbare ki-demonstration“.
er sagte auch, es sei beunruhigend.
natürlich ist das problem der halluzinationen bei ki-podcasts immer noch unvermeidbar.
aber professor mollick sagte, dass die fähigkeit, mehrere große dokumente zusammenzufassen, zu verfeinern und zu verarbeiten, es uns ermöglicht, die fakten der ki zu überprüfen, was ihren größten wert darstellt.
inspiriert von ethan mollick beschloss orland, sein buch in notebooklm einzutragen.
er ist gespannt darauf, wie dieses 30.000 wörter umfassende buch über das minesweeper-spiel aussehen wird, wenn daraus ein virtueller podcast wird.
nur wenige minuten später sah orland das bild am anfang des artikels.
er erlebte aus erster hand, wie es wäre, in der „pop culture happy hour“ von npr aufzutreten oder zu einem ironischen podcast eingeladen zu werden.
der ki-moderator fing an, sich etwas auszudenken
orland stellte fest, dass die zusammenfassung von notebooklm den hauptteil seines buches abdeckte –
die vorgeschichte der spiele, die minesweeper inspirierten; der harte kampf, den das geschäftsorientierte microsoft in den 1990er jahren um das windows entertainment pack führte; die moralische panik um die vorinstallation von minesweeper auf millionen von unternehmens- und regierungscomputern; gaming-wettbewerbsszene.
insgesamt kann sich jeder, der diesen podcast hört, einen überblick darüber verschaffen, worum es in meinem buch geht, genau wie bei vielen echten podcasts.
obwohl es in diesem gefälschten podcast keine groß angelegten halluzinationen gibt, gibt es dennoch einige fehler in kleinen details oder annahmen, die vom text nicht unterstützt werden.
als es beispielsweise um den vorgänger von minesweeper, mined-out, ging, sagte der ai-podcast: „hier kommen also diese blöcke und flaggen ins spiel …“
allerdings verfügt mined-out nicht über diese beiden funktionen, es ist alles von ki erfunden.
wenn wir den zusammenfassenden podcast von notebooklm verwenden müssen, um einen wissenschaftlichen artikel oder eine nachrichtenmeldung zu verstehen, wird es natürlich sehr entmutigend sein, wenn ähnliche illusionen auftreten oder wenn einige wichtige teile des buches übersehen werden.
allerdings können wir diese art der zusammenfassung verwenden, um etwas im „cliff notes“-stil zu erreichen, was immer noch sehr attraktiv für große bücher ist, für deren vollständige lektüre wir weder die zeit noch das interesse haben.
und im gegensatz zum lesen von cliff notes sorgt dieser prägnante podcast-stil für eine angenehme hintergrundgeräusche, die sich perfekt zum anhören beim spaziergang oder beim erledigen von besorgungen eignet.
ai, wurde plötzlich warm
es ist diese natürliche und humorvolle präsentation, die die neue funktion von notebooklm von anderen ki-produkten abhebt, die textzusammenfassungen erstellen können.
orland sagte, es habe sich angefühlt, als wäre er zufällig in einem café und habe zufällig zwei leute belauscht, die über sein buch diskutierten.
diese beiden menschen existieren jedoch in wirklichkeit nicht.
darüber hinaus könnte ihr lob für das buch algorithmisch gestaltet sein.
ein „podcast-moderator“ beschrieb das buch zunächst als eine geschichte aus „dem land der disketten und dfü-modems“.
einen so interessanten ausdruck hat der autor in dem buch nicht verwendet. der humor der ki brachte ihn zum lachen.
der moderator neckte dann, dass „bill gates durch die microsoft-büros geschlichen sei“, und spielte damit auf die lieblingsanekdote des autors in dem buch an.
anschließend besprachen die beiden fake-moderatoren diese anekdote in einem ganz natürlichen dialog.
moderator 1: es ist schwer, die auswirkungen einer sache zu leugnen, wenn der eigene ceo insgeheim davon besessen ist.
moderator 2: moment, reden wir über bill gates?
der hin- und hergehende dialogstil des zwei-personen-„podcast“-formats ermöglicht auch einige interessante, aber von den hauptpunkten des buches abweichende themen.
zum beispiel wirkten die beiden ki-moderatoren ein wenig verstört, als sie über den wurm-filmstar „jungfrau in not“ aus „mined-out“ sprachen.
moderator 1: ich würde gerne fragen, in welchen anderen filmen chong mitgespielt hat?
moderator 2: ich fürchte, die details sind im staub der spielegeschichte verloren gegangen.
dann schlugen die beiden „moderatoren“ ganz beiläufig eine verbesserte version von minesweeper vor, die die probleme mit microsofts ursprünglichem minesweeper lösen sollte.
moderator 1: also hat die community irgendwann eine elegantere lösung gefunden.
moderator 2: lass mich raten. sie haben eine neue version von minesweeper erstellt.
moderator 1: das stimmt.
moderator 2: das war’s für die alte zeit.
das gespräch zwischen den beiden hat einen sanften und entspannten rhythmus, die präsentierten informationen sind jedoch sehr dicht.
auch natürlich klingende pausen und wiederholungen können dabei helfen, wichtige punkte hervorzuheben.
moderator 1 spricht beispielsweise über „dieses unglaublich süchtig machende puzzlespiel ist auf fast jedem computer vorinstalliert“, und eine andere stimme antwortet: „auf jedem computer?“
oder ein moderator würde sagen: „wir haben einen fehler in der art und weise gefunden, wie der ursprüngliche minesweeper zufällige boards generierte“, und eine andere stimme sprang ein und rief: „ein fehler!“
das atmosphärenteam ist sehr energisch.
natürlich gibt es immer noch einige probleme mit der konversation zwischen den beiden ki-dummies.
zum beispiel scheinen die beiden stimmen zwischen „ich habe dieses buch gelesen“ und „ich war überrascht von den fakten, die sie in dem buch geteilt haben“ hin und her zu springen.
und eine übermäßig überraschte reaktion kann die leute auch ein wenig verärgern, weil sie es satt haben, dumm zu sein.
darüber hinaus wird die ki sätze an der falschen stelle unterbrechen oder seltsame lacher hervorrufen.
dennoch überraschte es orland.
er sagte zum beispiel, dass die art und weise, wie dadurch bestimmte dinge hervorgerufen wurden, in bestimmten momenten auf subtile weise sein selbstbewusstsein als autor ansprach, was ihm gute dienste leistete.
schließlich kam orland zu dem schluss, dass er sich nach dem anhören der zusammenfassung von notebooklm vorstellen konnte, dass diese gefälschten podcasts in naher zukunft zu seiner „hauptmahlzeit“ werden würden.
vor allem solche fachbücher oder themen, die für echte podcaster wahrscheinlich nicht von interesse sind.
indem google generativen ki-text als „zwei-personen-chat“-modell neu verpackt, verleiht er einer technologie, die manchmal unpersönlich wirkt, ein freundliches gesicht.