2024-09-30
한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina
大神カパシ壁割れ推奨!
これさえ予測してたaiアプリケーション、「chatgptと同じくらい大きなチャンス」を開くことが可能です。
googleの実験的なai製品ですが、ノートlm、現時点で google の最も強力なモデルである gemini 1.5 pro を搭載しています。
最近、このアプリがますます人気になっているのは、すべて新機能のリリースのおかげです—
ファイル(テキスト、音声、ビデオ)をアップロードすると、ai がテキストで重要なポイントを抽出するだけでなく、オーディオ概要機能を通じてファイルを ai 生成の会話ポッドキャストに変換し、ドキュメントの内容に基づいてディスカッションを行うこともできます。
2 つの ai が、実際の人間の声とトーンを使用して、文書の内容について熱心に議論し、最終的な結論の発言をしました。
△
カパシ氏は gpt-2 をトレーニングするための c コードを入力し、会話ポッドキャストを作成しました
これは本当にかっこいいですね!
そして、自慢しているのはカパシだけではありません。いくつかの主要なインターネット プラットフォームを閲覧した後、ネチズンは概して notebook lm に同意します。
ai 業界の kol @elvis も、カパシのコメント エリアにメッセージを残しました。
card god はこれを「chatgpt の瞬間を思い出させる」と言いましたが、これは決して誇張ではありません。
複数のモデルが連携できるようにすることで、notebook lm のような独自のコンテンツ形式とユーザー エクスペリエンスが解放されます。
ノートブックlmの遊び方は?
ゲームプレイは非常に簡単で、体験版ページを開いて、処理する必要のあるファイルをドラッグ アンド ドロップするだけです。
google ドキュメント、web サイトやビデオへのリンク、あるいは単に大きなテキスト ブロックを貼り付けるだけの場合もあります。
各ノートブックは 50 個のファイルのアップロードをサポートしており、各ファイルのコンテンツは 500,000 ワードに制限されています。
ここでは、openai o1 のシステム カード ドキュメントをアップロードしました。作成する必要があるコンテンツを選択できます。
q&a、クイズ、目次、タイムライン、概要などのテキスト版機能と、2 人のホスト間の詳細な会話音声コンテンツのサポートが組み込まれています。
より個人的なニーズがある場合は、プロンプトを自分で入力することもできます。
中国語で質問してみたところ、aiは理解できるという結果になりました。
ノートlmは残念です中国語での応答はサポートされていませんたとえ故意に求めたとしても。
音声を作成する場合は、ドキュメントの長さに応じて、数分から 10 分ほど待つ必要があります。
この機会に、その背後にあるジェミニモデルについて学んでください~
notebooklm は、google の現在の主力大型モデルである gemini 1.5 pro でサポートされています。
gemini 1.5 pro は、長いドキュメントを解釈するための基礎となる超長い 128k コンテキストをサポートしています。
最近のアップグレードで、gemini 1.5 pro の数学および推論機能は openai o1 プレビュー バージョンを上回りました。
さて、今生成された音声は処理されました。英語が得意な友達が来て聞いてください。
英語があまり得意ではない友人は、matryoshka ai が書き起こし、翻訳した ai ポッドキャストのテキスト版を見て雰囲気をつかむこともできます。
単にドキュメントをアップロードしてコンテンツを生成することは、notebook の実用的な使用方法の 1 つにすぎません。
また、授業を録画してaiを活用して自宅で要点を整理する方法を紹介した人もいて、これも好評でした。
(授業を聞かないというわけではありません)
具体的には、次の手順に従うことができます。
授業中に携帯電話を使用して録音します。
授業中にコンピューターを使用する必要はなく、簡単な要点を紙と鉛筆で書き留めるだけで済みます。
(授業後) 録音とメモをスキャンして notebooklm にアップロードし、録音の詳細に基づいてメモを展開させます。
さらに、学習した内容の重要なポイントを毎週音声でレビューすることもできます。
単純なチャットとは異なるインタラクティブなパラダイム
実はnotebooklmは登場してすぐにヒットしたわけではありません。
昨年5月のgoogle i/oカンファレンスですでに登場していましたが、当時はaiノートプロジェクトとして、プロジェクト・テイルウィンド。
notebooklm が現在の名前に変更されたのは、昨年 7 月のことです。
当初は、米国の一部地域のユーザーに対してのみサポートされていましたが、機能は依然として基本的なチャット モードを中心に展開していました。
△
notebooklm はドキュメント ガイドを自動生成します (google 公式 web サイトから)
今月11日、notebooklmは世界中のプレイヤーに公開し、大きな新機能を追加することを突然発表した。オーディオの概要。
googleからの公式紹介文は以下の通りです。
「新しい音声概要機能により、ワンクリックで文書、スライド、グラフなどが魅力的なディスカッションに変わります。」
インタラクション形式は非常に新しく、aiの声は本物のようで、ディスカッションは本当にライブポッドキャストのようであるため、誰もがすぐに楽しんでいます。
この 2 日の時点で、notebook lm は youtube ビデオを入力として使用できるだけでなく、100 以上の言語もサポートしています。
現在、カパシの「愛の表現」により、ノートブック lm の人気がさらに高まりました。
kapasi 氏が述べたように、notebook lm がこれほど人気になった主な理由は、単純なチャットとは異なる対話パラダイムを提供するためです。
カパシ氏はこう語った。notebook lm は、大型モデルを楽しむための 2 つの大きな障壁を取り除きます。
まず、チャットって実はかなり難しいんです。
チャットボットとのチャットはもちろんのこと、日常生活でも他の人とコミュニケーションを取るのが難しく、質問をし続けなければならない人もいます。
notebooklm の良い点は、生成された 2 つの ai ポッドキャストのうち 1 つが質問とガイドの役割を果たすことです。
ドキュメント、オーディオ、ビデオを入力して、生成されるのを待ちましょう。meimei ting ai がファイルに基づいてチャットします。
第二に、読むのは簡単ではありません。
情報が爆発的に増加する断片的な時代では、運転中に自分が必要なことを自分で決めるよりも、快適な位置を見つけたり、他の人の議論に耳を傾けたりする方がはるかに簡単です。
——たとえ、ai がまとめてくれた要約版を見ているとしても (おい、はい、私たちは本当に怠け者です! doge)。
卓越性を追求する精神で、一部のネチズンは notebook lm が次のレベルに引き上げられることへの期待を表明しました。
hyperbolic labs の共同創設者兼 cto である yuchen jin 氏は、これを試した後、2 つの制限を要約しました。
1つはそれは「見えない」つまり、文書内の画像情報を処理できません。
ただし、その後ろにある gemini は、notebook lm と比較すると、まだ遅くはありません。
もう一つはユーザーは ai ポッドキャストのコンテンツを指示することはできません。
yuchen jin が 2 つのツイートを送信すると、13 分近くの音声コンテンツが生成されましたが、デフォルトで一般の視聴者を対象としていたため、多くの非常に基本的な概念について話していました。
ポッドキャストを生成するターゲット グループを指定したり、トピック、方向、角度について話すことができれば、それはさらに大きなメリットとなります。
もうひとつ
もう遅すぎる、でも遅すぎる、開発者はこう思いついたnotebooklm のオープンソース版わかった!
ただし、当面は pdf をフィードすることしかできません。
言っておきますが、人間って本当に面白いですね!
以前、私は音声のテキスト化に苦労し、放送や会議の録音などのテキスト化を追求していました。
今、私は再び大きなモデルを使用してテキストをポッドキャストに変換し始めています...
面白いわ面白いわ(犬頭)。
参考リンク:
[1]https://notebooklm.google/
[2]https://x.com/karpathy/status/1840112692910272898
[3]https://x.com/omarsar0/status/1840145774874898506
[4]https://x.com/yuchenj_uw/status/1840203324571943403
[5]https://github.com/gabrielchua/open-notebooklm
— 以上 —