私の連絡先情報
郵便管理者@information.bz
2024-08-14
한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina
賢いもの
著者 李水清
編集者のユンペン
AI が大幅に進歩するたびに、研究者はよく「いつになったら AI に論文を書かせるのですか?」と冗談を言います。
今、AI が科学研究論文を作成するライティングコストは約1万円と低コストで実現。15ドル。
8月14日のウィズダムニュース、8月13日、日本のSakana AIチームはオックスフォード大学とブリティッシュコロンビア大学の研究者と協力して、AI科学者、大規模なモデルに基づいた自動科学研究エージェント (エージェント) です。
幅広い研究分野を与えれば、人間と同じようにAI分野の論文を作成することができます。
“AIプログラマー「プログラミング スキルは AI 科学者の能力の一部にすぎません。ブレーンストーミング、コード実行、実験結果の要約、視覚化、自動レビューそれは大したことではありません。
たとえば、「デュアルスケールの拡散: 低次元生成モデルの適応機能バランシング」というタイトルの次の論文は、AI 科学者によって書かれました。 AI 科学者が独自に完了し、同僚によってレビューされた実験では、彼らが完成した論文は優れた実証結果を達成し、次の成果を達成することができました。機械学習は「弱い受け入れ」基準を満たしています。
論文アドレス:https://sakana.ai/assets/ai-scientist/adaptive_dual_scale_denoising.pdf
チームは、AI 科学者プロジェクトのさまざまな最先端のモデルを引用しました。GPT-4o とソネットなどのクローズドソースモデル、およびDeepSeek と Llama 3およびその他のオープンソース モデル。
AI 科学者は主に次のような点を指摘していると報告されています。
1. これはAI を完全に活用自動化された科学研究システム、機械学習分野研究。
2.実現されるチェーン全体の自動化を検討する、インスピレーションから、コードの作成と実行から、実験結果の要約と視覚化、そして最終的には完全な科学論文の執筆に至るまで。
3. 革新的に導入します自動ピアレビューメカニズム、出力された論文を評価し、フィードバックを提供し、結果を継続的に最適化するために使用されます。評価精度は人間レベルに近い。
4. この自動化された科学研究プロセス連続サイクル、知識をオープンにして継続的に蓄積し、人類の科学コミュニティの運営モデルをシミュレートします。
5. 予備テストでは、機械学習に関与しています複数の分野で成果を上げる、のように拡散モデル、Transformer アーキテクチャ、Grokking他の分野でも貢献がなされています。
AI 科学者の論文アドレス: https://arxiv.org/abs/2408.06292/
AI サイエンティストのオープンソース コードと実験結果のアドレス: https://github.com/SakanaAI/AI-Scientist
▲論文「AI Scientist: 完全自動化されたオープン科学的発見に向けて」
1. 4つのステップで科学研究論文を完成させ、AIサミットの合格基準を満たす
AI詩人、AI画家、AIプログラマーの名前は聞いたことがありますが、今ではAI科学者も登場しています。
AI Scientistは、最先端の大型モデルを駆使した全自動紙生成システムです。
それ基本的な初期コードベースから始める、GitHub 上の既製のオープンソース研究コードなど、与えられた幅広い研究分野、AI 科学者は次からタスクを完了できます。クリエイティブな構想、文献調査、実験計画、実験の反復、チャート作成、論文作成から予備レビューまで作業の全プロセスは、深い洞察に富んだ学術論文を作成するために実行されます。
さらに驚くべきことは、AI 科学者ができることです。オープンサイクルでの連続運転、以前のアイデアとフィードバックを継続的に学習して、その後の研究アイデアを最適化します。人間の科学コミュニティの運営モデルをシミュレートします。
▲AI科学者の模式図
AI サイエンティストのワークフローには主に次のものがあります。4つの主要なリンク:
創造性が芽生えます:AI 科学者は、指定された開始テンプレートから「ブレインストーミング」モードを開始し、既存のトピックに関する一連の新しい研究の方向性を発掘します。このテンプレートには、基本的なコード フレームワークが含まれているだけでなく、スタイル ファイルと章タイトルのプリセットを含む LaTeX フォルダーも付属しており、その後の論文作成の基礎を築きます。自由な探索の過程で、AI 科学者は提案されたアイデアの独創性を保証するために学術検索エンジン Semantic Scholar も使用します。
実験の反復:研究の方向性が決まると、AI科学者は実験段階に入ります。実験計画を自動的に実行し、データを収集し、実験結果を視覚的に表示するグラフを生成します。同時に、AI 科学者は各チャートの内容を詳細に記録し、実験ノートやグラフィック素材がその後の論文執筆に包括的なサポートを提供できるようにします。
論文執筆:実験が完了したら、AI 科学者は LaTeX 形式を使用して、明確な構造と詳細な内容の論文を作成し、読者に研究結果を示します。執筆プロセスでは、Semantic Scholar を使用して、関連分野の文献を自動的に検索して引用し、論文の学術的かつ信頼性を高めます。
自動レビュー:論文の品質を向上させるために、チームは大規模な言語モデルに基づいた自動レビュー システムを特別に開発しました。このシステムは、生成された論文を人間に近い判断で客観的に評価し、改善提案を行うことができます。このフィードバックは、AI 科学者が現在のプロジェクトを最適化するのに役立つだけでなく、将来の研究に貴重な参考資料も提供します。この継続的なフィードバック ループを通じて、AI 科学者は研究結果のレベルと影響力を継続的に反復的に改善および強化できます。
最先端の LLM テクノロジーと組み合わせると、AI 科学者は次のようなことも可能になります。トップクラスの機械学習カンファレンスの「弱い受け入れ」基準論文を書いて合格した自動レビューシステムが認知される。
2. AI科学者による論文発表:拡散モデル、言語モデリングなどの分野をカバー
発表の中でチームは、AI科学者が作成した機械学習分野の一連の論文を発表し、拡散モデル、言語モデリング、グロッキングなどの分野における科学研究能力を実証した。
1. 拡散モデル: 「DualScale Diffusion: 低次元生成モデルの適応型特徴バランス」
論文アドレス:https://sakana.ai/assets/ai-scientist/adaptive_dual_scale_denoising.pdf
コードアドレス: https://github.com/SakanaAI/AI-Scientist/tree/main/example_papers/adaptive_dual_scale_denoising
2. 言語モデリング: 「StyleFusion: 文字レベル言語モデルにおける適応型マルチスタイル生成」
論文アドレス:https://sakana.ai/assets/ai-scientist/multi_style_adapter.pdf
コードアドレス: https://github.com/SakanaAI/AI-Scientist/tree/main/example_papers/multi_style_adapter
言語モデリング: 「Q-Learning による Transformer の適応学習率の実装」
論文アドレス:https://sakana.ai/assets/ai-scientist/rl_lr_adaptation.pdf
コードアドレス: https://github.com/SakanaAI/AI-Scientist/tree/main/example_papers/rl_lr_adaptation
3. Grokking: 「Grokking のロック解除: 変圧器モデルにおける重み初期化戦略の比較研究」
論文アドレス:https://sakana.ai/assets/ai-scientist/weight_initialization_grokking.pdf
コードアドレス: https://github.com/SakanaAI/AI-Scientist/tree/main/example_papers/layerwise_lr_grokking
3. 「描画」能力が不十分で、2 つの数字の大きさを正確に比較することが困難
現在の大規模モデルの開発レベルでは限界があり、AI 科学者には依然として欠点があります。
現在、AI 科学者はまだ視覚処理機能がない, そのため、論文内の視覚要素や図のレイアウトの問題を自動的に修正することはできません。
たとえば、生成されるグラフは明確さを欠く場合があり、表がページ境界を超える場合があり、ページ全体のレイアウトが乱雑になることがよくあります。マルチモーダル基本モデルの導入により、この問題を根本的に解決できると期待されています。
さらに、AI 科学者がアイデアを実装したり、ベースラインの比較を行ったりする場合、不適切な操作による誤解を招く結果。
同時に、結果を書いて評価する際に、次のような重大な間違いを犯すこともあります。2 つの数値を正確に比較するのが難しい、これは大きなモデルの既知の欠陥です。この問題を軽減するために、チームはすべての実験結果が再現可能であり、すべての実行ファイルが適切に保存されていることを確認しました。
レポートの中で、チームは AI 科学者の現在の限界と将来直面する可能性のある課題についての詳細な分析を提供しました。
4. AI 科学者は「賢く行動」している: 独自にスクリプトを変更し、AI のセキュリティ リスクを引き起こしている
研究チームはまた、AI 科学者が、次のような「ちょっとした賢さ」によって成功の可能性を高めようとすることがあるということも観察しました。自分でスクリプトを変更して実行する。論文の中でチームは、この動作がもたらす可能性のある AI セキュリティ リスクについて深く議論しました。
たとえば、1 回の実行中に、実際にはコードを編集しました、システムコールを通じて自分自身を無限ループで実行させます。
またあるときは、実験に時間がかかりすぎて、チームが設定したタイムアウト制限を超えそうになりましたが、効率を向上させるためにコードを最適化する代わりに、実験を通過しようとしました。コードを変更してタイムアウトを延長します。
コードを変更しようとする具体的な例をいくつか示します。
こうした問題は、AI 科学者の動作環境をサンドボックス化することで軽減できます。完全なレポートでは、チームは安全なコード実行とサンドボックス化について詳しく説明しています。
結論: AI 科学者がデビューし、その破壊的なイノベーション能力を検証する必要がある
将来に目を向けると、Sakana AI の目標は、AI 科学者をオープン モデルを備えた閉ループ システムに適用し、AI の継続的な自己改善を促進することであると述べました。 AI 科学者は、AI によって完全に推進される新しい科学の世界をもたらします。大規模な言語モデルによって権限を与えられる研究者だけでなく、査読者、フィールドチェア、さらには学術会議システム全体も含まれます。
しかし、それによって人間の科学者の地位が弱まるとはサカナAIは考えていない。それどころか、新しいテクノロジーの出現に伴い、科学者の役割はより多様化し、科学研究の分野でより高いレベルに移行するでしょう。科学研究の発見プロセスを自動化し、AI 主導のレビュー メカニズムを組み込むことにより、主に科学技術分野におけるイノベーションと最も困難な問題の解決策への道が開かれます。
現在の AI 科学者は、拡散モデルやトランスフォーマーなどの成熟したテクノロジーに基づいて革新する並外れた能力を示していますが、そのようなシステムが本当に破壊的な新しいアイデアを思いつくことができるかどうかを検証するにはまだ時間がかかります。
出典:さかなAI