ニュース

openaiの謎のモデル「strawberry」が2週間以内にリリースされることが明らかに 質問に答えるには10秒以上かかり、サブスクリプション価格は10倍になる可能性があります。

2024-09-11

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

先月、openai ceo のアルトマン氏がイチゴの写真を掲載して多くの見出しを飾りました。さて、おそらくイチゴモデルは本当に「成熟」することになるでしょう。

the information によると、chatgpt サービスの一環として、openaiは「strawberry」モデルを2週間以内にリリースする予定だ。

もちろん、最終的な発売日は変更される可能性があるともレポートには記載されているので、注意して進めてください。

信頼できる予想家 @apples_jimmy は、イチゴ モデルが今週リリースされると予想しています。

また同氏は、openaiが10月にgpt-4.xバージョン(gpt-4.5とも呼ばれる)と呼ばれる新モデルをリリースする予定であると述べた。

より強力な gpt-5 モデルについては、早ければ 12 月に発売される可能性があると聞きましたが、念のため、2025 年の第 1 四半期か第 2 四半期には発売されると予想しておくことをお勧めします。

the informationは、イチゴモデルがどのような形で発売されるかは不明だと伝えている。可能性としては、イチゴモデルが単体の製品になる可能性が考えられます。

もう一つの可能​​性は、イチゴモデルです。chatgpt モデル選択メニューに統合されます。, ユーザーは異なるモデルのサービスを自由に切り替えることができます。

以前のレポートでも、イチゴ モデルと他のモデルの最大の違いは次のとおりであると述べられていました。質問に答える前に「考える」方法を知っています。

さらに、イチゴ モデルは数学やプログラミングで優れたパフォーマンスを発揮するだけでなく、より多くの「思考」時間を与えれば、製品のマーケティング戦略などの主観的なトピックに関する顧客の質問にも答えることができます。

情報には次のように記載されています。イチゴ モデルの思考時間は通常 10 ~ 20 秒で、エラーを減らすことができるという利点があります。

また、イチゴ モデルはより多くの時間を思考に費やすため、ユーザーのニーズを完全に理解するために顧客にさらに質問する必要があることを認識できるようになります。

さらに、ストロベリーモデルも gpt-4o モデルといくつかの違いがあります。たとえば、そのオリジナルバージョンgpt-4o のマルチモデル機能はありません、テキスト応答の受信と生成のみが可能ですが、画像を処理することはできません。

the informationでは、これは競合他社も同様の製品を発売しているためではないかと考えており、たとえこの製品がいくつかの点で完璧ではない(画像処理ができないなど)としても、openaiは発売のペースを速めることしかできないと考えています。

この点に関して、内部告発者 @apples_jimmy も次のように述べています。 anthropic と google も密かに新モデルを準備中です。そして米国大統領選挙の頃に発売する計画だ。

さらに、サブスクリプション価格はユーザーの感情を繰り返し刺激してきました。

chatgpt は、新しい有料レベルである chatgpt pro を立ち上げ、すでに一部のユーザーにプッシュしています。料金は月額 200 ドル, 現在の月額20ドルよりも10倍高価です。

もし本当であれば、これはイチゴモデルに関する上記の報告を反映する可能性があります。

同情報はまた、ストロベリーモデルはchatgpt plusと同様にユーザーが1時間あたりに使用できる回数が制限される可能性があるが、サブスクリプション価格が高いモデルの方が応答性が高いと指摘している。

この記事の執筆時点では、openai はこの件について返答していません。

層ごとに「イチゴ」をカットします

openai の「strawberry」モデルは私たちにとって何を意味するのでしょうか?

実はストロベリーモデルの前身は、昨年末に騒動を巻き起こした謎の存在「q○」。

昨年11月、サム・アルトマン氏は何の前触れもなく取締役会から解任され、その通知は会社全体と業界全体に衝撃を与えた。

当時の取締役会が挙げた理由は、安全性とリスク管理に関して彼とチームが合意に達できなかったというものだった。そしてこのリスクは当時の極秘プロジェクト「q*」に関係していた。

このプロジェクトは元々 ilya sutskever 氏が主導していましたが、現在彼は openai を辞めて起業し、ai セキュリティ関連のビジネスを行っています。マスク氏がかつてこのプロジェクトは「人類に脅威をもたらす」と述べたことを考えると、ここで何が起こっているのか疑問に思わずにはいられない。

以前、ザ・インフォメーションとロイターは内部情報の入手に全力を尽くしたが、最終的には確認することしかできなかった。「q*」は数理演算能力が重視

写真提供: ロイター

大きなモデルは「文学」が得意で、言語や文字を巧みに扱うことができ、基本的には人間と同等です。しかし、数学的な演算は決してうまくいきませんでした。ロイター通信によると、「q*」はかつてopenaiに大きな変化をもたらしたものの、当時のパフォーマンスは小学生程度のコンピューティングレベルだったという。

現在知られている最新情報によると、openai 内には、数学的演算において 90% の精度を達成できるプロジェクトがすでに存在しており、これは驚くべき改善です。

写真提供: ロイター

強調しておきますが、「strawberry」がどの段階に到達したかを確認することは現時点では不可能です。

「strawberry」が「q*」のバージョンアップ版として使われるのであれば、数学やコンピューティングのブレークスルーを追求し続けるプロジェクトになる可能性が高いとしか言​​えません。

「数学的計算」と「推論」の関係を直接的に同一視することはできませんが、openai の野心を明らかにしています。

私はいつも推理について話しますが、具体的には何を話しているのですか?

では、「推理」とは一体何でしょうか?

これら 2 つの単語は、実際には明らかに非常に広い定義を持っています。今年の初めに、香港中文大学が率いるチームは、モデルベースの推論能力の包括的なレビューを実施しました。 「推論」の最も基本的な定義は次の 3 つです。

認知的推論: 不完全で一貫性のない知識から意味のある結論を引き出す能力

この種の推論の最も一般的な形式は、ジグソーパズルを組み立てることです。それぞれの小さなピースは、ランダムに 2 つのピースを掴むと、絶対に一致しません。

これらの小さな断片を保持し、それらをつなぎ合わせて、ゆっくりと完成した絵を形成することしかできません。このプロセスには指示やステップ図はなく、多くの場合、感覚と直感に頼らなければなりません。

論理的推論: 前提とこれらの前提間の関係に基づいて順序立てて結論を導き、その結論には暗黙の関係があるか、論理的に確立されています。

数学の問題解決は典型的な論理的推論です。既知の条件と質問に基づいて、段階的に結果を計算します。論理的推論は現在、大規模なモデル開発において「最も難しい骨組み」です。

自然言語推論: これは、世界について新しい結論を引き出すために、明示的知識または暗黙的知識である可能性のある複数の種類の知識を統合するプロセスです。

探偵小説やミステリー小説を読むのが好きな友人には、理解しやすいはずです。この種の推論は、本の中にいくつかの曖昧なヒントといくつかの不明瞭な情報を組み合わせて、殺人者が誰であり、犯罪の過程が何であったかを推測する必要があります。

ロイターが入手したopenaiの内部文書を見る限り、「strawberry」の目的は、計画を立て、インターネットにアクセスし、詳細な調査を実行することだ。

これらは最後の種類の自然言語推論に似ており、それを強化するだけですが、推論能力の向上とみなせるかどうかはわかりません。

しかし、openai は「推論」についてはそれほど厳格ではなく、より大きなビジョンを持っています

2 か月前、openai 創設者の 1 人であるジョン シュルマン氏は、dwarkensh ポッドキャストで、gpt-4 の進歩は主にトレーニング後のテクノロジーによるものであると述べました。

「トレーニング後に人々が関心を寄せる機能を備えたモデルを作成するのは非常に複雑です。これには多額の投資と多くの研究開発作業の蓄積が必要であり、それが障害となります。ある程度。」

ジョン・シュルマンの「推論」の定義は次のとおりです。

「推論とは、何らかの計算が必要な、または何らかの演繹が必要であることを意味します。この定義から、タスクを処理しながら計算や段階的な計算を実行できる必要があります。」

彼の定義では、推論とコンピューティングの動作が高度に拘束されていることがわかり、機械による推論がリアルタイムで実行できることが期待されています。人間と同じように、情報を受信しながら分析および解釈できるのです。

しかし、たとえ数学が苦手でも、物事を論理的に考えることは妨げられず、さまざまな推論を完成させることができます。機械の数学的能力はなぜそれほど重要なのでしょうか?

これは次のように理解できます。数学は決して演算を行うだけではなく、情報を表現する方法でもあります。

数学は、記号形式と意味の正確さに依存する言語であり、1 は 1、0 は 0 です。計算記号や方程式を使用して情報を表現する場合、実際には自然言語よりも低次元になります。

つまり、大きなモデルが「読み書きできる」のは、「計算」に基づいて自然言語をコンピュータ言語に変換しているからです。

この基礎は、歴史上最も重要な数学者の 1 人であるジョージ ブールによって 19 世紀にはすでに築かれました (ブール変数を作成したのと同じブールです)。

ジョージ・ブール

ブールは非常に信心深い人物で、数学的推論を通じて神の存在を説明しようとさえ考えていました。

彼の最終的な結論が何であったかに関係なく、彼が最終的に世界に残した富である「思考の法則の探求」という本は、冒頭で彼の壮大な目標を説明しています。それは、微積分の概念を表現するために微積分の象徴的な言語を使用することです。思考活動の基本法則。

これは、数学的演算における ai のパフォーマンスに関して、人々の期待がもう少し神経質になる理由も説明しています。

数学的言語を突破すれば、思考活動の突破は本当に近づくかもしれません。

openaiテクノロジーのベテランが再び辞任

openai のテクノロジー内部関係者に関する大きなニュースには、必ず大幅な人事異動が伴うようです。

偶然にも、openai の社内従業員数名も今日正式に辞任を発表しました。

たとえば、openai オーディオ agi の元リサーチ ディレクターである alexis conneau は、別の立場で gpt-4o 研究チームの重要な技術メンバーを務めており、起業するために退職すると発表しました。

gpt-4o のリリース前に、彼はそれが人間とコンピューターの相互作用の新時代の到来をもたらすかもしれないと興奮しながら予測しました。

google や meta などの大手企業で豊富な勤務経験を積んだ後、2023 年 4 月に openai に入社しました。彼の言葉を借りれば、主な仕事は gpt モデルに「話す口」を装備することです。

gpt-4oの研究チームの責任者、プラフラ・ダリワル氏はかつてコノー氏を次のように称賛した。

alexis conneau は、openai の誰よりも早く her のビジョンを思いつき、それを実行するためにたゆまぬ努力をしました。

あるいは、openaiで4年半働いてきたarvind neelakantan氏も、今日から「敵陣営」のメタai研究チームに異動した。

彼は、埋め込み、gpt-3 と gpt-4、api と chatgpt などを含む、openai の多くの重要なプロジェクトの開発に参加してきました。

neelakantan 氏は、openai での勤務は彼のキャリアのハイライトであると述べました。 meta ai では、次世代 llama モデルの開発に注力します。

これに関連して、元 openai 開発者関係ディレクターのローガン・キルパトリック氏も辞任の祝福を送りました。

今年の初め以来、openaiは辞任の波を引き起こし、その創設チームは「分裂」さえした。

元主任科学者のイリヤ・サツケヴァー氏はopenaiからの撤退を発表したばかりで、rlhfの発明者の一人であるヤン・ライケ氏も彼の足跡をたどり、同社を去った。

昨年の「パレス・ファイト」の余波を除けば、退任の理由は基本的に異なるが、個人のキャリア計画によるものである可能性もある。

openaiの大幅な人事異動が短期的にaiの競争環境に影響を与える可能性は低いが、同時に、不況の中で未成熟なai業界はもはや1年の猶予を容認できない。

モデルニュースが継続的に露出されることで、今年下半期に再びaiナビゲーションの素晴らしい時代が訪れることを楽しみにしています。

たとえそれがどれほどひどいものであっても、少なくとも今年上半期の退屈な新しい ai テクノロジーよりは興味深いものになるでしょう。

ai テクノロジーの基礎となるモデルの進歩は、当時の gpt-4 の出現のように、アプリケーション側全体の爆発を引き起こす強力な原動力となり、私たちに長い間失われていた驚きをもたらす可能性があると予測されます。

その時までに、私たちユーザーは常に最大の受益者になるでしょう。