ニュース

AI ウィークリー レポート | 大型モデルは 9.11 と 9.9 のどちらが大きいか判断できない OpenAI が軽量モデル GPT-4o mini をリリース

2024-07-21

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

大型モデルでは、9.11 と 9.9 のどちらが大きいかを判断できません。

小学生にとって難しい数学の問題は、国内外の多くの大規模な AI モデルをつまづかせています。 9.11 と 9.9 ではどちらが大きいですか?この問題に関して、7月17日、チャイナビジネスニュースの記者は12の大型モデルをテストし、その中でAlibaba Tongyi Qianwen、Baidu Wenxinyiyan、Minimax、Tencent Yuanbaoは正解したが、ChatGPT-4o、Byte Doubao、Dark of the Moon Mian kimi、Zhipu Qingyanは正解した。 、ゼロワン万物知識、ステップスターズユエウェン、バイチュアンジーバイシャオイン、シャンタンディスカッションはすべて間違った答えを導き出し、間違った方法は異なります。ほとんどの大規模モデルは、Q&A で小数点以下の数値を誤って比較し、9.11 が 9.9 より大きいと考えています。

コメント: 間違いの背後には、大規模モデルの数学的能力が低いという長年の問題があります。一部の業界関係者は、生成言語モデルは数値的思考よりも文字通りの思考に近いように設計されていると考えています。ただし、将来的には、対象を絞ったコーパス トレーニングにより、科学の質問に答えるモデルの能力が徐々に向上する可能性があります。

OpenAI、軽量モデル GPT-4o mini を発売、モデルコストは 2 年で 99% 削減

OpenAIは現地時間7月18日、軽量大型モデルの新モデル「GPT-4o mini」を発表した。報道によると、GPT-4o miniは今後、質疑応答ロボットChatGPTにおいてGPT-3.5 Turboの代わりとなり、企業ユーザーは来週からGPT-4o miniにアクセスできるようになるという。 「私たちは、GPT-4o mini が人工知能の応用を拡大し、人工知能をより手頃な価格にすることを期待しています。」 OpenAI の公式 Web サイトの記事によると、GPT-4o mini の投入価格は 100 万あたり 15 セント (0.15 ドル) です。トークン (単語要素) )、出力価格は 100 万トークンあたり 60 セント (0.6 米ドル) で、GPT-3.5 Turbo より 60% 安くなります。 OpenAIは、同社はモデルのパフォーマンスを向上させながらコスト削減も継続すると述べた。 2022 年の text-davinci-003 モデルと比較して、GPT-4o mini のコストは 99% 下がりました。

コメント: OpenAI は次世代モデル GPT-5 をリリースしていませんが、既存の機能に基づいてモデルを更新しており、大規模モデルのコストを削減し続けています。今年は他の大手モデルメーカーも軽量モデルを推進している。 Googleは今年5月に軽量モデル「Gemini 1.5 Flash」を発売した。 Anthropic が 3 月にリリースした Claude 3 シリーズには、軽量の Claude 3 Haiku が含まれています。今年は、パラメーターの量を増やすのではなく、データ量を増やすことで、より小さいパラメーターを使用した大規模なモデルのトレーニングでパフォーマンスを向上できる可能性が示されました。

大型模型メーカー6社が大型模型のデジタル機能不足問題に対応

China Business News の記者は最近、Alibaba Tongyi、Tencent Hunyuan Team、Dark Side of the Moon Kim、MiniMax Conch、Xueersi Jiuzhang、NetEase Youdao などを含む多くの大手模型メーカーに連絡し、インタビューしました。インタビュー中に、彼らは大きな質問に答えました。貧弱なモデル数学の問題。 Alibaba Tongyi Laboratory のプロダクトマネージャーである Wang Xiaoming 氏は、同様の問題は一般的な数学的計算や論理的推論の問題であり、開発者がモデルのトレーニングや使用の過程で頻繁にテストするケースでもあり、大規模なモデルには「正しい答え」があると述べています。 「それは実際には確率の問題です。 Tencent Hunyuan チームは、大規模なモデル自体は確率モデルであり、さまざまな状況下でこのような数値計算や比較の問題を安定して解くのは難しいと述べています。

コメント: 「9.11 と 9.9 ではどちらが大きいですか?」人間にとっては難しくありませんが、大型モデルの場合は、必ずしも答えるのが簡単な質問ではありません。総合的な回答から判断すると、大型モデルメーカーの担当者らは、大型モデルではまだ数値間の計算や比較ルールを正確に制御できていない、同時に大型モデルの能力を人間が探求する必要がある、との見解を示している。非常に早い段階で。多くの業界関係者は、将来的には、基礎となる基本モデルのインテリジェンス レベルを強化し、トレーニング データや外部ツールのレベルからこのような間違いを解決する必要があると考えています。最終的な解決策は、次世代の機能を向上させることかもしれません。モデル。このような事例の発見は、メーカーが大規模モデルの機能の限界について理解を深めるのに役立ちます。

人工知能法は8月1日にEU全土で施行される

欧州連合が発行した世界初の人工知能法(EU AI法)は、8月1日にEU全土で施行される。これは、これまで世界で発表された人工知能の監視を対象とした最も包括的な法案でもある。 EU の人工知能法は、世界的な人工知能規制の基礎も築き、一般データ保護規則 (GDPR) と同じ「ブリュッセル効果」の達成を目指しています。最新の法案によると、規制に違反した企業には最大3,500万ユーロまたは最大年間収益の7%のいずれか高い方の行政罰金が課されることになる。

コメント: EU は常に技術規制の最前線に立ってきました。 EU の人工知能法は、技術規制分野における EU の先見性とリーダーシップを示す世界初の包括的な人工知能規制法です。しかし、この規則は企業の運営コストも増加させることになると、上海大邦法律事務所のパートナーであるYou Yunting氏は、GDPRの施行以来、企業のコスト、特にコンプライアンスコストが大幅に増加したと述べた。人工知能法も同様になると予想されており、企業は新たな規制に投資し、コンプライアンスポリシーを検討する専任担当者を任命する必要があるほか、違反通知の処理や公表システムなどでもコストが増加する。

「大学入試センター試験」参加後の主要7機種のスコアを公開:理系2科目のみ受験可能

これに先立って6月、上海人工知能研究所傘下の新南評価システムであるOpenCompassは、AI大学入学試験の最初のフルペーパー評価結果を発表し、AI受験者がAI以外の3科目で最大303点を獲得できることを示した。国語と数学、数学は全部失敗しました。 7 月 17 日、OpenCompass はさらに、大学入試の合格点と比較できるように、大学入試の 9 科目すべてで 7 つの大規模な AI モデルをテストしました。

AIが大学受験をしたら、どの大学に入学できるのでしょうか? OpenCompass のテストでは、大型モデルが文系試験を受ける場合、最高のスコアは 1 冊の本に「合格」できるが、理科の試験を受ける場合は、最大 2 冊の本しか「合格」できないことがわかりました。今年最も大学入学試験が多い河南省の得点ライン)参考まで)。

コメント: 採点教師の評価から判断すると、人間の受験者と比較すると、現在の大型モデルには依然として大きな限界があります。採点を終えた後、教師たちは、大型モデルは基礎知識の習得においては良好な成績を収めたものの、論理的推論や知識の柔軟な応用という点ではまだ不十分であることに同意しました。具体的には、主観的な質問に答える場合、大規模なモデルは質問の語幹を完全に理解できず、代名詞の方向を理解できないため、不正確な回答が得られます。幾何学の質問の場合、問題解決プロセスは機械的で論理的ではありません。空間論理に関する問題は、矛盾した推論が頻繁に発生します。

リー・フェイフェイが「ユニコーン」を孵化、ワールド・ラボの評価額は10億米ドルを超える

7月17日、中国の著名なコンピューター科学者リー・フェイフェイ氏が設立した「空間インテリジェンス」スタートアップ企業ワールド・ラボの評価額が10億米ドルを超えたと報じられた。このスタートアップは主に人間のような視覚データ処理技術を使用して、AI に高度な推論能力を備えています。

World Labsは今年4月の設立以来、トップテクノロジー投資家のアンドリーセン・ホロヴィッツやAIファンドのラディカル・ベンチャーズなどの投資家とともに2回の資金調達を実施した。同社の最新の資金調達ラウンドは約1億米ドルに達する可能性があると理解されている。リー・フェイフェイ氏、アンドリーセン・ホロヴィッツ氏、ラディカル・ベンチャーズ氏はコメントの要請に応じなかった。

コメント:伝説的な人物として、李飛飛氏の起業家精神は業界からも大きな注目を集めています。リー・フェイフェイは、33 歳でスタンフォード大学コンピューターサイエンス学部の終身教授となり、44 歳で全米工学アカデミーの会員となり、現在はスタンフォード人間中心人工知能研究所 (HAI) の所長を務めています。 )。コンピューター ビジョンの分野におけるベンチマークとなる成果である ImageNet も、彼女によって推進されました。 OpenAIやTeslaで働いたAndrej Karpathy氏や、現在Nvidiaで働くJim Fan氏など多くの弟子を持ち、AI分野の重鎮でもある。

AIチップとクラウドの大手メーカーが世界のAI企業を「買収」

エンタープライズサービスデータベース会社Crunchbaseの統計によると、今年上半期の世界的なAIスタートアップへの融資額は前年同期比24%増の356億米ドルとなり、第2四半期は最も多くのAIスタートアップが参加した四半期となった。近年のAI投資。 China Business News の公開統計によると、NVIDIA は今年、少なくとも 16 社の AI 関連企業に投資または買収しており、資金調達ラウンドのほとんどは総額 1 億米ドルを超えています。 MicrosoftはOpenAIに投資した後、今年は総額1億ドルを超える複数の資金調達ラウンドにも参加した。 Google は、複数の投資プラットフォームを通じて AI エコシステムを広範囲に展開し、少なくとも 31 回の資金調達ラウンドに参加しました。今回の AI 投資ブームでは、AMD、Amazon、SoftBank などが活発に活動しています。

コメント:AIの人気は投資にも直観的に反映されています。 Nvidia や AMD などの半導体ハードウェアを主力事業とするメーカーであっても、Microsoft、Google、Amazon などのクラウドメーカーであっても、大手企業の投資スタイルや嗜好はまったく同じではないことは考えてみる価値があります。モデルベンダーやクラウドベンダーは、大規模なモデルスタートアップを強力に結びつけることに意欲的だ。今年の業界最大規模の資金調達ラウンドを観察すると、基本的な大型モデル、自動運転、AI データ、人型ロボットが最大のホットスポットであることがわかります。

英国、マイクロソフトとインフレクションAI取引に対する独占禁止法調査を開始

英国の独占禁止法規制当局である競争市場庁 (CMA) は最近、Microsoft と Inflection AI の取引に対する正式な独占禁止法調査を開始したと発表しました。今年3月、マイクロソフトはAIソフトウェアのライセンス供与としてAIスタートアップのInflection AIに6億5000万ドルを支払うことで合意した。さらに、Microsoft は、Inflection AI の共同創設者である Mustafa Suleyman 氏と Karén Simonyan 氏、および同社の従業員の大部分を雇用すると発表しました。

コメント: Inflection AI の評価額は約 40 億米ドルであると業界関係者は、Microsoft の行為は Inflection AI を低価格で併合することに等しいと述べています。買収とは異なり、Inflection AI は依然として独自のテクノロジーを保持しています。英国に加えて、米国連邦取引委員会(FTC)も協定を検討しているとの先月報道があった。報道によると、FTCはMicrosoftとInflection AIに召喚状を発行し、過去2年間の関連文書の提出を求めたという。

人型ロボット企業 Zhuji Dynamics がシリーズ A 資金調達を完了

7月15日、チャイナ・ビジネス・ニュースは、総合人型ロボットの新興企業であるZhuji Dynamicsが、China Merchants Venture Capital、SAICグループのプライベート・エクイティ投資プラットフォームShangqi Capital、そして旧株主のFengrui Capital、Oasis Capital、Mingshi Capitalが主導するシリーズA資金調達を完了したことを報じた。が出資に参加しており、資金調達額は明らかにされていない。以前、アリババはZhuji Dynamicsにも投資していた。 Zhuji Dynamics は 2022 年に設立されました。創設者の Zhang Wei は南方科技大学の終身教授です。Zhuji Dynamics の製品には、フルサイズの人型ロボット、四足歩行ロボット、二足歩行ロボットおよび関連ソリューションが含まれます。

コメント: 多くの人型ロボット企業はまだ資金調達の途中です。今年、人型ロボットトラックではファイナンスイベントが絶え間なく行われている。今年1月、Xingdong Eraは1億元以上のエンジェルラウンド資金調達の完了を発表、続いてYushu Technologyは10億元のB2ラウンド資金調達の完了、Kepler Exploration Robotはエンジェルラウンドの資金調達を完了、Galaxy Universal Robotsはエンジェルラウンドの資金調達を完了したと発表した。 7億元の資金調達。インターネット大手のテンセント、バイドゥ、アリババはそれぞれUBTECH、Zhiyuan Robot、Zhuji Dynamicsに投資しており、MeituanはGalaxy Universal RobotsとYushu Robotに投資している。人型ロボット企業が資金を調達したら、次のステップは量産をどのように実現するかだ。

NVIDIAとMistral AIが大型モデルMistral-NeMoをリリース

7 月 19 日のニュースによると、NVIDIA とフランスのスタートアップ Mistral AI は、120 億のパラメータとコンテキスト ウィンドウ (AI モデルが一度に処理できるトークンの最大数) を持つ Mistral-NeMo AI 大規模言語モデルをリリースしました。 128,000 トークンのうち。 Mistral-NeMo AI 大型モデルは主にエンタープライズ環境を対象とし、大量のクラウド リソースを使用せずに人工知能ソリューションを実装します。

コメント: Mistral AI は今年 6 億ユーロの資金調達を完了しており、投資家のリストには Nvidia と Samsung も含まれています。 Microsoftは以前、Mistral AIへの1500万ユーロの投資も発表しており、これはMistral AIの次の資金調達ラウンドで株式に転換される予定だ。 ミストラルAIは大型モデルの発売でエヌビディアと提携しており、大手大手間のバランスを取り協力を模索する方針だ。 Nvidia は、大規模な言語モデルをトレーニングするための合成データを生成するために開発者が使用できるように、以前に Nemotron-4 340B シリーズ モデルをオープンソース化して AI エコシステムへの関与を深めています。