ニュース

minimax創始者ヤン・ジュンジエ:自分にできる唯一のことは自分を良くすること|aiフロンティア

2024-09-20

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

編集者注:

中国金融通信社と科学技術革新局日報の子会社である「ai daily」は本日、「insight・ai frontier」インタビューを正式に開始した。インタビューは、国内外の人工知能および大規模モデルの分野における優れた企業、起業家、一流の学者、投資家などに焦点を当てており、数千の業界に力を与える ai に関する最新の探索、実践、考え方をもたらします。 insight・aiは最前線、洞察、先駆者、最前線!

『科捜班日報』9月20日(黄信義記者)ai タイガー 6 社のうちの 1 つとして、minimax は a+ ラウンドの資金調達を完了しました。最新のラウンドはアリババが主導し、金額は 6 億米ドルです。同社の評価額は25億米ドルを超えており、その背後にある投資家にはtencent、sequoia china、hillhouse、idg、mihoyoなどが含まれている。

minimax 内では、同僚はお互いをニックネームでのみ呼びます。創業者の厳俊傑氏については、従業員からはio(花の名前)と呼ばれています。 yan junjie は、かつて sensetime の副社長、研究所の副社長、スマート シティ ビジネス グループの cto を務めていました。 2021年12月、sensetimeの上場前夜にyan junjie氏はsensetimeを退職し、minimaxを設立した。

最近、minimax は初の ai 高解像度ビデオ生成モデル abab-video-1 をリリースしました。記者会見後、厳俊傑氏は科学技術革新委員会日報などのメディアとのインタビューで、新世代技術を採用したabab7シリーズモデルが数週間以内に正式にリリースされ、その効果はgptに匹敵すると明らかにした。 -4oモデル。大型モデルの商品化の難しさについて話すと、yan junjie 氏は、これはまさに業界のテストであり、このテストに合格した企業だけが成功できると答えました。

「誰も製品を使用しない場合、または製品が収益を上げない場合、ユーザーを責めることはできません。ユーザーのほとんどは、自分のテクノロジーか、十分に優れていない製品を責めることしかできません。これは次のように考えることができます。試験に合格できるなら辞めればいい。」

記者会見に出席したヤン・ジュンジエ

▌競争は避けられず、私たちはより強くなれる領域を無限に拡大しなければなりません。

gpt に代表される人工知能の新たな波の台頭により、汎用人工知能 (agi) の実現に向けてより多くの想像力の余地が生まれています。

ヤン・ジュンジエは次のように信じています。agi は派手なものではなく、誰もが生活の一部になれるものです。

「たとえば、人々はdouyinやビデオアカウントを見るとき、それが推奨アルゴリズムに基づいたショートビデオのコンテンツ配信プラットフォームであることに気づかず、むしろdouyinやwechatがみんなの生活の一部になっていると感じます。agi も同様で、ai が携帯電話のように日常的に使用されるようになると、agi が実現されます。もちろん時間はかかりますが、一歩一歩頑張っていけると思います。

ai が 5 年という短期間でもたらす可能性のある変化について、yan junjie 氏は、ai の助けにより、5 年後には誰もが自分の iq の上限を大幅に引き上げ、最も高い iq を持つ人よりも高くなるだろうと信じています。何百人もいる会場で。 「もちろん、aiの力を借りて人間のiqの上限がどの程度改善されるかは定かではありません。」

2024年に入り、大型モデルの競争はさらに激化する。大手メーカーの急速な攻撃に直面して、新興企業の生存空間は圧迫されている。

「競争は避けられない」とyan junjie氏は嘆いた。世界をリードする製品を。他の新興産業の発展の歴史もこのようなものであり、大型モデルは大きな社会的価値を生み出す可能性が高いため、確かに競争は激しいはずだ。これが開発の客観的法則です。”

ヤン・ジュンジエ氏は、新興企業が熾烈な競争で勝てないのであれば、淘汰されるべきだと考えている。

自分より何倍も大きい会社があなたと競争し始めると、無駄なものがあることに気づくでしょう。なぜなら、それらの大手メーカーはあなたよりも何百倍も優れているからです。私たちにできることは、強くなる可能性のあるものを無限に増幅(強く)することです。それは要約すると 2 つのポイントです。1 つはテクノロジーをどう改善するか、もう 1 つはユーザーとより良い共創をどのように生み出すかです。これらの点はどちらも非常に批判的な判断を必要とし、非常に長期的な蓄積が必要です。 」

▌マルチモーダルな大規模モデルは、基盤となるインフラストラクチャもアップグレードする必要があることを意味します

ビデオ生成された大規模モデルの分野は、過去数か月間非常に活発になってきました。 shengshu technology が作成した大型ビデオ モデルである vidu がリリースされ、zhipu ai が大型ビデオ生成モデル「qingying」を正式にリリースしました。sensetime が c エンド ユーザー向けの最初の大型の制御可能なキャラクター ビデオ生成モデルである vimi をリリースしました。ステーションベースの ai ビデオ作成プラットフォーム「xunguang」、kuaishou keling ai が web ページで正式に開始され、liveportrait と呼ばれる制御可能なポートレート ビデオ生成フレームワークがオープンソース化されました。

最近、minimax は初の ai 高解像度ビデオ生成モデルもリリースしました。 yan junjie 氏は、マルチモーダル コンテンツは人間のコミュニケーションの重要な部分であるため、マルチモーダルな大規模モデルが唯一の進むべき道であると考えています。

「現在、私たちが毎日読んでいるコンテンツのほとんどはテキストではなく、動的なコンテンツです。xiaohongshu を開くと写真やテキストが表示され、douyin を開くとビデオが表示され、さらには物を購入するために pinduoduo を開くこともあります。 、ほとんどの場合、写真が表示されます。人間社会にとって、大規模モデルの中心的な意味は、情報のほとんどがテキストではなくマルチモーダル コンテンツに反映されることです。非常に高いユーザー カバレッジと非常に深い使用率を実現するには、(マルチモーダル) 動的コンテンツを出力する唯一の方法は、純粋なテキストベースのコンテンツを出力するだけではありません。これは非常に重要な判断です。

マルチモダリティは一般に楽観的ですが、業界は検討中に、テキスト モデルと比較してビデオ生成モデルの開発が明らかに難しいことも感じていました。

この点に関して、yan junjie 氏は、ビデオのテキストは当然ながら非常に長いため、ほとんどの場合、ビデオの作業の複雑さはテキストの複雑さよりも確かに難しいと考えています。たとえば、ビデオには数千万の入力と出力が含まれており、当然のことながら処理が困難になります。第二に、ビデオの量が膨大です。別の例として、5 秒間のビデオの重さは数メガバイトですが、5 秒間のテキストの読み取りは 1k 未満になる可能性があり、これは数千倍のストレージ ギャップになります。課題は、データを処理する方法、データをクリーンアップする方法、および以前にテキストに基づいて構築された基盤となるインフラストラクチャにラベルを付ける方法にあります。これは、インフラストラクチャもアップグレードする必要があることを意味します。

「さらに、より忍耐が必要です。テキストを書くためのオープンソースのものはたくさんあります。オープンソースに基づいて研究開発をした方が早いでしょう。しかし、ビデオについてはオープンソースのものはそれほど多くありません。それが必要です」もう一度やり直すには、さらに忍耐が必要です。」

▌客観的に言えば、価格競争によりモデルへの問い合わせ数が増加した

今年に入ってから、多くの大手模型会社がai大型機種の人気と引き換えに価格競争を始めた。 yan junjie 氏は、客観的に見て、価格競争によりモデルコールの数が実際に増加したと考えています。

「国内モデルの価格競争が始まると、当初は大型モデルは高価だと考えていた企業の多くが、大型モデルは安くて安心して使えると考えるようになりました。その結果、驚くべき発見があったのです」大型モデルの価格競争の後、多くの非常に伝統的な企業が大型モデルの使用に積極的になり始めました。とにかくコストが安いので、何か問題が起こっても、もう一度電話すれば大丈夫だと感じています。客観的に言えば、これによりモデル呼び出しの数が大幅に増加します。 」

国内モデル間の競争が熾烈を極める中、minimaxは海外市場にも進出している。ヤン・ジュンジエ氏は「国内モデル間の熾烈な競争があるからこそ、我々は前に進まなければならない。少なくとも今では非英語圏の言語でもgptに匹敵するレベルに達することができる。競争」と述べた。などなど、色々なことが避けられないので、頑張ってください。楽観的な側面は確かにあり、大型の国産モデルの使用は実際に大幅に増加しており、海外では中国製モデルの競争力が確実に高まっていると思います。 」

具体的な商業化モデルについてyan junjie氏は、全社的な商業化は2つの形態に分けられると紹介し、1つはbサイド向けのminimaxオープンプラットフォーム、もう1つは製品内の広告メカニズムであると述べた。

「現在、minimax オープン プラットフォームには、有名なインターネット企業や伝統的な企業などを含む 30,000 を超える企業顧客と開発者がいます。すべての企業が自社でできるわけではないため、ユーザーは当社の音声およびビジュアル機能を使用します。当社は良きパートナーです。」第二に、minimax の製品には収益化できる広告メカニズムもあります。ただし、この段階で最も重要なことは、それを商業化することではなく、そのテクノロジーを真に広く利用できるようにすることです。」

現在のところ、中国には、zhipu ai、baichuan intelligence、zero one thousand things、dark side of the moon、minimax、step star の 6 社の独立系大規模モデル スタートアップがあり、「ai の六小虎」と呼ばれています。。金沙江ベンチャーキャピタルのマネジングパートナー、朱暁湖氏はメディアのインタビューで、大型モデルは高すぎて商業化で自活するのは不可能だと率直に語った。これらのスタートアップにとって最善の結果は、大手メーカーに販売することです。

投資家朱暁湖氏の発言と大型モデルの商品化の難しさについて話し、厳君傑氏は、これはまさに業界の試練であり、このテストに合格した企業だけが成功できると答えた。

「誰も製品を使用しない場合、または製品が収益を上げていない場合、現時点ではユーザーを責めることはできません。いずれにせよ、責任を負えるのは自分のテクノロジーか、不十分な製品だけです。私たちはそれをそのように見ています。」

yan junjie 氏の見解では、qq は 2000 年にお金を稼ぐ方法を知りませんでした。qq は数多くの商業収益化計画を試みましたが失敗しました。しかし、最終的にはモバイル付加価値サービスとゲームを発見し、すべてこのプロセスを経ることになります。 「これは業界の試験ともいえる。試験に合格できれば逃げられる。不合格なら(会社は)潰れるべきだ」。

インタビュー中、yan junjie 氏は業界の競争や企業の将来性について常に比較的冷静な様子でした。「確かに、ユーザーを責めることはできませんし、エコシステムを責めることもできません。(多くのことについて)十分にうまくいかなかった自分自身を責めることしかできません。少なくとも、私たちは懸命に取り組んできました。改善できることを願っています。これは、私たちにできる唯一のこと。」

(黄信義、科学技術革新委員会日報記者)
レポート/フィードバック