ニュース

ファーウェイ・ハッブルは清華大学の2つのグループに密かに投資

2024-08-20

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

文/王碩国 編集/ヤン・ツィウェイ

ファーウェイ・ハッブルがひそかに投資してきた2大モデル企業が次々と新開発を発表した。

8月中旬、Facewall Intelligenceは、同社の大規模言語モデルMiniCPMシリーズが2月の発売以来100万件以上のダウンロードを受けたと発表した。

7 月末、Shenshu Technology は世界に進出し、Sora と比較してパフォーマンスをベンチマークした Wensheng Video の大型モデルである Vidu を発売しました。

Wall-facing Intelligence と Shengshu Technology はそれぞれ 2022 年と 2023 年に設立され、コアチームは全員清華大学の出身です。 Wall-Facing Intelligence の CEO は、Zhihu の元 CTO である Li Dahai 氏であり、Shengshu Technology の CEO は、清華大学コンピュータ サイエンス学部で学士号と修士号を取得した Tang Jiayu 氏です。

AI分野は注目を集めており、ファーウェイ・ハッブル社はこの2人の若い才能の可能性を楽観視している。

新しいチーム

ハッブル投資はファーウェイが全額出資する投資機関です。

Qichacha によると、同社にはハッブル技術投資有限公司と深センハッブル技術投資パートナーシップという 2 つの事業体がある。

これまでファーウェイ・ハッブルの投資はハードテクノロジーに重点を置いていたが、今年は清華の最先端企業2社を相次いで支援し、AI分野に重点を置いていることが示された。

IT Orangeのデータによると、ハッブル社は今年、人工知能分野で相次いで投資を行っており、累計投資額は1億3,200万元に上る。

大型モデルの方向では名門校のエリートを好む。

同社に投資した2社は創業チームの構造が似ており、どちらも清華大学の支援を受けている。

Shengshu Technology の中心メンバーは清華大学の人工知能研究所の出身であり、Wall-Facing Intelligence の創設チームは同校の自然言語処理研究室 (THUNLP) から生まれました。

清華顔のグループがバイオテクノロジーの上級管理職を形成しています。 CEOに加えて、その主任科学者は清華人工知能研究所の副所長であるZhu Junであり、CTOのBao FanはTang Jiayuの学生であり、Zhu Junの研究チームのメンバーです。

Shengshu Technologyは昨年6月から8月にかけて2回連続で資金調達を完了し、総額数億元を受け取った。今年6月、ハッブルは株式に投資し、A+ラウンドの資金調達に参加した。

壁に直面した知性の成長経路も同様です。

共同創設者のLiu Zhiyuan氏は清華大学コンピュータサイエンス学部の博士課程指導者であり、同社のCTO、Zeng Guoyang氏(26歳)はコンピュータの自然言語処理を研究の方向性としており、コンテストの推薦学生であり、清華大学自然言語処理研究室2年生。

李大海氏によると、壁に面したインテリジェント科学研究チームは100人以上で構成されており、その80%が青北大学を卒業しており、平均年齢はわずか28歳で、権威ある雑誌や学会で100件以上の論文を発表しているという。

Wall-face Intelligence を設立する前、Li 氏は Zhihu の CTO を務め、プラットフォームの検索および推奨ビジネスを一から構築し、AI の「インテリジェント コミュニティ」を立ち上げ、月間アクティブ ユーザー数を増加させました。

昨年は、ChatGPT が非常に人気があり、AGI (汎用人工知能) について話題になっていました。彼は会社の中心メンバーとチャットしました。 AGI が皆の信念であることを確認した後、思い切って参加してください。

彼の元雇用主は彼の起業家精神を支援し、同年4月、Face Wall IntelligenceはZhihuから数千万元の投資を受けた。 1年後、ハッブル社が株式を取得した。

継続的に新製品を発売する

どちらのスタートアップも比較的短期間に新製品を発表しました。これは、ファーウェイやハッブルなどの機関からの投資を呼び込む重要な理由です。

4 月下旬、Shengshu Technology は清華大学と提携し、大規模なビデオ モデル Vidu をリリースしました。 7 月末に、Vidu が世界的に発売され、Wensheng Video と Tusheng Video の 2 つのコア機能が開放され、4 秒と 8 秒の 2 つの継続時間オプションと最大 1080P の解像度が提供されました。

Vidu は 4 秒のクリップをわずか 30 秒で生成します。現在、ユーザーは電子メール アドレスで直接登録して Vidu を体験できます。

レポートによると、Vidu によって生成されたビデオは滑らかで一貫性があり、明らかなフレーム挿入現象がなく、レンズ言語が豊富で、ロングショット、クローズショット、クローズアップなどのさまざまなレンズを切り替えることができます。

Shengshu Technology のチーフサイエンティストである Zhu Jun 氏は、「Vidu のパフォーマンスは、16 秒の長期保存と意味理解の点で非常に優れています。」とコメントしました。

壁に直面しているインテリジェンスも常に新しい動きを推進しています。

5月には大型モデル「Luca」を発売した。 Li Dahai 氏は、Luca の多言語モデル機能は ChatGPT と同等であると述べました。

同月、壁に面した MiniCPM-V2.0 が発売されました。これは、複雑な細部の街路風景を正確に識別し、2,300 年以上前に遡る清華伝票の古代の手書き文字を読み取ることができます。

Face Wall Intelligence は昨年の初めに、ChatDev インテリジェント ソフトウェア開発プラットフォームを立ち上げました。小規模なゲーム制作やWebサイト開発、クリエイティブデザインなどのニーズを持つユーザーは、ChatDevを通じてプロジェクト名と関連アイデアを記述するだけですぐに実装できます。

Li Dahai 氏の言葉を借りれば、一般のユーザーは「たった 1 杯のコーラで、1 ドル未満のコストで」小さなソフトウェアを作成できます。

まずは商品化が実現されました。 Face Wall Intelligence は、China Merchants Bank、Digital Network、Zhihu などと協力して、金融、教育、スマート端末などのシナリオにテクノロジーを適用しています。

たとえば、6月末には、同社が開発した人工知能支援裁判システムが深セン中級人民法院で稼働し、訴訟提起、ファイル審査、法廷審理、文書作成などのプロセスをカバーした。

今年 1 月の試験運用以来、このシステムは 291,000 件の訴訟の提起を支援し、11,600 件の文書の初稿の作成を支援しました。

新しい方法を見つける

李大海と唐家宇は同じ特徴を持っており、先人たちがたどった道について迷信を抱いていません。

たとえば、GPT は「大きな努力は奇跡を生む可能性がある」と強調していますが、壁に直面しているチームのアプローチは、小さなモデルを通して大きなモデルのパフォーマンスを予測することです。最初に 0.009B から 0.03B の範囲のパラメーターを使用してモデルでトレーニングし、次に予測パフォーマンスを 2.4B モデルに推定し、最後に 2.4B モデルをトレーニングします。

この方法では、最初に小さなモデルを試してパラメータを調整すると、半分の労力で 2 倍の結果が得られます。

会社設立に先立って、北京知源人工知能研究所の「啓発」プロジェクトのメンバーとして、Wall-Facing チームは 2020 年に大規模言語モデルのトレーニングを開始しました。

過去の経験により、大規模なモデルにはどのような種類のデータが必要かがわかります。

「誰もが誤解に陥り、データの絶対量に注目しすぎてしまいがちです。実際には、データの品質、データの使用方法、データの理解の方が重要です。」言った。

リソースの制約のため、チームはコストを削減するために分散アクセラレーションやパラメータの微調整などの方法を長年使用してきました。 2022 年には、壁に面したチームのパラメータ微調整作業も Nature サブジャーナルに掲載されました。

Shengshu Technologyのプレイスタイルも似ています。

技術ロードマップでは、Shengshu は Sora と同じコンバージド アーキテクチャを使用していますが、製品パスでは 2 つは異なります。

Sora チームは、Open AI の技術力と Microsoft のコンピューティング能力に裏付けられた、All in 長いビデオを選択しました。スタートアップがデジタル技術を開発するための条件は比類のないものです。

Tang Jiayu 氏のチームは 2D 画像から始めて、その後 3D およびビデオ分野に拡大することを選択しました。

ビデオは基本的に時系列の画像を拡大したものであり、データ収集、クリーニング、注釈付け、効率的なモデル トレーニングなどの画像に対するエンジニアリング作業を再利用できます。

2023 年を通じて、Shengshu の主なリソースは画像と 3D に置かれます。 4 秒のショートビデオ生成が開始されたのは今年 1 月のことです。 Sora が 2 月にリリースされた後、同社の進歩は加速し、4 月には 16 秒の短いビデオを生成できるようになりました。

広大な模型トラックで国内外のチームが「筋肉の鍛え方」を競い合います。これら 2 つの清華チームは準備を始めたばかりで、良い結果を達成することを楽しみにしています。

それまでに、早期に投資したファーウェイ・ハッブルは超過利益を獲得すると予想されている。