ニュース

成都のビッグモデルへの期待 | Mingtu Technology との対話: メタバースは依然として重要な開発トレンドであり、その起爆剤は「デジタル人材」であるべき

2024-08-07

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

成都の大きなモデルを予想する人工知能の開発は本格化しており、何千もの産業と統合され、新たな技術力が噴出しています。人工知能競争の鍵となる大型モデルは今年、収益化元年を迎える。レッドスター首都局は、この産業競争において、成都の人工知能産業の複合成長率が過去3年間で40%を超え、「人工知能技術産業の競争力」が国内で6位にランクされたことに注目した。四川省は今年、人工知能を「No.1イノベーションプロジェクト」に挙げたこともある。最近、レッドスター首都局は成都の多数の大手AIモデルメーカーと独占インタビューを実施し、人工知能トレンドにおける「成都パワー」について話し合いました。
今年5月、成都明図科技有限公司(以下「明図科技」)の大型モデル「明図WorkGPT」が「生成人工知能サービス管理暫定措置」の申請・承認を通過した。さらに遡ること今年 2 月、Mingtu Technology の作品コンテンツ生成アルゴリズムは、National Internet Information Office の深層合成サービス アルゴリズムの登録を無事に通過しました。それ以来、Mingtu Technology は「二重登録」を備えた大手モデルメーカーになりました。
最近、Red Star Capital BureauはMingtu TechnologyのXiao Xuesong会長と会談しました。同氏は、「強化学習」は垂直モデルの中核となる機能とみなされるべきだと考えている。デジタル人材は、メタバースが再び台頭し、新興産業に発展するための重要な触媒です。
Xiao Xuesongの写真提供:インタビュー対象者
「学校」シーンがもっと早く始まるかもしれない
レッドスター資本局: デジタル人間のクローンになるという会社の本来の意図は何ですか?同社の垂直モデルは何が優れているのでしょうか?トレーニングではどのような点に重点が置かれますか?
シャオ・シュエソン:デジタル ヒューマン アバターを作成する本来の目的は、全員の反復的で非効率な作業をすぐに人工知能に置き換えることです。現在 3 つのフォームが表示されています。
1 つ目は APP で、クローンを作成するすべての人に相当します。これは、デジタル クローンに知識を与え、基本的な機能やビジネス機能 (執筆の支援、ビデオの作成の支援など) を与えることができます。
2 番目の形式は、デジタル ヒューマンとボックスまたはデスクトップ オフィス ロボットを組み合わせてインテリジェント端末を形成することです。たとえば、デジタル ヒューマンのクローンを大画面に埋め込むと、ボックスを通じて他の人と会話したり、タスクを手配したりできます。 ;
3番目の形態はロボットに埋め込まれており、物を手に入れるのを手伝ったり、顧客を迎えたりするなど、あなたの指示に従っていくつかの動作を実行できます。
「Mingtu WorkBrain」と呼ばれる包括的なモデル構造があり、認知知能の部分は垂直モデルに属します。そのパラメータ量は 150 億から 200 億に及び、人事責任、職務責任、作業プロセス、管理システム、プロジェクト管理仕様、その他の知識を含むオフィス データをトレーニングに使用します。
当初はオフィス分野に焦点を当て、オフィスプロセスにおけるデータの集計・分析を行っていました。最近では、医師や学生、教師のデジタルヒューマンアバターなど、病院や学校などへも展開しており、関連意図も急速に強化できます。
Red Star Capital Bureau: デジタル ヒューマン アバターのアプリケーション シナリオはどこにありますか?また、実装に向けた最速の方向性は何ですか?
シャオ・シュエソン:たとえば、オフィスのシナリオでは、ほとんどのアプリケーションは従業員の週報や作業概要などのタスクに重点を置いており、デジタル ヒューマン アバターは指示に従って迅速に作業を完了でき、デジタル ヒューマン アバターを使用してグループ コラボレーション機能を実現することもできます。
あなたが学校の学生の場合、コースを学習する能力とデジタル アバターが組み合わされて、学習上の問題についてアバターと直接コミュニケーションをとることができます。私たちは、中国電子科学技術大学の認知知能研究室と共同で、試験問題や宿題を採点する機能とデジタル分析を組み合わせた試験システムを開発しました。このデジタル分析は、学生がどの知識ポイントを自動的にチェックするのにも役立ちます。問題解決のプロセス中に習得していないデジタル クローン 生徒は、習得していない知識ポイントに焦点を当てるように指示されます。
心理カウンセリングの設定では、自分のデジタル アバターとのコミュニケーションはプライバシーの問題を伴わず、心理機関の介入よりも簡単である可能性があります。
健康の分野、特に高齢者向けでは、このグループの人々の遺伝データを、健康診断の内容を含むデジタル人間のアバターと組み合わせることができます。自分自身の健康情報のセキュリティを確保する一方で、その健康情報に基づいてユーザーが毎日の健康的な生活習慣を維持するのに役立ちます。また、一部の病院では独自のスマート情報システムと順次統合し、医師や病院が患者サービスを提供できるよう支援しています。
さらに、学生が新しいものをより早く受け入れるようになるため、「学校」のシーンはより早く爆発する可能性があると判断しています。一部の国内大学はすでにデジタル人間のクローンを作成しようとしています。 「クローン」は自分の「アシスタント」に相当し、勉強、仕事、健康に関する自分のデータを「与える」ことができ、計画を完了したり、事前の準備をしたりするのに役立ちます。
レッドスター首都局:この数字は以前に見られた数字とどう違うのですか?どのレベルの相互作用を実現できますか?将来どのような状態を目指していますか?
シャオ・シュエソン:デジタル人間は 4 つの時代を経ました。第 1 段階は、IP に相当する二次元イメージを結合する段階です。第 2 段階は、人間の表現、音声、形状、デジタル人間を組み合わせた仮想デジタル人間の段階です。第三段階は、文化観光やテレビ局でよく見られるデジタル人材放送番組などの大規模モデルの初期統合であり、第四段階は「産業デジタル人材」であり、サービス産業、生産産業、農業、など、細分化された分野内とデジタル担当者が深く結びつくと同時に、産業用デジタル担当者も上流、下流のユーザーと連携してグループコラボレーションを実現します。 「データ知識の産業化」と「グループインテリジェンスの産業化」は「産業デジタル人材」の典型的な兆候であり、現在は第4段階に入っています。
また、本来の AR や VR に似た、仮想と現実のインタラクションを実現するための「ボックス」も構築しています。これは、表情、顔認識、ジェスチャー認識などを通じて、仮想のデジタル人物と現実の人物を結び付けることができます。実際に対話すること。たとえば、仮想会議では、同僚の 1 人は、そのデジタル アバターがこの「ボックス」にバインドされているため参加できません。会議中にそのユーザーは自分の「ボックス」をテレビに接続すると、そのデジタル アバターが表示されます。
インタビュー対象者から提供されたデジタルヒューマンアバター
会議中に、そのプロセスに従ってスピーチや PPT プレゼンテーションを作成することができます。これは、映画で見るシーンと非常によく似ています。これで、シナリオは最初は実現できましたが、克服すべき技術的な問題がまだいくつかあります。たとえば、複数のシナリオでのミックスボイスをどのように区別するか、どのように中断するかなどです。
これらの困難を克服すると、「いつでも中断できる」状態が実現され、中断された後、デジタル担当者は質問に答え、前のロジックに戻って続行します。テクノロジーが成熟すると、教師、ライブブロードキャスト販売、無人サービスなどが商用化レベルに到達できるようになるでしょう。
Digital Man はメタバースが再び盛り上がるきっかけとなる
レッドスター首都局:今年は大型モデル申請元年とも言われていますが、業界全体の傾向はどうなっていると思いますか?
シャオ・シュエソン:現時点では、大規模モデルにはまだ錯覚や適切性の欠如などの問題があり、大規模モデルが自身の知能レベルに頼って短期的にアプリケーション シナリオの実装を促進できる可能性は低いです。現在の業界全体の声から判断すると、バーティカルモデルの適用は一つの方向性です。
大規模なモデルは一般的な知能のレベルを向上させるために「深層学習」を重視していることが判明しましたが、実際には「強化学習」の方が重要である可能性があることがわかりました。 「強化学習」は、垂直モデルの中核となる機能と見なされるべきです。
初期段階で 1 つのアプリケーション シナリオを解決するとき、大規模なモデルは非常に愚かに見えますが、長期間使用すると、モデルがより賢くなり、目的に近づいていることがわかります。これが「強化学習」の場所です。非常に重要な役割を果たします。
強化学習の統合に基づいてメカニズムが出現できれば、大規模モデルの人工知能の実装も高速化される可能性があります。
C 側の現在の爆発的なアプリケーションから判断すると、少し悲観的に感じます。海外では、「世界モデル」が構築されるかどうかによって、その構築が新たな爆発的な応用につながり、人工知能の初期開発手法が変わり、一部の概念さえも覆されるという新たな諺もあるが、これは実装するのは非常に困難です。
B サイドと G サイドでは、特定のシナリオでのより具体的なアプリケーションとして、一般的な AI アプリケーションが今年中にいくつか登場すると予想しています。
Red Star Capital Bureau: Mingtu はメタバースにも関与しています。現在の人工知能の流行と比較すると、メタバースは比較的「」です。寒い「それでは、人工知能とメタバースという 2 つの市場についてどう思いますか?
シャオ・シュエソン:初期のメタバースが冷たかった理由は、初期には人工知能がなかったとき、仮想現実を統合し、デジタル ツインを使用して新しいエクスペリエンスを構築することに重点が置かれていたためです。さまざまな資源を探索する生物や知的エージェントは存在しません。
参加する「人々」の要素を持たない仮想世界は、静的な仮想世界です。デジタル ヒューマン アバターは実際に人間の知恵とデジタル ヒューマンを組み合わせたもので、静的なメタバースにデジタル ヒューマンの要素が追加され、相互コミュニケーション、仮想的な社会的交流、商業活動が可能になると、世界は活性化します。
デジタル人材は、メタバースが再び台頭し、新興産業に発展するための非常に重要な触媒です。メタバースには、文学、アート、ゲーム、その他の仮想を含む文化創造、デジタル製品に関連する将来の仮想産業もあります。産業、メタバースは非常に重要なキャリアおよび開発トレンドですが、その触媒となるのはデジタル人材であるべきです。
資本は依然としてテクノロジーへの投資を継続する必要がある
Red Star Capital Bureau: 成都には人工知能の開発においてどのような利点がありますか?企業としてはどのような政策や支援が必要なのでしょうか?
シャオ・シュエソン: 「人工知能」は今年の四川省の「No.1イノベーションプロジェクト」であり、成都はソフトウェア産業やデジタル産業に関連する人材が豊富で、人材とアプリケーションのニーズにおいて優位性を持っている。同時に、政府は現在いくつかのシナリオを公開しており、政府事務も人工知能を使用して既存の情報化をアップグレードすることをすべての人に奨励しています。
情報化のアップグレードを推進する必要があります。長年にわたる情報化の構築を経て、企業は実際に大量のデータと比較的成熟したプロセスベースのサポート管理システムを保有しており、データ要素の価値をさらに最大化するために人工知能が使用されています。データの本来の利用方法を改善し、より複雑なコンテンツをアップグレードして需要市場を拡大します。
資本市場では、よりリラックスした環境を作り、より持続可能な投資を行う必要があると思います。強化学習や垂直分野では、まだ習得していない技術的な部分が多く、介入をサポートするにはある程度の投資が必要であり、シナリオや補助金では解決できません。
レッドスターニュースの記者、王天
編集者 鄧玲耀
(Red Star News をダウンロードしてレポートを提出して賞品を獲得しましょう!)
レポート/フィードバック