ニュース

デジタル人間の戦場で、baidu intelligent cloud は大ヒット商品を投下しました

2024-09-25

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

3dデジタルヒューマンの価格は、かつては数万元だったが、現在は199元まで下がった。

文 | 徐新

編集者 | レン・シャオユウ

あなたは自分がデジタル担当者と接触していることに気づいていないかもしれません。

デジタル人間に対する多くの人の印象は、まだ画像表示の段階にとどまっている。オフラインの大画面では、実際の人間が製品を紹介したり、一般の人々と対話したりするため、エクスペリエンスは良くなく、パフォーマンスはやや硬く、制作コストは高くなります。

しかしここ 1 年ほどで、大型モデルの登場により、デジタル ヒューマン業界にさらなる可能性がもたらされました。一部のメーカーはデジタル ヒューマンを大規模モデル アプリケーションの最前線に挙げており、国内のデジタル ヒューマン レースのパイオニア製品も四半期ベースでバージョンアップを加速しています。

デジタルヒューマンのテクノロジーは常に進化しています。一方では、デジタルヒューマンのポートレート、音声、言語の表現力は段階的に向上しています。。一方で、デジタル派の人たちは、生産コストと閾値が大幅に削減され、効率が急速に向上します。

baidu intelligent cloud の xilin digital human を例に挙げると、baidu group 執行副社長兼 baidu intelligent cloud business group 社長の shen dou 氏は、baige と qianfan という 2 つの業界をリードするテクノロジーのサポートに基づいて、次のように述べています。低コストで、数分で簡単に独自のデジタル ヒューマン作品を作成できます。」

テクノロジーの進歩は包括的な利益をもたらし、より多くのエンタープライズレベルのシナリオがデジタル人材の可能性を広げています。 shen dou氏は、現在、xi lingのデジタル人材プラットフォームにはすでに成熟したイメージと豊富なタイプのさまざまなタイプのデジタル人材がいると紹介しました。文化観光、電子商取引、金融などの主要な業界シナリオをカバー。効率を向上させ、収益を増やし、ビジネス価値を獲得するためにデジタル人材を活用する企業が増えています。

企業によるデジタル ヒューマンの徹底的な適用に伴い、デジタル ヒューマンに対するさまざまな企業の需要パターンも階層化しており、デジタル ヒューマン製品に関するメーカーのビジネス モデルと戦略も更新されています。 baidu smart cloud の xiling digital people チームは、今年は次のことに重点を置くと発表しました。パブリック クラウド プラットフォームのデジタル ヒューマン呼び出しを促進する、標準化された saas 製品と業界顧客のプロジェクト契約により、好循環が形成されることが期待されます。

01

新製品は四半期ごとにリリースされ、デジタル担当者が市場に参入する敷居を継続的に下げています。

デジタル担当者は、大規模なモデルを実装するための最も人気のあるシナリオの 1 つになりつつあります。

昨年後半以来、メーカーは業界で大型モデルを導入する方法の模索を加速しており、デジタル ピープルは多くのメーカーによって先駆的なシナリオとみなされています。今年に入り、多くのプラットフォームメーカーが大型モデルと垂直産業を組み合わせた事例を披露した際、デジタルヒューマンが主要なアプリケーションとして挙げられた。

中国で初めて大型モデルをリリースし、業界への応用を模索し始めたbaiduは、この分野にも多くのリソースを投入してきた。本日開催された baidu cloud intelligence conference で、xilin digital human は 4.0 アップグレードを発表しました。これは、この製品に対して今年リリースされる 3 回目のアップデートでもあります。

このアップデートは主に以下を中心に展開します生産能力の向上、生産閾値の削減、効率とコストの最適化三次元で実施します。

機能のアップグレードに関して、shen dou 氏は、xi ling 4.0 が従来の 2d デジタル ヒューマンの硬い動きの問題を解決し、さまざまな方向に動くキャラクターを実現できると紹介しました。一貫性の高い角度、形状、表現、顔の微表情も非常にリアルで自然です。

この目的のために、xiling チームは特別な開発を実施し、baidu intelligent cloud digital human product 部門のゼネラルマネージャー、zhang yuxiang 氏は独自の開発を行ったと紹介しました。唇マッチングアルゴリズム、デジタルパーソンの口の形を、話すときの表現内容により適したものにします。対話インタラクションの自然性を向上させるために、リスニングステートデザインを導入し、小型のフロントエンド モデルは、会話の間にガイド ワードをインテリジェントに挿入します。、応答の即時性と対話性が大幅に向上します。

xilin digital human 4.0 は、生産の基準に関して、ユーザーが資料を入力するための要件をさらに簡素化します。 3d デジタル人物を例に挙げると、ユーザーは今簡単なテキストの説明を入力するだけで、すぐに生成されます。さまざまなメイクアップ スタイルやさまざまな業界の特徴を備えた 3d デジタル ヒューマン画像とビデオ。

生産効率とコストの最適化の観点から、デジタルヒューマンの生成時間は分単位まで短縮されました。業界は、6 月にアップデートとアップグレードが行われたことを確認しました。xi ling の 2d デジタル ヒューマンの生成時間は、3 ~ 7 日から数時間に短縮されました。

コストレベルでも、企業がデジタル人材を獲得するための価格は低下しています。 6 月に xiling デジタル ヒューマン アップデートがリリースされたとき、3d 超リアルなデジタル ヒューマンの価格基準値が 10 万元から 1 万元に引き下げられました。本日のアップグレード後、3d 超リアルなデジタル ピープルの価格は1万元から値下げが続き、199元まで大幅値下げ、業界最安値を実現。これは間違いなく、デジタル業界にとって新たな大ヒット商品となります。

業界は、今年以来、ザイリン デジタル ヒューマンが四半期ベースで迅速に繰り返し更新され、デジタル ヒューマン業界の実装を長らく悩ませてきたいくつかの主要な問題に焦点を当てていることに注目しています。このバージョン 4.0 アップデートも継続されます。 baidu xiling digital human「高可用性、高コストパフォーマンス」「中心となるコンセプトは、デジタル担当者の使用しきい値とコストをさらに削減することを目的としています。

実際、これは過去の業界の共通の方向性でもありました。 idcはdigital intelligence frontierに対し、aiデジタルヒューマンテクノロジーの民間利用が市場の焦点になりつつあると語った。関連技術を通じて製品の使用量とコストのしきい値をいかに削減するかが、将来の競争における重要な要素の 1 つになります。

国内のデジタル ヒューマン レースの古参プレイヤーである baidu smart cloud の xi ling チームのデジタル ヒューマンに対する理解は、現実の人間に取って代わることができ、いくつかの分野ではそれを超えることができるというものです。 baidu smart cloud デジタル ヒューマン製品部門のゼネラル マネージャー、zhang yuxiang 氏は、パフォーマンスが実際の人間のパフォーマンスを超えた場合にのみ、デジタル ヒューマンはより多くの業界シナリオを解き放ち、より広く使用できると説明しました。

過去 6 年間のおかげで、百度はデジタル ピープルの分野での取り組みを深め、現在、ザイリンのデジタル ピープルは、現実の人にはできないことを多面的に実行できるようになったと紹介しました。肖像画、声、言語能力として。

たとえば、ポートレートを例に挙げると、現実の人物を復元する場合、現在の環境では照明とメイクに依存します。生放送の写真編集や小顔機能と同様に、動画でもイメージを向上させることができます。

音に関して言えば、普通の人は日常の会話表現に多くの不満や遅れを感じますが、デジタルの人はそれを実現できます。流暢かつ自然で、安定した口調とリズム感を持って話しましょう。言語表現能力の点でも、デジタル人間の多言語切り替え能力は生身の人間の限界を突破し、容易に多言語のロックを解除することができます。

「2d デジタル ピープルは、現実の人間の時間、空間、能力の制限を打ち破り、現場で現実の人間に取って代わり、あらゆる面で現実の人間よりも優れたパフォーマンスを発揮できます。これが、2d デジタル ピープルの分野で全員が協力する方向です。」 」と張玉祥さんは語った。

02

企業がデジタル人材を活用する方法が変化している

1 年以上の開発を経て、大型モデル テクノロジーはデジタル ヒューマンに力を与え、デジタル ヒューマン市場に新たな可能性をもたらします。

まず、デジタルヒューマンの能力が向上するにつれて、デジタル担当者はより多くのアプリケーション シナリオを解き放つ

「ポートレートや音声に加えて、大型モデルがデジタル ヒューマンにもたらす言語能力は、私たちにさらなる可能性をもたらします。zhang yuxiang 率いる xilin チームは、デジタル ヒューマン トラックで 5 年以上の経験があり、数千人のアプリケーションの状況を観察しています。」企業顧客の。彼は、大規模なモデルによって強化されたデジタル ヒューマンが、以前は想像もできなかった多くのシナリオで広く使用されていることに気づきました。

通常生放送の様子大規模なモデル機能のおかげで、次のことが可能になります。製品コンテンツ情報に基づいてリアルタイムで説明できる、デジタル担当者向けのライブ ブロードキャスト スクリプトを生成します。、製品情報に関するリアルタイムの質問と回答も完了でき、24 時間年中無休で安定して効率的です。もう 1 つの例は、多言語機能の恩恵で、デジタル担当者は柔軟に言語を切り替え、一連のコンテンツを世界中のメディアや顧客に公開できるため、国境を越えた電子商取引や貿易ビジネスに利便性が加わります。 「1つの能力ポイントを突破すれば、さらに可能性が広がる可能性がある」とzhang yuxiang氏は語った。

第二に、テクノロジーが進歩し、可用性の敷居が下がるにつれて、デジタル人材がより多くの業界に参入するようになりました。企業ごとに、デジタル ヒューマン機能に対するニーズも異なります。

「何千もの業界で、デジタル ヒューマン テクノロジーに対するさまざまなアプリケーション要件が存在します。」zhang yuxiang 氏らは、顧客から非常に多様なフィードバックを受け取りました。たとえば、メディア業界関係者は、デジタル ヒューマン プラットフォームが次のようなことを実現できるかどうかに興味を持っています。音声の高解像度クローンと高解像度ビデオ出力; そして教育現場では、デジタルヒューマン教師が生徒の学習能力とこれまでの知識ポイントの習得に基づいてできるかどうか、さまざまな答えや説明をする

これには、デジタル ヒューマン テクノロジー サービス プロバイダーが、市場の多様なニーズに適応して満たすために、さまざまな機能を体系的に整理し、さまざまな機能セクターを分離することも求められます。一部のパイオニア企業も市場を追随し、デジタル ヒューマンの機能をオープン プラットフォームに蓄積して、柔軟なコンポーネント ベースの通話を実現しています。

baidu smart cloud の xiling digital human を例に挙げると、今年 7 月に xiling digital human オープン プラットフォームがリリースされました。標準化された機能を業界ユーザーが呼び出せる柔軟なコンポーネントに分割する。たとえば、カスタマイズされたポートレートのクローン作成、カスタマイズされた音声のクローン作成、対話インタラクション シーン、両端のレンダリング機能、デジタル ヒューマン ビデオの制作やライブ ブロードキャストなどの機能をすべて簡単に呼び出すことができます。

このオープン プラットフォームの機能も市場から温かく歓迎されています。 」オンラインになってから、毎週何百人もの顧客が試してみましたが、デジタル担当者向けのアプリケーション シナリオは予想をはるかに上回っていました。」, zhang yuxiang氏は、これはエンタープライズレベルのアプリケーション市場におけるデジタル人材に対する需要の多様化と活況を反映しており、デジタル人材のエンタープライズアプリケーションが徐々に深化していることを意味していると考えている。

その結果、デジタルヒューマン市場のサービスモデルも進化・更新してきました。数年前、業界のデジタル ヒューマン サービスは大規模なカスタマイズ プロジェクトが主流でしたが、デジタル ヒューマン テクノロジーの大規模な複製機能が向上しました。プラットフォームはデジタル ヒューマンの機能を標準化された saas 製品に集約し始めています。利用する業界が増えるにつれ、企業のニーズも多様化し、柔軟なコンポーネントベースの呼び出し方法が利用できるようになりました。

そしてすぐに使える saas プラットフォーム、効率的で統合が容易なコンポーネント プラットフォーム、およびトップ顧客向けにカスタマイズされた業界レベルのソリューションも、baidu xiling digital people が現在業界顧客にサービスを提供している 3 つの形態です。

「コンポーネントベースの連携は、業界ユーザーにとってより適しています。これらの簡単に統合できるコンポーネントを通じて、デジタルヒューマンの機能を独自のシステムやアプリケーションに統合できます。現在、業界の主流の通話モデルは主にコンポーネントベースであり、一般的なシナリオでは、saas はより多くのシナリオをカバーできます。」と zhang yuxiang 氏は違いを紹介しました。

彼は、デジタル人材がパフォーマンス層であり、業界に参入する際に彼らをうまく活用するには、業界のノウハウや現場の深い知識を含めて、業界の垂直分野と統合する必要があると考えています。

たとえば、教育シナリオでは、教師がオンラインで教えているときに、デジタル ヒューマンの入り口が表示される場合があります。わからないことがあれば、それをクリックするだけで、デジタル ヒューマンの教師が 1 対 1 でコミュニケーションを図ることができます。知識のポイントと生徒の状況について。

これを実現するには、デジタル ヒューマンのオープン プラットフォーム機能を活用し、教育業界のパートナーと構築し、デジタル ヒューマンの機能を企業の既存のコース システムや学生管理システムと接続する必要があります。これには産業分業も含まれており、シナリオでデジタル ヒューマンの能力を真に活用するには、教育業界のパートナーとの共同構築が必要です。

03

デジタル担当者がさまざまな業界でデジタル従業員になりつつある

デジタル ヒューマンの機能がアップグレードされ続け、アプリケーションのしきい値が低下し続けるにつれて、企業がデジタル ヒューマン サービスを取得する方法もより柔軟になり、より多くのシナリオでそのアプリケーションが加速されています。

「当初のデジタル ヒューマン プロジェクトのサイクルは非常に長かったですが、今では試行から実際の運用まで 1 ~ 2 日で完了できます。企業がより強力なプログラミング スキルを持っていれば、開始して効果を確認するまでにわずか半日しかかかりません」 」 zhang yuxiang 氏は、多くの企業が次のようなことができると観察しました。xiling を使用すると、デジタル人材の効果とビジネス価値をより簡単に確認できます。

idc china のリサーチマネージャーである cheng ying 氏も digital intelligence frontline に対し、現在、企業による ai デジタル ヒューマンのアプリケーションは次のように述べています。主に革新的なビジネスを考慮し、企業の効率向上と収益増加を支援するため。デジタル人材の価値が最も明らかな分野は、ライブ ストリーミング、デジタル カスタマー サービス、仮想アンカーなどのシナリオであり、roi を計算するのは簡単ですが、他のシナリオでもたらされる価値を測定するのは難しく、これが直面する課題の 1 つです。テクノロジーの実装によって。

zhang yuxiang 氏は、デジタル人材の価値をより包括的に捉える必要があると考えています。roi 指標は、一部の配信および広告マーケティング シナリオでデジタル ヒューマンのパフォーマンス指標を測定するためによく使用されます。、鍵は、このテクノロジーが実際に企業で使用されるかどうかによって異なります。

現在、配置や広告のマーケティング シナリオなどのシナリオここでは、baidu smart cloud の xiling デジタル担当者がショッピング ガイドの役割を果たし、コンテンツの魅力とインタラクティブ性を高め、マーケティング ビデオの作成プロセスを大幅に加速し、コストを削減しています。生産効率の観点から、xilin のデジタル担当者は従来の技術を組み合わせます。2.5日だった生産サイクルが0.5日に短縮、販売者にとって貴重な市場機会を獲得しました。同時に、デジタル俳優は撮影コストを大幅に削減することもできます。一線都市では、本物の俳優の 1 日当たりの費用は少なくとも 1,500 ~ 2,000 元です。

ユーザーがアップロードした素材を使用して複数のビデオをバッチで生成することもできるため、ビデオあたりのコストが均等に低くなります。 「いくつかの販売シナリオでは、広告物の制作コストが約1/3に削減されました。

広告やマーケティングのシナリオに加えて、デジタル担当者が演じるデジタル従業員は、金融業界でも広く使用されています。。 digital intelligence frontier は、多くの大手銀行が baidu xiling digital people を使用していることを知りました。ビジネスホールに定住し、これまでオフラインの営業担当者に依存していた作業タスクの多くを効率的に引き継ぎます。、業務処理効率と顧客エクスペリエンスを大幅に向上させます。全国の店舗数を考慮すると、オフライン店舗にはさらに多くの販売員を配置する必要がなく、大幅なコスト削減になります。

「銀行シナリオにおけるデジタル ヒューマン テクノロジーによって推進されるデジタル従業員業務プラットフォームは、デジタル従業員に業務能力を真に提供し、従業員のエネルギーを大幅に解放することができます。」と zhang yuxiang 氏は、このシナリオではデジタル ヒューマンが真に活用されていると述べました。現在のところ、xiling のデジタル担当者のカバー率が主要銀行 18 行で 50% に到達, 「製品の再購入率が高く、多くの顧客が第 3 フェーズ、第 4 フェーズ、さらには第 5 フェーズに到達し、毎年製品を繰り返し利用しています。」

roi の計算に適さないシナリオもいくつかあります (通常は文化や観光の分野)。一部の地域では、百度のデジタル担当者が作成した地元の歴史的有名人を利用して、生成されたipの形で再現し、文化や観光名所で観光客と交流し、電子ツアーガイドの役割を果たしています。しかし、業界では、生み出される価値は純粋に数字だけで測るべきではないと考えています。より豊かな観光体験をもたらし、よりアクセスしやすくインタラクティブな方法で歴史と文化を継承することができます。将来的には、デジタル ヒューマンの機能が進化し続けるにつれて、その役割がさらに明らかになり、解放されるでしょう。

デジタル人材が企業レベルのシナリオでデジタル従業員の役割を果たすことが増えるにつれ、roi やビジネス価値アカウントを計算できるシナリオがますます増えており、デジタル人材アプリケーション市場が徐々に開放されつつあると言えます。 idc は次のように予測しています。2026年までに中国のaiデジタルヒューマン市場は102億4000万元に達する見込み

市場が初期から成熟するにつれて、baidu intelligent cloud xiling などの製品チームは体系的なアプローチを開発し始めています。

zhang yuxiang 氏は、以前はパブリック クラウド製品の収益が xi ling digital の収益全体に占める割合は高くなかったと紹介しました。プロジェクトの大部分は、大手政府企業と企業との協力プロジェクトであり、現在、パブリック クラウドでの収益増加に注目し始めています。

「これまで、機能はプロジェクトに蓄積されてきました。今年はそれを完全に製品化します。私たちは最先端の機能と技術レベルを達成し、その後、アプリケーション製品の機能シナリオの範囲をフォローアップします。」とzhang yuxiang氏は述べました。

ここでは、さまざまな製品モデルが積極的なつながりを形成することが期待されます。過去のプロジェクトから蓄積された収益がパブリック クラウドの標準化された製品の開発をサポートし、パブリック クラウドの開発によってもたらされる機能が署名をより効果的に推進することができます。

04

産業実装のパイオニアになるには

現在、baidu intelligence の yunxiling digital human は、大規模モデル実装業界の典型的なアプリケーション シナリオとして、文化観光、電子商取引、金融などのさまざまな主要産業シナリオに実装されており、アプリケーションの広さと奥深さは次のとおりです。前進します。これも産業現場に参入する百度の大型モデル技術の典型

過去 1 年間、大型モデルは産業の変革を促進するための技術革新を加速してきました。データによると、今年1月から8月までの国内大型モデルの当選件数は2023年通年の5倍に達し、当選金額は昨年の2倍となった。ここでは大型ヘッドモデルメーカーの役割が依然として非常に顕著です。百度は、大規模モデル落札プロジェクト数、落札金額、対象産業、対象となる中央国有企業数という4つの主要指標で第1位にランクされている。

産業への導入の急速な進歩は、新世代のインフラストラクチャのサポートと切り離すことはできません。 baidu smart cloud は、大規模モデルの産業実装に焦点を当て、フルスタックのインフラストラクチャ ベースを形成しています。

計算能力レベル, 大規模モデルの膨大なトレーニング要件の下で、必要なクラスター サイズはますます大きくなり、gpu の効率的かつ安定した管理を実現し、それによって大規模モデルのトレーニングと推論のコストを削減する方法が業界で大きな注目を集めています。本日の cloud intelligence conference で、baidu intelligent cloud は baige 4.0 のバージョン アップグレードを発表しました。アップグレードされた baige は、クラスター作成、開発実験、モデル トレーニング、モデル推論の 4 つの側面で「複数、高速、安定、コスト効率の高い」ai インフラストラクチャを企業に提供します。大規模な実装の全行程におけるコンピューティング能力要件に焦点を当てています。モデル。

大規模モデル アプリケーションの爆発的な増加は、便利で効率的な大規模モデル ツール チェーンとアプリケーション開発プラットフォームから切り離すことができません。大型模型業界の企業のニーズに応えるべく、今日では、qianfan大型モデルプラットフォームは、モデル開発レイヤー、モデルサービスレイヤー、アプリケーション開発レイヤーでも完全にアップグレードされました。

アップグレードされた qianfan 3.0 は、エンタープライズ レベルのアプリケーション開発の敷居をさらに下げ、より多くの業界シナリオをカバーする豊富な大規模モデルと小規模モデル、および企業がワンストップの大規模モデルと小規模モデルを実現するのに役立つより完全な大規模モデル ツール チェーンを提供します。開発サービス。

本日開催されたbaidu cloud intelligence conferenceで、baidu group執行副社長兼baidu intelligent cloud business group社長のshen dou氏は次のように述べた。xilin digital human、インテリジェント顧客サービス「ke yue」、wenxin kuaimaが大幅にアップグレードされました、企業向けには、これはバイドゥがインフラストラクチャに基づいて構築した ai 製品のモデル ルームでもあります。彼は、ユーザーが進むべき道を個人的に歩むことによってのみ、ユーザーをよりよく理解する製品を設計できると信じています。

数千の業界への大規模モデルの導入は、コンピューティング インフラストラクチャ、アルゴリズムのトレーニングと最適化、業界のシナリオ、データの準備とガバナンス、モデルの製造元、アプリケーション企業の実装展開など、作業のあらゆる側面を中心とする大規模な体系的なプロジェクトです。およびモデルエコシステムサービス企業は、産業応用を加速するための努力を続けています。

今回の cloud intelligence conference での一連の主要な製品アップグレードとアップデートは、間違いなくこの波における重要な脚注です。