ニュース

aiエージェントは「感情と知性の両方」を持ち、人間のエモの治療に特化?

2024-09-26

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

著者|ゆぐ

ステートメント | タイトルの画像はインターネットから取得したものです。これは京浙研究院のオリジナル記事です。転載する必要がある場合は、メッセージを残して許可を申請してください。

2024 年は大規模モデルの実装の最初の年であり、人々の ai の探求はアルゴリズムの改良からアプリケーション シナリオの拡張へと移りました。最も代表的な現象の 1 つは、ほとんどすべての大手モデル企業や環境保護企業がインテリジェント エージェントに注目していることです。

jingzhe research institute は、2024 年の baidu cloud intelligence conference で終了したばかりの第 2 回 baidu「wenxin cup」起業家コンテストでは、参加プロジェクトの数が 1,600 近くに達し、参加者数がほぼ 2 倍になったことに気づきました。その中には国際的なプロチームだけでなく、300の大学からの若い才能も含まれています。

baidu の創設者、会長、ceo である robin li 氏もビデオスピーチの中で、「このコンテストに参加しているチームの 60% 以上がインテリジェント エージェント アプリケーションに焦点を当てており、参加チームの 30% 以上には専門家がいない」と具体的に述べています。これは、大規模なモデルにアクセスし、baidu などのプラットフォームが提供するアプリケーション開発ツールを使用して業界アプリケーションを開発することで、ai 起業家精神がすでに「軽く」実行できることを意味します。

ai 業界全体が「数百モデルの戦い」から「覇権をめぐるインテリジェントエージェントの闘争」へと移行する中、商用レベルでの ai の価値も常に検証されています。

大型モデルが地面に着地し、知的体に向かって転がる

会話型サービス エージェントからワークフロー オーケストレーション エージェントに至るまで、大規模なモデル機能の拡張として、エージェントはさまざまな分野で使用されており、具体的な製品やサービスを使用して、複雑で常に変化する市場の需要の中で正確なポジショニングを見つけています。

京浙研究院の観察によると、前回の「文新杯」の参加チームの状況と比較すると、今年の最大の変化は、参加プロジェクトに占めるアプリケーション層プロジェクトの割合が昨年の80%から今年は90%以上と大幅に増加し、アプリケーションの方向性がより多様になったことだ。昨年はエントリーの30%以上が一般オフィスおよびマーケティング分野に集中しており、今年はエンターテインメント、電子商取引、マーケティング、医療、オフィス、ハードウェア、企業サービスなどの分野が含まれています。

例えば、今年の「文新杯」で優勝したjirui technologyは、商品の更新が早く大量の商品が必要となる電子商取引シナリオの多様化するニーズに応え、ワンストップの電子商取引マテリアルaiを開発した。グラフィック、テキスト、短いビデオツールなどのさまざまなコンテンツ素材。このツールは、コンピューター ビジョン、ディープ ラーニング、画像生成および編集テクノロジーの開発と応用を通じて、グラフィック、テキスト、ショート ビデオをカバーする ai コンテンツ生成、管理ツール、変換サービスを消費者ブランドに提供できます。企業が商品写真のコストを削減できると同時に、コンテンツ マーケティングのコンバージョン率も向上します。

aiが期待されるソーシャル分野において、このコンペティションの優勝チームkotokoは、マルチエージェント駆動の仮想キャラクターソーシャルゲームインタラクティブプラットフォームを制作しました。このゲームプラットフォームのユニークな点は、ユーザーがパーソナライズされたaiキャラクターを作成できることに加えて、「環境とキャラクター」、「キャラクターとキャラクター」の間の根底にあるインテリジェントなインタラクションがエージェントアーキテクチャに基づいて実現されていることです。これは、ai バージョンの「ザ・シムズ」によく似た、より現実的で興味深い体験をユーザーにもたらします。

一般教育の大きなモデルをもとに「teacher ai」チームが作り上げた「guided ai tutor」は、従来の「直接答えを与える」という家庭教師のやり方を捨てました。興味深くパーソナライズされたナレッジ ポイントの概要、ガイド付き q&a、回答を促す機能を提供することで、学生が質問に回答する過程でナレッジ ポイントを習得できるように支援し、ai を使用して学生の学習への関心を高め、学業成績の向上に役立ちます。

さらに、大規模なモデルに基づいた専門的な心理診断と治療の ai エージェントや、企業のプライベート ドメインのトラフィック運用を支援し、顧客の獲得と運用効率を向上させるソーシャル メディア マーケティング エージェントも非常に目を引きます。

特に、ミラーテクノロジーの心理診断・治療aiエージェントは、デザイン、ソーシャルネットワーキング、教育などのインターネットベースの高度な産業に加え、心理診断・治療という「ニッチ」路線を選択した。技術原理から市場応用まで ai の可能性に挑戦するだけでなく、インテリジェント エージェントの形で人間にとっての ai のより深い価値も探求します。

「リトルエモ」の背後にある大きな市場

近年、snsでもリアルでも、エモさや鬱などメンタルヘルス関連の話題が絶えず、「癒し経済」が流行しています。

しかし、需要の拡大の裏で、心理診断・治療市場は依然として供給不足という課題を抱えています。「2023年の中国の精神衛生」ブルーブックは、我が国の精神・心理疾患の現在の臨床診断と治療は、高い有病率と多数の患者により大きな課題に直面しているが、国内のうつ病の治療率は高いと指摘している。わずか9.5%です。

なぜなら、心理診断や治療は一般的な医療ニーズではないため、これまで公立病院を中心とした医療供給体制では専門人材の不足や医療資源の不足が問題となっていました。

国家保健家族計画委員会のデータによると、2020年の中国の精神科病院の勤務医はわずか4万490人、勤務助手は4万5432人のみだった。人口10万人当たりの精神科医は6.1人しかいなかったのに対し、米国は12.7人、日本は11.9人だった。 . 大きなギャップがあります。

また、心理診断や治療も一対一の対面相談に依存する部分が多く、時間や費用の面で多額のコストがかかります。「リーガル・デイリー」紙によると、心理カウンセリング治療は開始が比較的遅いため、患者は1コースの治療で少なくとも5~6回、最大で数十回のカウンセリングと治療を受ける必要があり、その費用はさまざまであるという。数千元から数万元まで待ちます。

総合的な費用が高すぎるからこそ、完治するまで治療を続けられる患者さんはほとんどいないのが現実です。したがって、潜在的な人々であっても、すでに現実のニーズを持っている患者であっても、心理診断と治療は一般の病気に比べて治療の敷居が高いのです。

「医療の敷居の高さ」は、実は効率の問題でもあります。医師の数や物理的なスペースなどの理由から、「一対一」の診断と治療能力を大規模に再現することができないからです。しかし、インテリジェントなエージェントとオンライン診断および治療チャネルの助けを借りて、時間と物理的な制限を突破し、増大する市場の需要に応えることが可能になります。

たとえば、mirror technology の ai アセッサーは、適応型スケールとデジタル ヒューマン ビデオ コンサルテーションおよびスクリーニング手法を使用して、ユーザーのメンタルヘルス状態を迅速に診断するのに役立ちます。また、マルチモーダル ai テクノロジーを使用して作成された「ai ドクター」は、ユーザーとのカウンセリングや、natural インタビューを行うこともできます。評価の提案が与えられます。最も重要なことは、ユーザーは休暇を申請したり、オフラインの治療に行く必要がなく、オンラインチャネルを使用するだけで、24時間365日便利な治療が受けられることです。

さらに、軽度の不安を抱え、精神状態がまだ正式な治療を必要とする段階に達していない一部の精神状態には、ミラー テクノロジーの ai の相談相手が必要であり、軽い相談サービスを提供できます。単純なチャットであ​​っても、「ai ツリーホール」スタイルのリスニングであっても、ユーザーのストレスを軽減し、精神的健康を維持するのに役立ちます。

軽度から中程度の症状を持つ患者に対して、ミラーテクノロジーのai心理学者が自然言語処理と感情認識技術に基づいてユーザーの表情に基づいてメンタルヘルスを評価し、実際の人間に近い方法でポジティブなフィードバックを与えることで、パーソナライズされた心理的ケアを提供します。相談、診断、治療計画は、ユーザーの不安を和らげ、うつ病に抵抗するのに役立ちます。

診断、交際、治療などのシナリオを中心に構築された ai エージェントは、すでに「ai 医師」の能力をある程度備えています。ai の効率性の利点を活用して「1 対多」形式でパーソナライズされた市場のニーズを満たすことに加えて、オンライン診断と治療は、未成年者やその他の少数派グループのプライバシーを保護する役割も果たします。

実際、精神疾患を治療する主な方法は依然として心理学者と患者の間の長期的なコミュニケーションを通じてであり、ai には共感や共感が欠けていると常に考えられてきたため、心理診断と治療の分野での ai の適用は常に議論の的となってきました。気分を正確に理解できません。そのため、「ai医師」と患者との面談の有効性を保証することは困難です。

しかし、mirror technology の 3 つの製品 (ai evaluator、ai counselor、ai psychologist) からわかるように、ai は共感を必要とせず、「人間のような」コミュニケーションを通じて患者に否定的な感情のはけ口を提供し、心理的プレッシャーを軽減します。

さらに、aiは感情を理解できませんが、知識モデルの構築と専門理論の自然な意味分析に基づいて、aiエージェントはコミュニケーションプロセス中の心理的ストレスのトリガーを捕捉し、それによって専門知識の計画に基づいてパーソナライズされたソリューションを提供することもできます。

例えば、ユーザが会話中に家族のことについて話す場合、エージェントは家族愛の観点からユーザを啓発することができる。つまり、ai は他人に共感することはできないかもしれませんが、ユーザーが提起した現在の問題に基づいて合理的な分析と推論を行い、専門知識を組み合わせて具体的な解決策を提供することができます。したがって、心理診断・治療分野におけるaiエージェントの役割は、従来の治療法と同様です。

aiエージェント、「精神科医」の次のレベル

実際、心理診断や治療の分野における ai テクノロジーの応用は新しいものではありません。

1960年代、mitのコンピュータ科学者ジョセフ・ワイゼンバウムは、「個人中心療法」をシミュレートする「eliza」と呼ばれるコンピュータプログラムを開発した。 chatgpt が新たな ai ブームを巻き起こす前に、インテリジェントな音声対話機能に基づいて開発されたデジタル診断および治療方法もありました。

しかし、aiエージェントと比較してみると、初期の心理診断・治療分野におけるai応用は、チャットボットという製品形態と切り離せないものがほとんどであり、「aiドクター」の高みには至らなかったことが分かる。これは、初期段階では、ai の利点は依然としてその強力なコンピューティング能力に焦点が当てられており、より多くのイノベーションが心理テストと評価ツールの開発に焦点を当てているためです。

現時点では、ai は患者に事前に設定された質問を与え、回答を収集する機械のようなもので、心理学者や心理カウンセラーの評価と診断を支援します。 ai自体に分析能力はなく、あらかじめ設定された答えを超えて組み合わせて合理的な論理的推論を行うことはできません。

そのため、aiが心理診断・治療の分野で活用されて半世紀が経ちますが、心理診断・治療市場の現状に決定的な影響を与えるまでには至っていません。chatgpt が大ヒットするまでは、情報収集、分析、フィードバックのための大規模モデルの包括的な機能を知る人が増え、心理診断と治療の分野で ai を応用するための新しいアイデアが生まれてきました。

今日の ai エージェントは、とうに「製品」の範囲を超えています。

単機能のチャット ロボットと比較して、自動的に診断し、24 時間年中無休で同行し、パーソナライズされた治療計画を提供できる ai エージェントは、優れたコンピューティング能力を備えているだけでなく、環境を独自に認識し、意思決定を行い、さまざまなアクションに適応して実行することもできます。人々のグループやさまざまなシナリオに対応し、「人間のような」インタラクティブな体験を提供します。

また、大規模なモデルが成長するにつれて、エージェントはより包括的な機能を進化させ続けることができます。たとえば、心理診断や治療以外の結婚や恋愛のシナリオにおいて、ミラーテクノロジーはai仲人、恋愛アシスタント、結婚関係コーチなどのさまざまなaiエージェントを立ち上げた。 aiエージェントの総合的な能力と応用シナリオの多様化により、心理診断・治療業界も「次のレベル」に入るでしょう。

指摘しておかなければならないのは、心理診断と治療における ai エージェントの進化は、実際には、国民のニーズの満たしから専門的問題の解決に至るプロセスであり、これは有効な情報の供給と専門的能力の供給と切り離すことができません。

心理学の診断と治療の推論ロジックは、単純な数学的計算とは異なり、理論的知識と実際の事例に基づいています。 aiエージェントは、ユーザーの問題を正確に発見し、その後の診断と治療ソリューションで対応する解決策を照合できるように、大量の有効なデータを取得し、独自の分析モデルを構築するのに十分な「ユーザーインタビューケース」を識別および蓄積するため、より正確なインターフェースを必要としています。

ユーザーにフィードバックを与える際、aiエージェントも相手の性格特性やさまざまなシナリオに基づいて適切な表現方法を選択する必要があります。たとえば、誰かに付き添うときはより誠実であること、時にはジョークを交えてユーモアを交えること、または治療計画を提供するときはより権威的でプロフェッショナルであること、これには nlp や対話および言語を超えたモデルの能力が必要です。

したがって、産業側に戻ると、ai エージェントがその価値をアプリケーション シナリオに反映できるかどうかは、使用する大規模モデルの機能に大きく依存しており、baidu wenxin の大規模モデルは ai ネイティブ アプリケーションの成長に適した土壌を提供します。

現在、wenxin の大規模モデルには、nlp、cv、クロスモダリティなどの基本的な大規模モデル、対話、クロスランゲージ、検索、情報抽出などのタスク用の大規模モデル、生物学的コンピューティングの分野の大規模モデル、大規模産業が含まれています。ツールプラットフォームは、知識強化と産業レベルという2つの主要な特徴を備えた、基礎-タスク-産業の3レベルの大規模モデル技術システムを形成しており、インテリジェントエージェントの開発ニーズを満たすのに十分です。さまざまな分野で。

wenxin の大規模モデルの包括的な機能に加えて、baidu エコシステムによるインテリジェント エージェントの強化にも大きな価値があります。

たとえば、baidu smart cloud qianfan appbuilder は、産業グレードの ai ネイティブ アプリケーション開発プラットフォームとして、コード状態とゼロコード状態の 2 つの形式でサービスを提供でき、開発者がアプリケーション開発の敷居を継続的に下げるのに役立ちます。 baidu 検索は現在、インテリジェント エージェント向けの最大の配信ポータルとなり、毎日 1,000 万件以上が配信されており、より多くのエージェントが市場機会をつかむのに役立っています。

さらに、baiduは今年5月にernie speed、ernie lite、ernie tinyという3つの軽量モデルを無償化し、7月にはwenxin large model 3.5と4.0のフラッグシップモデルの価格を大幅に値下げした。これは、依然として「技術の実現」を模索している知的な起業家チームにとって、より現実的な成長条件でもあります。

mirror technologyの創設者であるhuang li氏も京浙研究院とのインタビューで「温信宜燕氏はroiを大幅に向上させた」と述べた。

要約する

aiは大きな注目を集めていますが、aiアプリケーションの実装は難しいと考えている人もまだ多くいます。

驚くべきことに、それは心理診断や治療薬の応用にも見られ、ai技術の導入は、業界の問題点を解決し、一般人が心理診断や治療にアクセスする敷居を下げるだけでなく、aiの包括的な価値をある程度反映し、「難しいが正しいもの」を完成させる。

実際、百度「文新杯」起業家大会を昨年から継続的に開催し、参加プロジェクトへの投資とさまざまな環境支援に数千万元を投資してきた百度もまた、「難しいが正しいこと」を行っている。大型モデルがインテリジェントエージェントに移行するという新たな傾向の下、ai ビジネスを開始する難しさは実際に大幅に軽減されました。

まず第一に、テクノロジーの継続的な反復により、大規模なモデルからエージェントへの「進化」が見られ、エージェントの形での ai 起業家精神も「手作業によるコーディング」を必要としなくなりました。

ロビン・リー氏の言葉を借りれば、「エージェントは、pc時代のウェブサイト、セルフメディア時代のアカウントに相当します。その最大の特徴は、誰でも始められる敷居が低く、非常に高いレベルで成功できる上限が十分に高いことです」 baidu の wenxin big model と qianfan intelligent platform に基づいた現在の ai テクノロジーは、チームだけでなく個人もサポートして、ユーザー価値とビジネス価値を備えたインテリジェントなアプリケーションを構築できるようになりました。

第二に、心理診断や治療エージェントなどの「wenxin cup」受賞プロジェクトは、貴重なエージェントが ai テクノロジーと商業的価値の組み合わせを発見し、異なるトラックのエージェントが製品と市場需要の正確なドッキングを達成したことを証明しています。それは時間の問題です。

第三に、よりインテリジェントなエージェントの出現により、将来的には、各分野が独自の特定のシナリオとニーズに基づいて独自のエージェントを生成し、数百万もの巨大なエコシステムを形成するでしょう。同時に、インテリジェント エージェントの機能も常に向上しており、将来的には、インテリジェント エージェントが連携して、より複雑なタスクやニーズを完了できるようになる可能性があります。

そのときまでに、「二重の感情的知性と知性」を備えた ai エージェントが解決できるのは、人間のエモさだけではないでしょうか?