ニュース

Alimama が出したコンテストの質問はどのようなもので、NeurIPS 2024 に選ばれましたか?

2024-07-15

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

マシーンハートオリジナル

著者: 張騫

「入札」できるのも非常に実践的なスキルです。

数多くある人工知能に関するトップカンファレンスの中で、NeurIPS はどこに属するのでしょうか?誰かがこれを「ジェン・ファンの伝説」の世界に入れて絵を作りました。これはおそらく「2番目の位置」に値します。



画像出典:Xiaohongshuユーザー@云juanyeshu

このランキングには議論の余地があるかもしれませんが、NeurIPS がトップ AI カンファレンスで常にトップ 3 に入っていることは疑いの余地がなく、Google Scholar の世界的なジャーナルやあらゆる分野のトップ カンファレンスのトップ 10 に長年入ってきました。



したがって、このカンファレンスで論文を発表できることは、多くの AI 研究者の共通の目標です。 AlexNet、Transformer、GPT-3 の画期的な論文はすべて、このトップカンファレンスの論文として承認されました。

ただし、論文は NeurIPS の価値をすべて表現しているわけではないことに注意してください。カンファレンス中に開催される一部のコンテストは、AI の実践に焦点を当てている一部の研究者やエンジニアにとってより適している可能性があります。 NeurIPS 関係者でさえ次のように述べています。これらのコンテストは、複雑な問題を研究し解決する上で重要な役割を果たします。」。

では、これらのコンテストはどこで見つけられるのでしょうか?実際、NeurIPS 関係者は 6 月にこれらのコンテストのリストを具体的に記載したブログを公開しました。



リストには合計 16 個のコンテストの質問が含まれており、それぞれが審査され、「広範な科学研究の価値」。



これらのコンテストの質問は NeurIPS によって公式に収集されます。過去数年の経験から判断すると、最終的に選ばれるコンテストの質問のほとんどは、大学、研究機関、またはGoogle、OpenAI、Metaなどの海外テクノロジー企業からのものです。国内の業界から提出されたコンテストの質問は、非常に低い評価を得ています。選ばれるチャンス。今年は大型モデルトラックの人気により、競技会の競争はさらに激化している。

しかし驚くべきことは、このような熾烈な競争環境の中でも、国内業界には傑出した人材が依然として存在するということだ。」大規模オークションにおける自動入札:不確実性と競争性を伴うゲームにおける意思決定の学習(大規模オークションにおける自動入札: 不確実で競争力のあるゲームにおける意思決定の学習)」が、彼らが提出したコンペのテーマです。



大会公式サイト:https://tianchi.aliyun.com/specials/promotion/neurips2024_alimama#/

このコンペ問題は、北京大学・アリママ人工知能イノベーション共同研究室(PAAI)の意思決定インテリジェンス協力チームによって作成され、アリママの意思決定インテリジェンス技術チームが第一部隊として、北京大学の研究チームと共同で提出した。北京大学のDeng Xiaotie教授とLu Zongqing教授。コンテストのテーマが選択された後、Alimama はコンテストを主催する権利を獲得し、国内業界で今年の NeurIPS コンテストを主催する権利を獲得した唯一の組織となりました。

競争の話題は「大規模オークションにおける自動入札」の問題を中心に展開している。この問題は、私たちが毎日ショッピング アプリを開いて商品を検索したり閲覧したりするインターフェイスと密接に関係しています。その背後には、膨大な研究と商業的価値があります。NeurIPS の専門審査員は、コンテストの問題を「実用的に重要で、よく組織され、十分にテストされている(実用的に重要で、十分に組織され、十分にテストされている)」と評価しました。

では、「大規模オークションにおける自動入札」の何が問題なのでしょうか?なぜ北京大学・アリママ人工知能イノベーション共同研究室によって提案され、これほど高い評価を得たのでしょうか?出場者は具体的に何をするのですか?この記事では、機械の心臓部を 1 つずつ解体していきます。

「大規模オークションの自動入札」とは何ですか?

「大規模オークションの自動入札」とは何かを理解するために、まずタオバオを開いて買い物を始めたときの経験を思い出してみましょう。



キーワードを入力するたびに、システムは製品ページをポップアップ表示します。実際、このページは非常に特殊です。どの製品が表示されるか、どの製品が 1 位にランクされるかは、システムによる正確な計算の結果です。広告は、プラットフォームが広告枠を広告主に割り当てるオークション メカニズムを実行した結果です。

プロセス全体の動作ロジックは次のとおりです。 まず、プラットフォームはユーザーの興味と行動パターンを分析してユーザー プロファイルを構築します。ユーザーが淘宝網で商品を検索または閲覧すると、プラットフォームはすぐにバックグラウンドで広告オークションプロセスを開始します。広告主は、広告を表示する機会を得るために、入札メカニズムを通じてこのオークションに参加します。自動入札システムは、ユーザーのプロフィール、行動データ、広告主のプロモーション目標、予算の制約、オークション環境のさまざまな要因を考慮して、最適な入札戦略をリアルタイムで計算します。これらのデータと計算結果に基づいて、プラットフォームは最も高い入札額と最も関連性の高いユーザー ニーズを持つ広告を選択します。これらの広告結果は、オーガニック検索結果とともにユーザーに表示されます。プロセス全体は完全に自動化されており、非常に短時間で完了できます。

このプロセスからわかることは、自動入札システムにより、広告主は広告掲載プロセスを大幅に簡素化し、人工知能テクノロジーを使用して正確なマーケティングを実現できるため、時間とエネルギーを節約できます。

2023 年には、世界のオンライン広告市場は 6,268 億米ドルに達すると予想されます。自動入札テクノロジーは、同社の継続的な成長を促進するために不可欠です。同様の研究課題には、広告戦略やその他のメカニズム設計が含まれており、これらはすべて意思決定インテリジェンスの研究範囲に属します。意思決定インテリジェンスに関連する研究は、企業に新しい運用方法をもたらし、意思決定メカニズムにおける人への依存を軽減し、それによって企業の収益成長率を大幅に高め、成長余地を拡大することができます。

しかし、コンペ問題における「自動入札」を行うのは簡単ではありません。なぜなら、自動入札システムは、ユーザーの行動データ、広告データ、入札データ、その他の多次元情報を網羅する膨大で複雑なデータの洪水に対処する必要があり、これらのデータはリアルタイムで更新されるからです。さらに、システムは不確実性に満ちたゲーム環境で意思決定を行う必要があるため、影響を与えるすべての要因に関する完全な情報を取得することはできません。したがって、システムは現在利用可能なデータと蓄積された過去の経験にのみ依存して、インテリジェントなアルゴリズムを通じて予測と決定を行い、急速に変化する市場環境で最適な入札選択を行うよう努めます。

「自動入札」の最適化パス

強化学習から生成AIまで

全体として、入札に対する業界のアプローチは 4 世代にわたって進化してきました。アリママは、自動入札戦略の最適化について長年研究を行ってきました。

  • 第 1 世代: クラシック コントロール クラス。効果を最大化する最適化問題は、間接的に予算消費の制御問題に変換されます。ビジネスデータに基づいて消費カーブを計算し、設定されたカーブに従って可能な限り消費される予算を制御します。 PID および関連する改善は、この段階で一般的に使用される制御アルゴリズムです。入札トラフィックの価値分布が安定している場合、このタイプのアルゴリズムは基本的にビジネス開始初期の最適化効果を満たすことができます。
  • 2期生:企画・解決の授業。第 1 世代と比較して、計画および解決 (LP) アルゴリズムは、目標の最大化の問題を解決することを直接指向しています。現在の将来のトラフィックセットは、前日の入札トラフィックに基づいて予測して、入札パラメータを解決することができます。自動入札問題は、現在納品されているデータをもとに新たな副問題となるため、この手法、つまりオンラインLPで複数回解くことが可能です。このタイプの方法は、将来の参加トラフィックの正確な予測に依存しているため、実際のシナリオを実装する場合は、将来のトラフィックの質と量を予測するためにさらに多くの作業を行う必要があります。
  • 第 3 世代: 強化学習。実際の環境では、オンライン入札環境は非常に複雑で動的に変化するため、将来のトラフィック収集を正確に予測することは困難であり、予算サイクル全体を調整することによってのみ効果を最大化することができます。典型的な順序決定問題として、第 3 段階では強化学習手法を使用して自動入札戦略を最適化します。その反復プロセスは、古典的な強化学習手法の初期実装から、オフライン RL 手法に基づいた「オンラインの実環境におけるデータ分布」のさらなる近似、そして問題の本質にアプローチして対話型学習を実装する最終段階まで進化しました。オンラインRL方式によるリアル入札環境を採用。
  • 第 4 世代: モデル クラスを生成します。 ChatGPT に代表される生成大規模モデルは大きな勢いで登場しており、多くの分野で驚くべき成果を示しています。新しい技術概念と技術パラダイムは、自動入札アルゴリズムに革命的なアップグレードをもたらす可能性があります。 Alimamaの技術チームは事前に調整を行い、大規模なインテリジェントマーケティング意思決定モデルAIGA(AI Generated Action)を核として広告インテリジェントマーケティングの技術システムを再構築し、AIGB(AI Generated Bidding)に代表される自動入札戦略を導き出しました。



業界の最新研究が第 3 世代 (2022 年) になると、北京大学とアリママ人工知能イノベーション共同研究室(PAAI)が設立されました 。この研究室には産業界と学界の多くの著名人が集まっています: 北京大学情報学部長朱松春教授が学術指導を主導、北京大学主任教授鄧小鉄、北京大学知能学部准教授ソン・グジエそしてAlimamaのテクニカルディレクター鄭波全員が研究室の中心メンバーです。数人の専門家が研究所を率いて、既存の結果に基づく自動入札などの意思決定インテリジェンスの問題の研究を続けています。

研究の過程で、元の強化学習手法には、自動入札などの長期にわたる意思決定シナリオにおける学習エラーが過剰に蓄積する問題など、いくつかの限界があることが判明した。同時に、ChatGPT は複数の分野で生成 AI の強力な機能を検証しています。そこでチームは、生成モデルが自動入札戦略に何をもたらすことができるかを考え始めました。ついに、彼らは、生成モデル構築に基づく入札戦略最適化スキームを提案しました - AIGB (AI Generative Bidding)

具体的には、AIGB は入札、最適化目標、制約などの関連指標を同時確率分布として扱い、それによって入札の問題を条件付き分布生成問題に変換します。強化学習の観点とは異なり、(下図に示すように) 意思決定の軌跡と報酬情報を直接関連付けるため、トレーニング エラーの蓄積を回避でき、長いシーケンスの意思決定シナリオにより適しています。これは、スマート入札の分野で生成的大規模モデルを適用するという共同研究所の最初の試みです。関連論文が世界最高峰の国際会議KDD2024に採択されました



もちろん、「大規模オークションにおける自動入札」のような意思決定インテリジェンスの問題は解決には程遠く、これらの問題への生成型AIの適用は試験段階に入ったばかりである。したがって、共同研究室は、長年にわたる研究の蓄積を活用し、コミュニティの力を結集して、共同で詳細な研究とこれらの問題の解決策を推進することを期待して、関連する競争質問を NeurIPS に提出しました。

これらの問題は商業的価値があるだけでなく、それ自体も高い研究価値を持っています。意思決定インテリジェンスは人工知能、データ サイエンス、ゲーム理論などの分野を統合するため、複雑な問題を解決するための体系的なフレームワークを提供します。これにより、学際的な統合が促進され、コンピューター サイエンス、統計、経済などの分野でのイノベーションとコラボレーションが推進されます。

AIGB とゼネラルモーターズは 2 つの主要なトラックです

登録は受付中です

「大規模オークションにおける自動入札」コンテストのテーマは、次の 2 つのトラックに分かれています。

  • AIGB トラック: 生成モデルを使用して自動入札エージェントを学習する
  • ユニバーサル トラック: 不確実性のある自動入札

AIGB トラックでは、出場者は長いシーケンスに対して正確な入札決定を行う方法を考える必要があります。前述したように、この問題に直面すると、従来の強化学習手法はエラーの蓄積などの要因によって制限され、そのパフォーマンスも制限されますが、このタスクでは一般化された生成モデルが大きな可能性を示しています。したがって、このトラックでは、出場者はこの課題に対処するために、拡散モデル、トランスフォーマーなどの幅広い生成モデルを採用する必要があります。拡散モデル、トランスフォーマー、基盤モデル、大規模言語モデル (LLM)、およびその他の生成方法に関する研究または業界の背景がある場合は、このトラックへのサインアップを検討してください。

一般トラックでは、出場者は大規模なオークションで効果的な入札決定を下すことが求められ、そのためには競合他社の戦略の変化を効果的に感知する必要があります。現実世界の複雑な広告オークション環境は、さらなる課題、つまり不確実性をもたらします。参加者は、消費者の到着のランダム性、コンバージョン行動の予測のばらつき、データの希薄性、その他の要因を考慮する必要があります。強化学習、最適化、機械学習、ゲー​​ム理論、データ サイエンスに関する研究または業界の背景がある場合は、このトラックへのサインアップを検討してください。

このコンテストに参加すると、多くの報酬が得られます。 NeurIPS は国際的な影響力が非常に高く、コンテストで優秀な成績を収めることは間違いなく履歴書の加点となり、将来のキャリア形成に非常に役立ちます。さらに、優勝者には、コンテスト賞金 6,000 ドルのほか、キャンパス採用のグリーン チャネルであるアリババでのインターンシップの機会、および客員奨学生の資格を獲得する機会も与えられます。

このコンテストでは、約 5 億件のゲーム データとそれに対応するトレーニング フレームワークも初めて利用可能になります。このような大規模なゲーム データは業界では非常にまれです。これは、意思決定インテリジェンス、強化学習、ゲー​​ム、生成モデルの分野の研究者や実践者にとって、良い実践と研究の機会です。

スケジュールと賞品は以下の通りです。



  • AIGB トラック登録: https://tianchi.aliyun.com/competition/entrance/532236
  • 一般トラック登録: https://tianchi.aliyun.com/competition/entrance/532226

大会公式サイト:https://tianchi.aliyun.com/specials/promotion/neurips2024_alimama#/