Alimama는 어떤 종류의 경쟁 문제를 출제하고 NeurIPS 2024에 선정되었나요?

2024-07-15

머신하트 오리지널

저자: 장첸

"입찰"을 할 수 있는 것도 매우 실용적인 기술입니다.

많은 최고의 인공 지능 컨퍼런스 중 NeurIPS는 어디에 속합니까? 누군가가 그것을 "The Legend of Zhen Huan"의 세계에 넣고 그림을 만들었습니다. 아마도 "두 번째 위치"에 합당할 것입니다.

사진 출처: Xiaohongshu 사용자 @云juanyeshu

이 순위는 논란의 여지가 있을 수 있지만 NeurIPS가 항상 상위 AI 컨퍼런스에서 상위 3위 안에 들었고 오랫동안 Google Scholar의 글로벌 저널 및 모든 분야에서 상위 컨퍼런스에서 상위 10위 안에 들었다는 것은 의심의 여지가 없습니다.

따라서 이번 학회에서 논문을 발표하는 것은 많은 AI 연구자들의 공통 목표이다. 획기적인 AlexNet, Transformer 및 GPT-3 논문은 모두 이 최고 컨퍼런스에서 승인된 논문입니다.

그러나 논문이 NeurIPS의 전체 가치를 대변하지는 않는다는 점은 주목할 가치가 있습니다. 컨퍼런스 기간 동안 개최되는 일부 대회는 AI 실습에 중점을 두는 일부 연구자 및 엔지니어에게 더 적합할 수 있습니다. NeurIPS 관계자도 “이러한 대회는 복잡한 문제를 연구하고 해결하는 데 중요한 역할을 합니다.」。

그렇다면 이러한 대회는 어디서 찾을 수 있나요? 실제로 NeurIPS 관계자는 지난 6월에 이러한 대회 목록을 구체적으로 제공하는 블로그를 게시했습니다.

목록에는 총 16개의 경쟁 질문이 포함되어 있으며 각 질문은 심사를 거쳐 컨퍼런스에서 요구하는 요구 사항을 갖추고 있습니다.광범위한 과학적 연구 가치」。

이러한 경쟁 질문은 NeurIPS에서 공식적으로 수집합니다. 지난 몇 년간의 경험으로 볼 때, 최종 선발될 수 있는 공모 문항의 대부분은 대학이나 연구기관, Google, OpenAI, Meta 등 외국 기술 기업에서 나온 것입니다. 국내 업계에서 제출하는 공모 문항의 비중은 매우 낮습니다. 선정될 확률. 올해는 대형모델 트랙의 인기로 인해 대회 경쟁이 더욱 치열해졌다.

그런데 놀라운 것은 이렇게 치열한 경쟁 속에서도 국내 업계에는 여전히 두각을 나타내는 사람들이 있다는 점이다.”대규모 경매에서의 자동 입찰: 불확실하고 경쟁적인 게임에서의 의사결정 학습(대규모 경매의 자동입찰: 불확실하고 경쟁적인 게임에서의 결정 학습)'이 그들이 제출한 공모전 주제이다.

대회 공식 홈페이지: https://tianchi.aliyun.com/specials/promotion/neurips2024_alimama#/

이번 공모전 질문은 베이징대-알리마마 인공지능혁신공동연구소(PAAI) 내 의사결정 지능 협력팀이 제작한 것으로, 첫 번째 단위로 알리마마 의사결정 지능 기술팀이 베이징대 연구진과 공동으로 제출물을 제출했다. 북경대학교 덩샤오티에(Deng Xiaotie) 교수와 루종칭(Lu Zongqing) 교수. 대회 타이틀이 선정된 후 알리마마는 대회 개최권을 획득해, 올해 NeurIPS 대회 개최권을 획득한 국내 업계 유일의 기관이 됐다.

공모 주제는 '대규모 경매의 자동입찰' 문제를 중심으로 전개된다. 이 문제는 우리가 매일 쇼핑 앱을 열고 제품을 검색하고 탐색하는 인터페이스와 밀접한 관련이 있습니다. 그 뒤에는 엄청난 연구와 상업적 가치가 있습니다.NeurIPS 전문가 심사위원들은 공모전 질문에 대해 "실질적으로 중요하고 잘 정리되어 있으며 잘 테스트되었습니다(Practically important, 잘 정리되어 있으며 잘 테스트되었습니다)"라고 평가했습니다.。

그렇다면 '대규모 경매 자동입찰'의 문제점은 무엇일까? 북경대학교-알리마마 인공지능혁신합동연구소에서 제안하고 이렇게 높은 평가를 받은 이유는 무엇일까요? 참가자들은 정확히 어떤 일을 하나요? 이 글에서는 기계의 심장(Heart of the Machine)을 하나씩 분해해 보겠습니다.

'대규모 경매 자동입찰'이란?

'대규모 경매 자동입찰'이 무엇인지 이해하기 위해 먼저 타오바오를 열고 쇼핑을 시작한 경험을 떠올려보자.

키워드를 입력할 때마다 시스템이 제품 페이지를 팝업으로 표시합니다. 실제로 이 페이지는 매우 특별합니다. 어떤 제품이 표시되고 어떤 제품이 첫 번째 순위에 오를지는 시스템의 정확한 계산 결과입니다. 광고는 광고주에게 광고 슬롯을 할당하는 경매 메커니즘을 실행하는 플랫폼의 결과입니다.

전체 프로세스의 운영 로직은 다음과 같습니다. 첫째, 플랫폼은 사용자의 관심분야와 행동 패턴을 분석하여 사용자 프로필을 구축합니다. 사용자가 타오바오에서 제품을 검색하거나 탐색하면 플랫폼은 즉시 백그라운드에서 광고 경매 프로세스를 시작합니다. 광고주는 자신의 광고를 게재할 기회를 얻기 위해 입찰 메커니즘을 통해 이 경매에 참여합니다. 자동입찰 시스템은 이 과정에서 핵심적인 역할을 하며, 사용자의 프로필, 행동 데이터, 광고주의 프로모션 목표, 예산 제약, 경매 환경의 다양한 요소를 고려하여 실시간으로 최적의 입찰 전략을 계산합니다. 이러한 데이터와 계산 결과를 바탕으로 플랫폼은 가장 높은 입찰가와 가장 관련성이 높은 사용자 요구를 갖춘 광고를 선택합니다. 이러한 광고 결과는 자연적인 결과와 함께 사용자에게 표시됩니다. 전체 프로세스는 완전히 자동화되어 매우 짧은 시간 내에 완료될 수 있습니다.

이 과정에서 알 수 있는 것은자동입찰 시스템을 통해 광고주는 광고 과정을 대폭 단순화하고 인공지능 기술을 활용해 정확한 마케팅을 실현함으로써 시간과 에너지를 절약할 수 있습니다.

2023년에는 전 세계 온라인 광고 시장이 6,268억 달러에 이를 것으로 예상됩니다. 자동 입찰 기술은 지속적인 성장을 추진하는 데 매우 중요합니다. 유사한 연구 질문에는 광고 전략 및 기타 메커니즘 설계가 포함되며, 이는 모두 의사 결정 지능의 연구 범위에 속합니다. 의사 결정 정보와 관련된 연구는 기업에 새로운 운영 방법을 제공하고 의사 결정 메커니즘에서 사람에 대한 의존도를 줄여 회사의 수익 성장률을 크게 높이고 성장 공간을 늘릴 수 있습니다.

하지만 경쟁질문에서는 '자동입찰'을 하기가 쉽지 않다. 자동 입찰 시스템은 사용자 행동 데이터, 광고 데이터, 입찰 데이터 및 기타 다차원 정보를 포괄하는 거대하고 복잡한 데이터 홍수를 처리해야 하며 이러한 데이터는 실시간으로 업데이트되어야 하기 때문입니다. 또한, 시스템은 불확실성이 가득한 게임 환경에서 의사결정을 내려야 하며, 모든 영향 요인에 대한 완전한 정보를 얻을 수는 없습니다. 따라서 시스템은 현재 이용 가능한 데이터와 축적된 과거 경험에만 의존하여 지능형 알고리즘을 통해 예측과 의사결정을 내릴 수 있으며, 급변하는 시장 환경에서 최적의 입찰 선택을 하기 위해 노력하고 있습니다.

"자동 입찰" 최적화 경로

강화 학습에서 생성 AI까지

전반적으로 입찰에 대한 업계의 접근 방식은 4세대에 걸쳐 진화해 왔습니다. Alimama는 또한 자동 입찰 전략의 최적화에 대한 수년간의 연구를 수행했습니다.

1세대: 클래식 컨트롤 클래스. 효과를 극대화하는 최적화 문제는 간접적으로 예산소비의 통제 문제로 변형된다. 비즈니스 데이터를 기반으로 소비 곡선을 계산하고, 설정된 곡선에 따라 소비되도록 예산을 최대한 관리합니다. 이 단계에서는 PID 및 관련 개선 사항이 일반적으로 사용되는 제어 알고리즘입니다. 입찰 트래픽의 가치 분포가 안정적일 때 이러한 유형의 알고리즘은 기본적으로 사업 시작 초기에 최적화 효과를 충족할 수 있습니다.
2세: 계획과 해결 수업. 1세대에 비해 LP(Planning and Solving) 알고리즘은 목표 최대화 문제 해결을 직접적으로 지향합니다. 현재 미래 트래픽 세트는 입찰 매개변수를 해결하기 위해 전날의 입찰 트래픽을 기반으로 예측할 수 있습니다. 자동입찰 문제는 현재 전달되는 데이터를 기반으로 새로운 하위 문제가 되기 때문에 이 방법, 즉 온라인 LP를 통해 여러 번 해결할 수 있다. 이러한 유형의 방법은 향후 참여 트래픽에 대한 정확한 예측에 의존하므로 실제 시나리오를 구현할 때 향후 트래픽의 품질과 양을 예측하기 위해 더 많은 작업을 수행해야 합니다.
3세대: 강화 학습. 실제 환경에서는 온라인 입찰 환경이 매우 복잡하고 동적으로 변화하며 향후 트래픽 수집을 정확하게 예측하기 어렵기 때문에 전체 예산 주기를 조율해야만 효과를 극대화할 수 있습니다. 일반적인 순서 의사결정 문제로 세 번째 단계에서는 강화학습 방법을 사용하여 자동 입찰 전략을 최적화합니다. 반복 프로세스는 고전적인 강화 학습 방법의 초기 구현에서 Offline RL 방법을 기반으로 한 "실제 온라인 환경에서의 데이터 배포"에 대한 추가 접근, 문제의 본질에 접근하고 대화형 구현의 최종 단계로 발전했습니다. Online RL 방식을 기반으로 실제 입찰 환경을 학습합니다.
4세대: 모델 클래스를 생성합니다. ChatGPT로 대표되는 생성적 대형 모델은 큰 추진력을 얻고 있으며 다양한 분야에서 놀라운 결과를 보여왔습니다. 새로운 기술 개념과 기술 패러다임은 자동 입찰 알고리즘에 혁명적인 업그레이드를 가져올 수 있습니다. Alimama의 기술팀은 사전 준비를 통해 대규모 지능형 마케팅 의사결정 모델 AIGA(AI 생성 행동)를 핵심으로 지능형 마케팅 광고 기술 시스템을 재편하고 AIGB(AI 생성 입찰)로 대표되는 자동 입찰 전략을 도출했습니다.

업계 최신 연구가 3세대(2022년)에 이르면,북경대학교-알리마마 인공지능혁신공동연구소(PAAI) 설립 .이 실험실에는 산업계와 학계의 많은 유명 인사들이 모였습니다. 북경대학교 정보대학원장주송춘교수가 학문지도를 이끌고 북경대학교 석좌교수덩샤오티에, 북경대학교 지능대학 부교수송궈지에Alimama의 기술 이사정 보 그들은 모두 연구실의 핵심 구성원입니다. 몇몇 전문가들은 실험실을 이끌고 기존 결과를 기반으로 한 자동 입찰과 같은 의사 결정 인텔리전스 문제를 계속 연구합니다.

연구 과정에서 원래의 강화학습 방법에는 자동 입찰과 같은 장기 순서 의사결정 시나리오에서 훈련 오류가 과도하게 누적되는 문제 등 몇 가지 한계가 있음을 발견했습니다. 동시에 ChatGPT는 여러 분야에서 생성 AI의 강력한 기능을 검증하고 있습니다. 그래서 팀은 생성 모델이 자동 입찰 전략에 어떤 영향을 미칠 수 있는지 생각하기 시작했습니다. 마지막으로,생성모델 구축-AIGB(AI Generative Bidding) 기반의 입찰 전략 최적화 방안을 제안했다.。

구체적으로 AIGB는 입찰, 최적화 목표, 제약 조건 등 관련 지표를 결합 확률 분포로 처리하여 입찰 문제를 조건부 분포 생성 문제로 변환합니다. 강화 학습의 관점과 달리, 이는 결정 궤적과 보상 정보(아래 그림 참조)를 직접 연관시켜 훈련 오류의 누적을 피할 수 있으며 긴 시퀀스 의사 결정 시나리오에 더 적합합니다. 이는 스마트 비딩 분야에서 생성적 대형 모델을 적용하려는 공동 연구실의 첫 번째 시도입니다.최고의 국제 컨퍼런스 KDD 2024에서 관련 논문이 채택되었습니다.。

물론 '대규모 경매의 자동 입찰'과 같은 의사결정 지능 문제는 아직 해결되지 않았으며, 이러한 문제에 대한 생성 AI의 적용은 이제 막 시험 단계에 진입했습니다. 따라서 공동 연구소는 수년간의 연구 축적을 활용하고 커뮤니티의 힘을 모아 이러한 문제에 대한 심층적인 연구와 솔루션을 공동으로 촉진하기를 희망하면서 관련 경쟁 질문을 NeurIPS에 제출했습니다.

이러한 문제들은 상업적 가치 외에도 그 자체로도 높은 연구 가치를 갖고 있습니다. 의사결정 인텔리전스는 인공지능, 데이터 과학, 게임 이론 등의 분야를 통합하기 때문에 복잡한 문제를 해결하기 위한 체계적인 프레임워크를 제공합니다. 이는 학제간 통합을 촉진하고 컴퓨터 공학, 통계, 경제학 등의 분야에서 혁신과 협력을 촉진합니다.

AIGB와 General Motors는 두 가지 주요 트랙입니다.

등록이 시작되었습니다

"대규모 경매의 자동 입찰" 대회 주제는 다음과 같은 두 가지 트랙으로 나뉩니다.

AIGB 트랙: 생성 모델을 사용하여 자동 입찰 에이전트 학습
범용 트랙: 불확실성이 있는 자동 입찰

AIGB 트랙에서 참가자는 긴 시퀀스에 대해 정확한 입찰 결정을 내리는 방법에 대해 생각해야 합니다. 앞서 언급했듯이 이 문제에 직면할 때 기존 강화 학습 방법은 오류 누적 및 기타 요인으로 인해 제한되며 성능도 제한됩니다. 그러나 일반화된 생성 모델은 이 작업에서 큰 잠재력을 보여주었습니다. 따라서 이 트랙에서는 참가자가 이 문제를 해결하기 위해 확산 모델, 변압기 등과 같은 광범위한 생성 모델을 채택해야 합니다. 확산 모델, 변환기, 기초 모델, LLM(대형 언어 모델) 및 기타 생성 방법에 대한 연구 또는 업계 배경이 있는 경우 이 트랙 등록을 고려할 수 있습니다.

일반 트랙에서 참가자는 대규모 경매에서 효과적인 입찰 결정을 내려야 하며, 이를 위해서는 경쟁사의 전략 변화를 효과적으로 감지해야 합니다. 복잡한 실제 광고 경매 환경은 불확실성이라는 추가적인 과제를 안겨줍니다. 참가자는 소비자 도착의 무작위성, 전환 행동 예측의 차이, 데이터 희박성 및 기타 요인을 고려해야 합니다. 강화 학습, 최적화, 기계 학습, 게임 이론 및 데이터 과학에 대한 연구 또는 업계 배경이 있는 경우 이 트랙 등록을 고려할 수 있습니다.

이번 대회에 참가하시면 많은 보상을 받으실 수 있습니다. NeurIPS는 국제적으로 매우 높은 영향력을 갖고 있으며 대회에서 우수한 결과를 얻는 것은 의심할 여지 없이 귀하의 이력서에 플러스가 될 것이며 향후 경력 개발에 매우 도움이 될 것입니다. 또한 우승자에게는 미화 6,000달러의 경쟁 상금을 받을 수 있는 기회와 함께 학교 채용을 위한 친환경 채널인 알리바바에서 인턴십 기회와 방문 학자 자격도 제공됩니다.

또한 이번 대회를 통해 처음으로 약 5억 개의 게임 데이터와 이에 상응하는 교육 프레임워크가 제공될 예정입니다. 이러한 대규모 게임 데이터는 업계에서 매우 드뭅니다. 이는 의사결정 인텔리전스, 강화 학습, 게임 및 생성 모델 분야의 연구자 및 실무자에게 좋은 사례이자 연구 기회입니다.

일정과 경품은 다음과 같습니다.

AIGB 트랙 등록: https://tianchi.aliyun.com/competition/entrance/532236
일반 트랙 등록: https://tianchi.aliyun.com/competition/entrance/532226

대회 공식 홈페이지: https://tianchi.aliyun.com/specials/promotion/neurips2024_alimama#/

소식

Alimama는 어떤 종류의 경쟁 문제를 출제하고 NeurIPS 2024에 선정되었나요?

소개

내 연락처 정보