notícias

Que tipo de questões de competição o Alimama fez e foi escolhido pelo NeurIPS 2024?

2024-07-15

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

Máquina Coração Original

Autor: Zhang Qian

Ser capaz de “licitar” também é uma habilidade muito prática.

Entre as muitas conferências importantes sobre inteligência artificial, a que lugar pertence o NeurIPS? Alguém o colocou no universo de “A Lenda de Zhen Huan” e fez uma foto: provavelmente merece a “segunda posição”.



Fonte da imagem: usuário Xiaohongshu @云juanyeshu

Essa classificação pode ser controversa, mas não há dúvida de que o NeurIPS sempre esteve entre os três primeiros nas principais conferências de IA e há muito tempo está entre os dez primeiros periódicos globais e conferências importantes do Google Scholar em todas as disciplinas.



Portanto, poder publicar artigos nesta conferência é um objetivo comum de muitos pesquisadores de IA. Os artigos inovadores AlexNet, Transformer e GPT-3 são todos aceitos nesta importante conferência.

No entanto, é importante notar que os artigos não representam todo o valor do NeurIPS. Algumas competições realizadas durante a conferência podem ser mais adequadas para alguns pesquisadores e engenheiros que se concentram na prática de IA. Até mesmo funcionários do NeurIPS disseram: “Estas competições desempenham um papel importante na pesquisa e resolução de problemas complexos」。

Então, onde posso encontrar essas competições? Na verdade, os funcionários do NeurIPS publicaram um blog em junho fornecendo especificamente uma lista dessas competições.



A lista contém um total de 16 questões do concurso, cada uma das quais foi selecionada e tem o "Amplo valor de pesquisa científica」。



Essas questões da competição são coletadas oficialmente pela NeurIPS. A julgar pela experiência dos últimos anos, a maioria das questões do concurso que podem ser finalmente selecionadas vêm de universidades, instituições de pesquisa ou empresas de tecnologia estrangeiras, como Google, OpenAI, Meta, etc. chance de ser selecionado. Este ano, devido à popularidade dos grandes modelos de pista, a competição na competição é ainda mais intensa.

Mas o que surpreende é que, num ambiente tão acirrado de concorrência, ainda existem pessoas na indústria nacional que se destacam”.Auto-Bidding em Leilões de Grande Escala: Aprendendo a Tomada de Decisão em Jogos Incertos e Competitivos(Lances automatizados em leilões de grande escala: decisões de aprendizagem em jogos incertos e competitivos)" é o tema do concurso que submeteram.



Site oficial da competição: https://tianchi.aliyun.com/specials/promotion/neurips2024_alimama#/

Esta questão do concurso foi produzida pela equipe de cooperação em inteligência para tomada de decisões do Laboratório Conjunto de Inovação em Inteligência Artificial da Universidade de Pequim-Alimama (PAAI), como a primeira unidade, apresentou a submissão em conjunto com a equipe de pesquisa de. Professor Deng Xiaotie e Professor Lu Zongqing da Universidade de Pequim. Após a escolha do tema do concurso, a Alimama conquistou o direito de sediar o concurso, tornando-se a única organização da indústria nacional a conquistar o direito de sediar o concurso NeurIPS este ano.

O tema da competição gira em torno do problema dos “licitações automatizadas em leilões de grande escala”. Esse problema está intimamente relacionado à interface na qual abrimos aplicativos de compras todos os dias para pesquisar e navegar pelos produtos. Há uma enorme pesquisa e valor comercial por trás disso.Os juízes especialistas do NeurIPS avaliaram a questão da competição como "Praticamente importante, bem organizado e bem testado (Praticamente importante, bem organizado e bem testado)"

Então, qual é o problema dos “licitações automatizadas em leilões de grande escala”? Por que foi proposto pelo Laboratório Conjunto de Inovação em Inteligência Artificial da Universidade de Pequim-Alimama e recebeu tantos elogios? O que exatamente os competidores fazem? O Coração da Máquina será desmontado um por um neste artigo.

O que são “licitações automáticas em leilões de grande escala”?

Para entender o que é “licitação automática em leilões de grande escala”, vamos primeiro relembrar a experiência de abrir o Taobao e começar a fazer compras.



Cada vez que você insere uma palavra-chave, o sistema exibirá uma página de produto. Na verdade, esta página é muito particular: quais produtos aparecerão e quais produtos serão classificados em primeiro lugar são resultados de cálculos precisos do sistema. Os anúncios são o resultado da plataforma que executa um mecanismo de leilão para alocar espaços publicitários aos anunciantes.

A lógica de funcionamento de todo o processo é a seguinte: Primeiro, a plataforma construirá um perfil de usuário analisando os interesses e padrões de comportamento do usuário. Quando os usuários pesquisam ou navegam por produtos no Taobao, a plataforma inicia imediatamente o processo de leilão de publicidade em segundo plano. Os anunciantes participam deste leilão por meio do mecanismo de licitação, na esperança de ter a oportunidade de exibir seus anúncios. O sistema de licitação automática desempenha um papel fundamental neste processo. Leva em consideração o perfil do usuário, os dados comportamentais, as metas de promoção do anunciante, as restrições orçamentárias e vários fatores do ambiente de leilão para calcular a estratégia de licitação ideal em tempo real. Com base nesses dados e resultados de cálculo, a plataforma selecionará o anúncio com lance mais alto e com as necessidades do usuário mais relevantes. Esses resultados de anúncios são exibidos aos usuários junto com os resultados orgânicos. Todo o processo é totalmente automatizado e pode ser concluído em muito pouco tempo.

Pode-se perceber a partir deste processo queAtravés do sistema de lances automatizados, os anunciantes podem simplificar bastante o processo de colocação de anúncios e usar tecnologia de inteligência artificial para obter um marketing preciso, economizando tempo e energia.

Em 2023, o mercado global de publicidade online atingirá 626,8 mil milhões de dólares. A tecnologia de licitação automática é fundamental para impulsionar seu crescimento contínuo. Questões de pesquisa semelhantes incluem estratégias publicitárias e outros designs de mecanismos, todos pertencentes ao escopo de pesquisa da inteligência para tomada de decisão. A investigação relacionada com a inteligência de tomada de decisão pode trazer novos métodos operacionais para as empresas e reduzir a sua dependência das pessoas nos mecanismos de tomada de decisão, aumentando assim significativamente a taxa de crescimento das receitas da empresa e aumentando o seu espaço de crescimento.

Porém, não é fácil fazer o “licitação automática” na questão concorrencial. Porque o sistema de licitação automática precisa lidar com uma enorme e complexa inundação de dados, abrangendo dados de comportamento do usuário, dados de publicidade, dados de licitação e outras informações multidimensionais, e esses dados serão atualizados em tempo real. Além disso, o sistema também precisa tomar decisões em um ambiente de jogo cheio de incertezas e não consegue obter informações completas sobre todos os fatores que influenciam. Portanto, o sistema só pode confiar nos dados atualmente disponíveis e na experiência histórica acumulada para fazer previsões e decisões através de algoritmos inteligentes, esforçando-se para fazer escolhas de licitação ideais num ambiente de mercado em rápida mudança.

Caminho de otimização de "lances automáticos"

Da aprendizagem por reforço à IA generativa

No geral, a abordagem da indústria em relação às licitações passou por quatro gerações de evolução. Alimama também conduziu muitos anos de pesquisas sobre a otimização de estratégias de lances automáticos.

  • Primeira geração: classe de controle clássica. O problema de otimização de maximização do efeito é indiretamente transformado no problema de controle do consumo orçamentário. Calcule a curva de consumo com base nos dados do negócio e controle ao máximo o orçamento a ser consumido de acordo com a curva definida. PID e melhorias relacionadas são algoritmos de controle comumente usados ​​neste estágio. Quando a distribuição de valor do tráfego de licitação é estável, esse tipo de algoritmo pode basicamente atender ao efeito de otimização no início do lançamento do negócio.
  • Segunda geração: aula de planejamento e resolução. Comparado com a primeira geração, o algoritmo de planejamento e resolução (LP) é diretamente orientado para resolver o problema de maximização de metas. O conjunto de tráfego futuro atual pode ser previsto com base no tráfego de lances do dia anterior para resolver os parâmetros de lances. O problema da licitação automática torna-se um novo subproblema baseado nos dados entregues atualmente, podendo ser resolvido por este método múltiplas vezes, ou seja, LP Online. Este tipo de método depende de previsões precisas do tráfego futuro participante, portanto, ao implementar o cenário real, é necessário fazer mais trabalho para prever a qualidade e a quantidade do tráfego futuro.
  • A terceira geração: aprendizagem por reforço. No ambiente real, o ambiente de licitação on-line é muito complexo e muda dinamicamente, e é difícil prever com precisão as cobranças futuras de tráfego. Somente coordenando todo o ciclo orçamentário o efeito pode ser maximizado. Como um problema típico de tomada de decisão sequencial, o terceiro estágio utiliza métodos de aprendizagem por reforço para otimizar a estratégia de lances automáticos. Seu processo iterativo evoluiu desde a implementação inicial de métodos clássicos de aprendizagem por reforço, até uma maior aproximação da "distribuição de dados no ambiente real online" com base no método RL offline, até o estágio final de abordagem da essência do problema e implementação de aprendizagem interativa. com o ambiente real de licitação baseado no método RL Online.
  • A quarta geração: Gere classes de modelo. Grandes modelos generativos representados pelo ChatGPT estão chegando com grande impulso e têm mostrado resultados surpreendentes em muitos campos. Novos conceitos técnicos e paradigmas técnicos podem trazer atualizações revolucionárias aos algoritmos de lances automáticos. A equipe técnica da Alimama tomou providências com antecedência, remodelou o sistema técnico de marketing inteligente de publicidade com o grande modelo de tomada de decisão de marketing inteligente AIGA (AI Generated Action) como núcleo e derivou estratégias de lances automáticos representadas por AIGB (AI Generated Bidding).



Quando as pesquisas mais recentes do setor estiverem em sua terceira geração (2022),O Laboratório Conjunto de Inovação em Inteligência Artificial da Universidade de Pequim-Alimama (PAAI) foi estabelecido .Este laboratório reúne muitos grandes nomes da indústria e da academia: Reitor da Escola de Inteligência da Universidade de PequimZhu SongchunProfessor lidera orientação acadêmica, professor titular da Universidade de PequimDeng Xiaotie, Professor Associado, Escola de Inteligência, Universidade de PequimCanção Guojiee o diretor técnico da AlimamaZheng Bo Eles são todos membros principais do laboratório. Vários especialistas lideram o laboratório para continuar a estudar questões de inteligência para tomada de decisão, como licitação automática com base nos resultados existentes.

Durante o processo de pesquisa, eles descobriram que o método original de aprendizagem por reforço tinha algumas limitações, como o problema de acúmulo excessivo de erros de treinamento em cenários de tomada de decisão de longa sequência, como lances automáticos. Ao mesmo tempo, o ChatGPT está verificando os poderosos recursos da IA ​​generativa em vários campos. Então a equipe começou a pensar no que os modelos generativos poderiam trazer para as estratégias de lances automáticos. finalmente,Eles propuseram um esquema de otimização de estratégia de licitação baseado na construção de modelo generativo - AIGB (AI Generative Bidding)

Especificamente, o AIGB trata indicadores relevantes, como licitações, metas de otimização e restrições, como uma distribuição de probabilidade conjunta, transformando assim o problema de licitação em um problema de geração de distribuição condicional. Diferente da perspectiva da aprendizagem por reforço, correlaciona diretamente a trajetória de decisão e as informações de recompensa (conforme mostrado na figura abaixo), o que pode evitar o acúmulo de erros de treinamento e é mais adequado para cenários de tomada de decisão de longa sequência. Esta é a primeira tentativa do laboratório conjunto de aplicar grandes modelos generativos na área de licitações inteligentes.Artigos relacionados foram aceitos pela principal conferência internacional KDD 2024



É claro que problemas de inteligência para tomada de decisões, como "licitações automatizadas em leilões de grande escala", estão longe de ser resolvidos, e a aplicação de IA generativa a esses problemas acaba de entrar em fase experimental. Portanto, o laboratório conjunto submeteu questões de competição relevantes ao NeurIPS, na esperança de aproveitar anos de acumulação de pesquisas e reunir o poder da comunidade para promover conjuntamente pesquisas aprofundadas e soluções para esses problemas.

Além do valor comercial, esses problemas em si também têm alto valor de pesquisa. Como a inteligência de decisão integra disciplinas como inteligência artificial, ciência de dados e teoria dos jogos, ela fornece uma estrutura sistemática para resolver problemas complexos. Isto promove a integração interdisciplinar e impulsiona a inovação e a colaboração em áreas como ciência da computação, estatística e economia.

AIGB e General Motors são duas pistas principais

As inscrições estão abertas

O tema do concurso “Licitações Automatizadas em Leilões de Grande Porte” está dividido em duas vertentes, nomeadamente:

  • Trilha AIGB: Usando modelos generativos para aprender agentes de licitação automática
  • Universal Track: lances automatizados com incerteza

Na faixa AIGB, os competidores precisam pensar em como tomar decisões precisas de lances para sequências longas. Como mencionado anteriormente, ao enfrentar este problema, os métodos tradicionais de aprendizagem por reforço serão limitados por fatores como o acúmulo de erros, e seu desempenho é limitado. No entanto, os modelos generativos generalizados têm mostrado grande potencial nesta tarefa. Portanto, esta faixa exige que os competidores adotem uma ampla gama de modelos generativos, como Modelos de Difusão, Transformadores, etc., para lidar com este desafio. Se você tem experiência em pesquisa ou indústria em Modelos de Difusão, Transformadores, Modelos de Fundação, Modelos de Linguagem Grande (LLMs) e outros métodos de geração, você pode considerar inscrever-se neste curso.

Na via geral, os concorrentes são desafiados a tomar decisões de licitação eficazes em leilões de grande escala, o que exige uma percepção eficaz das mudanças nas estratégias dos concorrentes. O complexo ambiente de leilão de publicidade no mundo real traz desafios adicionais, nomeadamente incerteza. Os participantes devem considerar a aleatoriedade da chegada dos consumidores, a variação nas previsões do comportamento de conversão, a escassez de dados e outros fatores. Se você tem experiência em pesquisa ou no setor de aprendizado por reforço, otimização, aprendizado de máquina, teoria dos jogos e ciência de dados, considere inscrever-se neste curso.

Participar nesta competição trará muitas recompensas. A NeurIPS tem uma influência internacional muito elevada, e alcançar excelentes resultados em competições é sem dúvida um ponto positivo para o seu currículo e será muito útil para o desenvolvimento futuro da carreira. Além disso, o vencedor também terá a oportunidade de ganhar um prêmio de competição de US$ 6.000, bem como oportunidades de estágio no Alibaba, um canal verde para recrutamento no campus, e status de pesquisador visitante.

Esta competição também disponibilizará pela primeira vez aproximadamente 500 milhões de dados de jogos e a estrutura de treinamento correspondente. Esses dados de jogos em grande escala são muito raros na indústria. Esta é uma boa prática e oportunidade de pesquisa para pesquisadores e profissionais nas áreas de inteligência de decisão, aprendizagem por reforço, jogos e modelos generativos.

A programação e os prêmios são os seguintes:



  • Registro de pista AIGB: https://tianchi.aliyun.com/competition/entrance/532236
  • Inscrição geral na pista: https://tianchi.aliyun.com/competition/entrance/532226

Site oficial da competição: https://tianchi.aliyun.com/specials/promotion/neurips2024_alimama#/