¿Qué tipo de preguntas de competencia hizo Alimama y fue elegida por NeurIPS 2024?

2024-07-15

Máquina Corazón Original

Autor: Zhang Qian

Poder "ofertar" también es una habilidad muy práctica.

Entre las principales conferencias sobre inteligencia artificial, ¿a dónde pertenece NeurIPS? Alguien lo puso en el universo de "La leyenda de Zhen Huan" e hizo una imagen: probablemente merezca la "segunda posición".

Fuente de la imagen: usuario de Xiaohongshu @云juanyeshu

Esta clasificación puede ser controvertida, pero no hay duda de que NeurIPS siempre ha estado entre los tres primeros en las principales conferencias de IA, y durante mucho tiempo ha estado entre los diez primeros de las principales revistas globales y conferencias de Google Scholar en todas las disciplinas.

Por lo tanto, poder publicar artículos en esta conferencia es un objetivo común de muchos investigadores de IA. Los artículos innovadores de AlexNet, Transformer y GPT-3 son todos artículos aceptados en esta importante conferencia.

Sin embargo, vale la pena señalar que los artículos no representan el valor total de NeurIPS. Algunas competencias celebradas durante la conferencia pueden ser más adecuadas para algunos investigadores e ingenieros que se centran en la práctica de la IA. Incluso los funcionarios de NeurIPS dijeron: “Estas competiciones juegan un papel importante en la investigación y resolución de problemas complejos.」。

Entonces, ¿dónde puedo encontrar estos concursos? De hecho, los funcionarios de NeurIPS publicaron un blog en junio dando específicamente una lista de estas competiciones.

La lista contiene un total de 16 preguntas del concurso, cada una de las cuales ha sido seleccionada y cumple con los requisitos exigidos por la conferencia.Amplio valor de investigación científica.」。

Estas preguntas del concurso las recopila oficialmente NeurIPS. A juzgar por la experiencia de años anteriores, la mayoría de las preguntas del concurso que finalmente se pueden seleccionar provienen de universidades, instituciones de investigación o empresas de tecnología extranjeras como Google, OpenAI, Meta, etc. Las preguntas del concurso presentadas por la industria nacional tienen una muy baja posibilidades de ser seleccionado. Este año, debido a la popularidad del modelo de pista grande, la competencia en la competencia es aún más intensa.

Pero lo sorprendente es que en un entorno tan ferozmente competitivo, todavía haya gente en la industria nacional que se destaque".Pujas automáticas en subastas a gran escala: aprender a tomar decisiones en juegos inciertos y competitivos(Pujas automáticas en subastas a gran escala: aprender a tomar decisiones en juegos inciertos y competitivos)", es el tema del concurso que presentaron.

Sitio web oficial del concurso: https://tianchi.aliyun.com/specials/promotion/neurips2024_alimama#/

Esta pregunta del concurso fue elaborada por el equipo de cooperación en inteligencia para la toma de decisiones del Laboratorio Conjunto de Innovación en Inteligencia Artificial (PAAI) de la Universidad de Pekín y Alimama. Como primera unidad, el equipo de tecnología de inteligencia para la toma de decisiones de Alimama presentó la propuesta conjuntamente con los equipos de investigación de. Profesor Deng Xiaotie y profesor Lu Zongqing de la Universidad de Pekín. Después de que se seleccionó el título del concurso, Alimama ganó el derecho a albergar el concurso, convirtiéndose en la única organización de la industria nacional en ganar el derecho a albergar el concurso NeurIPS este año.

El tema de la competencia gira en torno al problema de las "pujas automáticas en subastas a gran escala". Este problema está estrechamente relacionado con la interfaz en la que abrimos aplicaciones de compras todos los días para buscar y explorar productos. Hay un gran valor comercial y de investigación detrás de esto.Los jueces expertos de NeurIPS evaluaron la pregunta del concurso como "Prácticamente importante, bien organizada y bien probada (Prácticamente importante, bien organizada y bien probada)"。

Entonces, ¿cuál es el problema de las "pujas automáticas en subastas a gran escala"? ¿Por qué fue propuesto por el Laboratorio Conjunto de Innovación en Inteligencia Artificial de la Universidad de Pekín y Alimama y recibió tantos elogios? ¿Qué hacen exactamente los concursantes? El Corazón de la Máquina será desmantelado uno por uno en este artículo.

¿Qué es la "puja automática en subastas a gran escala"?

Para comprender qué es la "puja automática en subastas a gran escala", primero recordemos la experiencia de abrir Taobao y comenzar a comprar.

Cada vez que ingresa una palabra clave, el sistema abrirá una página de producto. De hecho, esta página es muy particular: qué productos aparecerán y qué productos ocuparán el primer lugar son el resultado de cálculos precisos del sistema. Los anuncios son el resultado de que la plataforma ejecute un mecanismo de subasta para asignar espacios publicitarios a los anunciantes.

La lógica operativa de todo el proceso es la siguiente: primero, la plataforma creará un perfil de usuario analizando los intereses y patrones de comportamiento del usuario. Cuando los usuarios buscan o exploran productos en Taobao, la plataforma iniciará inmediatamente el proceso de subasta de publicidad en segundo plano. Los anunciantes participan en esta subasta a través del mecanismo de puja, con la esperanza de tener la oportunidad de mostrar sus anuncios. El sistema de ofertas automáticas desempeña un papel fundamental en este proceso. Tiene en cuenta el perfil del usuario, los datos de comportamiento, los objetivos de promoción del anunciante, las limitaciones presupuestarias y diversos factores del entorno de la subasta para calcular la estrategia de oferta óptima en tiempo real. En base a estos datos y resultados del cálculo, la plataforma seleccionará el anuncio con la oferta más alta y las necesidades más relevantes del usuario. Estos resultados de anuncios se muestran a los usuarios junto con los resultados orgánicos. Todo el proceso está totalmente automatizado y puede completarse en muy poco tiempo.

De este proceso se puede ver queA través del sistema de ofertas automáticas, los anunciantes pueden simplificar enormemente el proceso de publicidad y utilizar tecnología de inteligencia artificial para lograr un marketing preciso, ahorrando así tiempo y energía.

En 2023, el mercado mundial de la publicidad online alcanzará los 626.800 millones de dólares. La tecnología de ofertas automáticas es fundamental para impulsar su crecimiento continuo. Preguntas de investigación similares incluyen estrategias publicitarias y otros diseños de mecanismos, todos los cuales pertenecen al ámbito de investigación de la inteligencia para la toma de decisiones. La investigación relacionada con la inteligencia para la toma de decisiones puede aportar nuevos métodos operativos a las empresas y reducir su dependencia de las personas en los mecanismos de toma de decisiones, aumentando así significativamente la tasa de crecimiento de los ingresos de la empresa y aumentando su espacio de crecimiento.

Sin embargo, no es fácil hacer la "oferta automática" en la pregunta de competencia. Porque el sistema de ofertas automatizadas necesita lidiar con una enorme y compleja avalancha de datos, que cubren datos de comportamiento del usuario, datos publicitarios, datos de ofertas y otra información multidimensional, y estos datos se actualizarán en tiempo real. Además, el sistema también necesita tomar decisiones en un entorno de juego lleno de incertidumbre y no puede obtener información completa sobre todos los factores que influyen. Por lo tanto, el sistema sólo puede confiar en los datos disponibles actualmente y en la experiencia histórica acumulada para hacer predicciones y decisiones a través de algoritmos inteligentes, esforzándose por tomar decisiones de oferta óptimas en un entorno de mercado que cambia rápidamente.

Ruta de optimización de las "ofertas automáticas"

Del aprendizaje por refuerzo a la IA generativa

En general, el enfoque de la industria hacia las licitaciones ha pasado por cuatro generaciones de evolución. Alimama también ha realizado muchos años de investigación sobre la optimización de estrategias de ofertas automáticas.

Primera generación: clase de control clásica. El problema de optimización de maximizar el efecto se transforma indirectamente en el problema de control del consumo presupuestario. Calcule la curva de consumo en función de los datos comerciales y controle al máximo el presupuesto a consumir según la curva establecida. PID y las mejoras relacionadas son algoritmos de control comúnmente utilizados en esta etapa. Cuando la distribución del valor del tráfico de ofertas es estable, este tipo de algoritmo básicamente puede lograr el efecto de optimización al comienzo del lanzamiento del negocio.
Segunda generación: clase de planificación y resolución. En comparación con la primera generación, el algoritmo de planificación y resolución (LP) está directamente orientado a resolver el problema de maximización de objetivos. El conjunto de tráfico futuro actual se puede predecir en función del tráfico de ofertas del día anterior para resolver los parámetros de oferta. El problema de la oferta automática se convierte en un nuevo subproblema basado en los datos entregados actualmente, por lo que se puede resolver con este método varias veces, es decir, LP en línea. Este tipo de método se basa en predicciones precisas del tráfico participante futuro, por lo que al implementar el escenario real, es necesario trabajar más para predecir la calidad y cantidad del tráfico futuro.
La tercera generación: aprendizaje por refuerzo. En el entorno real, el entorno de licitación en línea es muy complejo y cambia dinámicamente, y la recaudación futura de tráfico es difícil de predecir con precisión. Sólo coordinando todo el ciclo presupuestario se puede maximizar el efecto. Como problema típico de toma de decisiones en secuencia, la tercera etapa utiliza métodos de aprendizaje por refuerzo para optimizar la estrategia de oferta automática. Su proceso iterativo ha evolucionado desde la implementación temprana del método clásico de aprendizaje por refuerzo, hasta una mayor aproximación de la "distribución de datos en el entorno real en línea" basada en el método Offline RL, hasta la etapa final de acercarse a la esencia del problema e implementar interactivo. aprendiendo con el entorno real de licitación basado en el método Online RL.
La cuarta generación: generar clases de modelo. Los grandes modelos generativos representados por ChatGPT están llegando con gran impulso y han mostrado resultados sorprendentes en muchos campos. Los nuevos conceptos técnicos y paradigmas técnicos pueden aportar actualizaciones revolucionarias a los algoritmos de ofertas automáticas. El equipo técnico de Alimama hizo arreglos con anticipación, reformuló el sistema técnico de publicidad de marketing inteligente con el gran modelo de toma de decisiones de marketing inteligente AIGA (Acción Generada por AI) como núcleo y derivó estrategias de ofertas automáticas representadas por AIGB (Ofertas Generadas por AI).

Cuando las últimas investigaciones de la industria estén en su tercera generación (2022),Se estableció el Laboratorio Conjunto de Innovación en Inteligencia Artificial (PAAI) de la Universidad de Pekín y Alimama .Este laboratorio reúne a muchos nombres importantes de la industria y el mundo académico: Decano de la Escuela de Inteligencia de la Universidad de PekínZhu SongchunProfesor dirige la orientación académica y catedrático de la Universidad de PekínDeng Xiaotie, Profesor asociado, Escuela de Inteligencia, Universidad de Pekíncanción guojiey el director técnico de AlimamaZhengbo Todos ellos son miembros principales del laboratorio. Varios expertos lideran el laboratorio para continuar estudiando cuestiones de inteligencia para la toma de decisiones, como las ofertas automáticas, basadas en los resultados existentes.

Durante el proceso de investigación, descubrieron que el método de aprendizaje por refuerzo original tenía algunas limitaciones, como el problema de la acumulación excesiva de errores de entrenamiento en escenarios de toma de decisiones de secuencia larga, como las ofertas automáticas. Al mismo tiempo, ChatGPT está verificando las poderosas capacidades de la IA generativa en múltiples campos. Entonces, el equipo comenzó a pensar en qué podrían aportar los modelos generativos a las estrategias de ofertas automáticas. finalmente,Propusieron un esquema de optimización de la estrategia de oferta basado en la construcción de modelos generativos: AIGB (AI Generative Bidding)。

Específicamente, AIGB trata indicadores relevantes como ofertas, objetivos de optimización y restricciones como una distribución de probabilidad conjunta, transformando así el problema de licitación en un problema de generación de distribución condicional. A diferencia de la perspectiva del aprendizaje por refuerzo, correlaciona directamente la trayectoria de decisión y la información de recompensa (como se muestra en la figura siguiente), lo que puede evitar la acumulación de errores de entrenamiento y es más adecuado para escenarios de toma de decisiones de secuencia larga. Este es el primer intento del laboratorio conjunto de aplicar grandes modelos generativos en el campo de las ofertas inteligentes.Artículos relacionados han sido aceptados por la principal conferencia internacional KDD 2024。

Por supuesto, los problemas de inteligencia en la toma de decisiones, como la "licitación automática en subastas a gran escala", están lejos de resolverse, y la aplicación de la IA generativa a estos problemas acaba de entrar en la etapa de prueba. Por lo tanto, el laboratorio conjunto presentó preguntas de competencia relevantes a NeurIPS, con la esperanza de aprovechar años de acumulación de investigación y reunir el poder de la comunidad para promover conjuntamente investigaciones en profundidad y soluciones a estos problemas.

Además del valor comercial, estos problemas en sí mismos también tienen un alto valor de investigación. Dado que la inteligencia de decisiones integra disciplinas como la inteligencia artificial, la ciencia de datos y la teoría de juegos, proporciona un marco sistemático para resolver problemas complejos. Esto promueve la integración interdisciplinaria e impulsa la innovación y la colaboración en áreas como la informática, la estadística y la economía.

AIGB y General Motors son dos pistas principales

La inscripción está abierta

El tema del concurso "Pujas automatizadas en subastas a gran escala" se divide en dos vías, a saber:

Seguimiento AIGB: uso de modelos generativos para aprender agentes de ofertas automáticas
Universal Track: ofertas automáticas con incertidumbre

En la pista AIGB, los concursantes deben pensar en cómo tomar decisiones de licitación precisas para secuencias largas. Como se mencionó anteriormente, al enfrentar este problema, los métodos tradicionales de aprendizaje por refuerzo estarán limitados por la acumulación de errores y otros factores, y su desempeño es limitado. Sin embargo, los modelos generativos generalizados han mostrado un gran potencial en esta tarea. Por lo tanto, esta pista requiere que los concursantes adopten una amplia gama de modelos generativos, como modelos de difusión, transformadores, etc., para afrontar este desafío. Si tiene experiencia en investigación o en la industria en modelos de difusión, transformadores, modelos básicos, modelos de lenguaje grande (LLM) y otros métodos de generación, puede considerar inscribirse en esta pista.

En general, los concursantes enfrentan el desafío de tomar decisiones de licitación efectivas en subastas a gran escala, lo que requiere detectar efectivamente los cambios en las estrategias de los competidores. El complejo entorno de las subastas publicitarias del mundo real plantea desafíos adicionales, a saber, la incertidumbre. Los participantes deben considerar la aleatoriedad de las llegadas de los consumidores, la variación en las predicciones del comportamiento de conversión, la escasez de datos y otros factores. Si tiene experiencia en investigación o en la industria en aprendizaje por refuerzo, optimización, aprendizaje automático, teoría de juegos y ciencia de datos, puede considerar inscribirse en esta pista.

Participar en este concurso traerá muchas recompensas. NeurIPS tiene una influencia internacional muy alta y lograr excelentes resultados en competiciones será sin duda un plus para tu currículum y será de gran ayuda para tu futuro desarrollo profesional. Además, el ganador también tendrá la oportunidad de ganar un premio del concurso de 6.000 dólares estadounidenses, así como oportunidades de pasantías en Alibaba, un canal verde para la contratación escolar y el estatus de académico visitante.

Esta competencia también pondrá a disposición por primera vez aproximadamente 500 millones de datos de juegos y el marco de capacitación correspondiente. Estos datos de juegos a gran escala son muy raros en la industria. Esta es una buena práctica y una oportunidad de investigación para investigadores y profesionales en los campos de la inteligencia de decisiones, el aprendizaje por refuerzo, los juegos y los modelos generativos.

El calendario y premios son los siguientes:

Registro de pista AIGB: https://tianchi.aliyun.com/competition/entrance/532236
Registro general de pistas: https://tianchi.aliyun.com/competition/entrance/532226

Sitio web oficial del concurso: https://tianchi.aliyun.com/specials/promotion/neurips2024_alimama#/

noticias

¿Qué tipo de preguntas de competencia hizo Alimama y fue elegida por NeurIPS 2024?

Introducción

Mi informacion de contacto