Nachricht

Welche Art von Wettbewerbsfragen stellte Alimama und wurde von NeurIPS 2024 ausgewählt?

2024-07-15

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

Maschinenherz Original

Autor: Zhang Qian

Auch die Fähigkeit, „bieten“ zu können, ist eine sehr praktische Fähigkeit.

Wo gehört NeurIPS unter den vielen Top-Konferenzen für künstliche Intelligenz hin? Jemand hat es in das Universum von „The Legend of Zhen Huan“ eingefügt und ein Bild gemacht: Es verdient wahrscheinlich den „zweiten Platz“.



Bildquelle: Xiaohongshu-Benutzer @云juanyeshu

Dieses Ranking mag kontrovers sein, aber es besteht kein Zweifel daran, dass NeurIPS schon immer zu den Top Drei der Top-KI-Konferenzen gehörte und seit langem zu den Top Ten der globalen Zeitschriften und Top-Konferenzen von Google Scholar in allen Disziplinen gehört.



Daher ist es ein gemeinsames Ziel vieler KI-Forscher, auf dieser Konferenz Beiträge veröffentlichen zu können. Die bahnbrechenden Beiträge zu AlexNet, Transformer und GPT-3 sind allesamt akzeptierte Beiträge dieser Top-Konferenz.

Es ist jedoch anzumerken, dass die Beiträge nicht den vollen Wert von NeurIPS widerspiegeln. Einige während der Konferenz abgehaltene Wettbewerbe sind möglicherweise besser für einige Forscher und Ingenieure geeignet, die sich auf die KI-Praxis konzentrieren. Sogar NeurIPS-Beamte sagten: „Diese Wettbewerbe spielen eine wichtige Rolle bei der Erforschung und Lösung komplexer Probleme」。

Wo finde ich diese Wettbewerbe? Tatsächlich veröffentlichten NeurIPS-Verantwortliche im Juni einen Blog, der speziell eine Liste dieser Wettbewerbe enthielt.



Die Liste enthält insgesamt 16 Wettbewerbsfragen, von denen jede überprüft wurde und die Auszeichnung „Umfangreicher wissenschaftlicher Forschungswert」。



Diese Wettbewerbsfragen werden offiziell von NeurIPS gesammelt. Nach den Erfahrungen der letzten Jahre zu urteilen, stammen die meisten Wettbewerbsfragen, die letztendlich ausgewählt werden können, von Universitäten, Forschungseinrichtungen oder ausländischen Technologieunternehmen wie Google, OpenAI, Meta usw. Die von der inländischen Industrie eingereichten Wettbewerbsfragen sind sehr gering Chance, ausgewählt zu werden. Aufgrund der Beliebtheit der großen Modellbahn ist der Wettkampf in diesem Jahr noch intensiver.

Überraschend ist jedoch, dass es in einem so hart umkämpften Umfeld immer noch Menschen in der heimischen Branche gibt, die herausragen.Automatisches Bieten bei Großauktionen: Entscheidungsfindung in unsicheren und wettbewerbsorientierten Spielen lernen(Automatisiertes Bieten in Großauktionen: Lernende Entscheidungen in unsicheren und kompetitiven Spielen)“ lautete das von ihnen eingereichte Wettbewerbsthema.



Offizielle Website des Wettbewerbs: https://tianchi.aliyun.com/specials/promotion/neurips2024_alimama#/

Diese Wettbewerbsfrage wurde vom Team für Entscheidungsfindungs-Intelligence-Kooperation im Joint Laboratory der Peking University-Alimama Artificial Intelligence Innovation (PAAI) als erste Einheit gemeinsam mit dem Forschungsteam von Alimama erstellt Professor Deng Xiaotie und Professor Lu Zongqing von der Universität Peking. Nachdem das Wettbewerbsthema ausgewählt worden war, gewann Alimama das Recht, den Wettbewerb auszurichten, und war damit die einzige Organisation in der heimischen Branche, die in diesem Jahr das Recht erhielt, den NeurIPS-Wettbewerb auszurichten.

Das Wettbewerbsthema dreht sich um die Problematik des „automatisierten Bietens bei Großauktionen“. Dieses Problem hängt eng mit der Benutzeroberfläche zusammen, über die wir täglich Einkaufs-Apps öffnen, um Produkte zu suchen und zu durchsuchen. Dahinter steckt ein enormer Forschungs- und kommerzieller Wert.Die Fachjury von NeurIPS bewertete die Wettbewerbsfrage als „Praktisch wichtig, gut organisiert und gut getestet“ (Praktisch wichtig, gut organisiert und gut getestet)

Was ist also das Problem mit der „automatisierten Gebotsabgabe bei großen Auktionen“? Warum wurde es vom Joint Laboratory der Peking University-Alimama Artificial Intelligence Innovation vorgeschlagen und so großes Lob erhalten? Was genau machen die Teilnehmer? Das Herzstück der Maschine wird in diesem Artikel einzeln zerlegt.

Was ist „automatisiertes Bieten bei großen Auktionen“?

Um zu verstehen, was „automatisches Bieten bei großen Auktionen“ ist, erinnern wir uns zunächst an die Erfahrung, Taobao zu eröffnen und mit dem Einkaufen zu beginnen.



Jedes Mal, wenn Sie ein Schlüsselwort eingeben, öffnet das System eine Produktseite. Tatsächlich ist diese Seite sehr speziell: Welche Produkte erscheinen und welche Produkte an erster Stelle stehen, ist das Ergebnis präziser Berechnungen des Systems. Die Anzeigen sind das Ergebnis eines Auktionsmechanismus der Plattform, um Werbetreibenden Werbeplätze zuzuweisen.

Die Betriebslogik des gesamten Prozesses ist wie folgt: Zunächst erstellt die Plattform ein Benutzerprofil, indem sie die Interessen und Verhaltensmuster des Benutzers analysiert. Wenn Benutzer auf Taobao nach Produkten suchen oder stöbern, startet die Plattform sofort den Werbeauktionsprozess im Hintergrund. Werbetreibende nehmen über den Bietmechanismus an dieser Auktion teil und hoffen, die Möglichkeit zu erhalten, ihre Anzeigen schalten zu können. Das automatische Gebotssystem spielt in diesem Prozess eine zentrale Rolle. Es berücksichtigt das Profil des Nutzers, Verhaltensdaten, die Werbeziele des Werbetreibenden, Budgetbeschränkungen und verschiedene Faktoren in der Auktionsumgebung, um die optimale Gebotsstrategie in Echtzeit zu berechnen. Basierend auf diesen Daten und Berechnungsergebnissen wählt die Plattform die Anzeige mit dem höchsten Gebot und den relevantesten Nutzerbedürfnissen aus. Diese Anzeigenergebnisse werden den Nutzern zusammen mit organischen Ergebnissen angezeigt. Der gesamte Prozess ist vollständig automatisiert und kann in kürzester Zeit abgeschlossen werden.

Aus diesem Prozess ist ersichtlich, dassDurch das automatisierte Gebotssystem können Werbetreibende den Anzeigenplatzierungsprozess erheblich vereinfachen und die Technologie der künstlichen Intelligenz nutzen, um präzises Marketing zu erreichen und so Zeit und Energie zu sparen.

Im Jahr 2023 wird der globale Online-Werbemarkt 626,8 Milliarden US-Dollar erreichen. Die automatisierte Gebotstechnologie ist für das weitere Wachstum von entscheidender Bedeutung. Ähnliche Forschungsfragen umfassen Werbestrategien und andere Mechanismusdesigns, die alle zum Forschungsbereich der Entscheidungsintelligenz gehören. Forschung im Zusammenhang mit Entscheidungsintelligenz kann Unternehmen neue Betriebsmethoden einbringen und ihre Abhängigkeit von Menschen bei Entscheidungsmechanismen verringern, wodurch die Umsatzwachstumsrate des Unternehmens erheblich gesteigert und sein Wachstumsspielraum vergrößert wird.

Allerdings ist es nicht einfach, das „automatische Bieten“ in der Wettbewerbsfrage durchzuführen. Denn das automatisierte Gebotssystem muss eine riesige und komplexe Datenflut bewältigen, die Daten zum Nutzerverhalten, Werbedaten, Gebotsdaten und andere mehrdimensionale Informationen umfasst und diese Daten in Echtzeit aktualisiert werden. Darüber hinaus muss das System auch in einer Spielumgebung voller Unsicherheit Entscheidungen treffen und kann keine vollständigen Informationen über alle Einflussfaktoren erhalten. Daher kann sich das System nur auf aktuell verfügbare Daten und gesammelte historische Erfahrungen verlassen, um mithilfe intelligenter Algorithmen Vorhersagen und Entscheidungen zu treffen und in einem sich schnell verändernden Marktumfeld optimale Gebotsentscheidungen zu treffen.

Optimierungspfad „Automatisierte Gebote“.

Vom verstärkenden Lernen bis zur generativen KI

Insgesamt hat der Bieteransatz der Branche vier Generationen der Entwicklung durchlaufen. Alimama betreibt zudem langjährige Forschung zur Optimierung automatisierter Gebotsstrategien.

  • Erste Generation: klassische Kontrollklasse. Das Optimierungsproblem der Effektmaximierung wird indirekt in das Kontrollproblem des Budgetverbrauchs umgewandelt. Berechnen Sie die Verbrauchskurve basierend auf Geschäftsdaten und steuern Sie das zu verbrauchende Budget so weit wie möglich entsprechend der festgelegten Kurve. PID und damit verbundene Verbesserungen sind in dieser Phase häufig verwendete Steuerungsalgorithmen. Wenn die Wertverteilung des Gebotsverkehrs stabil ist, kann diese Art von Algorithmus grundsätzlich den Optimierungseffekt zu Beginn des Geschäftsstarts erzielen.
  • Zweite Generation: Planungs- und Lösungsklasse. Im Vergleich zur ersten Generation ist der Planungs- und Lösungsalgorithmus (LP) direkt auf die Lösung des Problems der Zielmaximierung ausgerichtet. Der aktuelle zukünftige Verkehrssatz kann basierend auf dem Gebotsverkehr des Vortages vorhergesagt werden, um die Gebotsparameter zu lösen. Das automatische Gebotsproblem wird zu einem neuen Unterproblem, das auf den aktuell gelieferten Daten basiert, sodass es mit dieser Methode mehrmals gelöst werden kann, d. h. Online-LP. Diese Art von Methode basiert auf genauen Vorhersagen des künftigen teilnehmenden Verkehrs. Daher muss bei der Umsetzung des tatsächlichen Szenarios mehr Arbeit in die Vorhersage der Qualität und Quantität des künftigen Verkehrs investiert werden.
  • Die dritte Generation: Reinforcement Learning. In der realen Umgebung ist die Online-Gebotsumgebung sehr komplex und verändert sich dynamisch, und es ist schwierig, zukünftige Traffic-Erhebungen genau vorherzusagen. Nur durch die Koordination des gesamten Budgetzyklus kann der Effekt maximiert werden. Als typisches Problem bei der Entscheidungsfindung in der Reihenfolge werden in der dritten Stufe Methoden des Verstärkungslernens verwendet, um die automatische Gebotsstrategie zu optimieren. Sein iterativer Prozess hat sich von der frühen Implementierung klassischer Reinforcement-Learning-Methoden über eine weitere Annäherung an die „Datenverteilung in der realen Online-Umgebung“ auf der Grundlage der Offline-RL-Methode bis hin zur letzten Phase der Annäherung an den Kern des Problems und der Implementierung interaktiven Lernens weiterentwickelt mit der realen Gebotsumgebung basierend auf der Online-RL-Methode.
  • Die vierte Generation: Modellklassen generieren. Die von ChatGPT repräsentierten generativen Großmodelle erfreuen sich großer Beliebtheit und haben in vielen Bereichen erstaunliche Ergebnisse gezeigt. Neue technische Konzepte und technische Paradigmen können zu revolutionären Verbesserungen automatisierter Gebotsalgorithmen führen. Das technische Team von Alimama hat im Voraus Vorkehrungen getroffen, das technische System für intelligentes Werbemarketing mit dem großen intelligenten Marketing-Entscheidungsmodell AIGA (AI Generated Action) als Kern neu gestaltet und automatische Gebotsstrategien abgeleitet, die durch AIGB (AI Generated Bidding) dargestellt werden.



Wenn die neueste Forschung in der Branche in der dritten Generation ist (2022),Das Joint Laboratory für künstliche Intelligenz und Innovation der Peking-Universität und Alimama (PAAI) wurde gegründet .Dieses Labor bringt viele große Namen aus Industrie und Wissenschaft zusammen: Dekan der School of Intelligence der Peking-UniversitätZhu SongchunProfessor leitet die akademische Leitung, Lehrstuhlinhaber der Peking-UniversitätDeng Xiaotie, Außerordentlicher Professor, School of Intelligence, Peking-UniversitätSong Guojieund der technische Direktor von AlimamaZheng Bo Sie alle sind Kernmitglieder des Labors. Mehrere Experten leiten das Labor, um weiterhin Fragen der Entscheidungsfindung zu untersuchen, beispielsweise automatische Gebote auf der Grundlage vorhandener Ergebnisse.

Während des Forschungsprozesses stellten sie fest, dass die ursprüngliche Reinforcement-Learning-Methode einige Einschränkungen aufwies, wie z. B. das Problem einer übermäßigen Anhäufung von Trainingsfehlern in Entscheidungsszenarien mit langer Reihenfolge, wie z. B. automatischen Geboten. Gleichzeitig überprüft ChatGPT die leistungsstarken Fähigkeiten generativer KI in mehreren Bereichen. Daher begann das Team darüber nachzudenken, welchen Beitrag generative Modelle zu automatisierten Gebotsstrategien leisten könnten. Endlich,Sie schlugen ein Optimierungsschema für die Gebotsstrategie vor, das auf der generativen Modellkonstruktion AIGB (AI Generative Bidding) basiert.

Insbesondere behandelt AIGB relevante Indikatoren wie Gebote, Optimierungsziele und Einschränkungen als gemeinsame Wahrscheinlichkeitsverteilung und wandelt so das Gebotsproblem in ein Problem der bedingten Verteilungsgenerierung um. Anders als beim verstärkenden Lernen korreliert es direkt den Entscheidungsverlauf und die Belohnungsinformationen (wie in der folgenden Abbildung dargestellt), wodurch die Anhäufung von Trainingsfehlern vermieden werden kann und sich besser für Entscheidungsszenarien mit langen Sequenzen eignet. Dies ist der erste Versuch des gemeinsamen Labors, generative große Modelle im Bereich Smart Bidding anzuwenden.Verwandte Beiträge wurden von der internationalen Spitzenkonferenz KDD 2024 angenommen



Natürlich sind Entscheidungsintelligenzprobleme wie „automatisierte Gebote bei großen Auktionen“ noch lange nicht gelöst, und die Anwendung generativer KI auf diese Probleme ist gerade erst in die Testphase eingetreten. Daher reichte das gemeinsame Labor relevante Wettbewerbsfragen bei NeurIPS ein, in der Hoffnung, die jahrelange Forschungsakkumulation zu nutzen und die Kraft der Gemeinschaft zu bündeln, um gemeinsam tiefgreifende Forschung und Lösungen für diese Probleme zu fördern.

Neben dem kommerziellen Wert haben diese Probleme selbst auch einen hohen Forschungswert. Da Entscheidungsintelligenz Disziplinen wie künstliche Intelligenz, Datenwissenschaft und Spieltheorie integriert, bietet sie einen systematischen Rahmen zur Lösung komplexer Probleme. Dies fördert die interdisziplinäre Integration und treibt Innovation und Zusammenarbeit in Bereichen wie Informatik, Statistik und Wirtschaftswissenschaften voran.

AIGB und General Motors sind zwei große Unternehmen

Die Anmeldung ist geöffnet

Das Wettbewerbsthema „Automatisiertes Bieten in Großauktionen“ gliedert sich in zwei Tracks:

  • AIGB-Track: Verwendung generativer Modelle zum Erlernen automatischer Gebotsagenten
  • Universal Track: Automatisierte Gebote mit Unsicherheit

Im AIGB-Track müssen die Teilnehmer darüber nachdenken, wie sie bei langen Sequenzen genaue Gebotsentscheidungen treffen können. Wie bereits erwähnt, sind herkömmliche Methoden des verstärkenden Lernens bei diesem Problem durch Faktoren wie Fehlerakkumulation eingeschränkt und ihre Leistung ist begrenzt. Allerdings haben verallgemeinerte generative Modelle bei dieser Aufgabe großes Potenzial gezeigt. Daher müssen die Teilnehmer in diesem Track eine breite Palette generativer Modelle wie Diffusionsmodelle, Transformatoren usw. anwenden, um diese Herausforderung zu bewältigen. Wenn Sie über einen Forschungs- oder Branchenhintergrund in Diffusionsmodellen, Transformatoren, Grundlagenmodellen, Large Language Models (LLMs) und anderen Generierungsmethoden verfügen, können Sie sich für diesen Track anmelden.

Im allgemeinen Bereich stehen die Teilnehmer vor der Herausforderung, bei groß angelegten Auktionen wirksame Gebotsentscheidungen zu treffen. Dazu ist es erforderlich, Änderungen in den Strategien der Wettbewerber effektiv zu erkennen. Das komplexe reale Werbeauktionsumfeld bringt zusätzliche Herausforderungen mit sich, nämlich Unsicherheit. Die Teilnehmer müssen die Zufälligkeit der Kundenankünfte, die Varianz in den Prognosen zum Conversion-Verhalten, die Datenknappheit und andere Faktoren berücksichtigen. Wenn Sie über einen Forschungs- oder Branchenhintergrund in den Bereichen Reinforcement Learning, Optimierung, maschinelles Lernen, Spieltheorie und Datenwissenschaft verfügen, können Sie sich für diesen Kurs anmelden.

Die Teilnahme an diesem Wettbewerb bringt viele Belohnungen mit sich. NeurIPS hat einen sehr hohen internationalen Einfluss und hervorragende Ergebnisse bei Wettbewerben sind zweifellos ein Pluspunkt für Ihren Lebenslauf und werden für die zukünftige Karriereentwicklung sehr hilfreich sein. Darüber hinaus hat der Gewinner die Möglichkeit, einen Wettbewerbspreis in Höhe von 6.000 US-Dollar sowie Praktikumsmöglichkeiten bei Alibaba, einem grünen Kanal für die Rekrutierung auf dem Campus, und den Status eines Gastwissenschaftlers zu gewinnen.

Dieser Wettbewerb wird auch erstmals rund 500 Millionen Spieldaten und den entsprechenden Trainingsrahmen zur Verfügung stellen. Derart umfangreiche Spieldaten sind in der Branche sehr selten. Dies ist eine gute Praxis- und Forschungsmöglichkeit für Forscher und Praktiker in den Bereichen Entscheidungsintelligenz, Reinforcement Learning, Spiele und generative Modelle.

Der Zeitplan und die Preise sind wie folgt:



  • AIGB-Streckenregistrierung: https://tianchi.aliyun.com/competition/entrance/532236
  • Allgemeine Streckenregistrierung: https://tianchi.aliyun.com/competition/entrance/532226

Offizielle Website des Wettbewerbs: https://tianchi.aliyun.com/specials/promotion/neurips2024_alimama#/