Nachricht

Gespräch von Miss A mit Serge Belongie: Geben Sie Ihnen eine fälschbare „Kugel“ |

2024-07-31

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina


Falsifizierbarkeit ist sowohl ein Engel als auch ein Teufel, letztendlich ist Falsifizierbarkeit ein Handschlag, der die Welt in Einklang bringt.

Autor|Zhang Yijia Sukhoi‍‍

Vor zehn Jahren sagte ein europäischer Akademiker zu mir: „Es gibt nicht weniger als hundert unterteilte Tracks in der künstlichen Intelligenz, und die Vereinigten Staaten werden einen oder zwei beliebte Tracks definieren. , und dann beeilten sich globale Unternehmer und Investoren, diese beiden Titel einzuholen. "

In den folgenden zehn Jahren hat sich der Trend der künstlichen Intelligenz gedreht, und die künstliche Intelligenz hat sich vom Nichtkonsens zum kleinen Konsens und vom kleinen Konsens zum großen Konsens entwickelt, aber dieser Satz ist nie herausgesprungen.

Dieses Gespräch mit Serge begann mit einer Rezension eines Aufsatzes, an dem er vor zwei Jahren mitgeschrieben hatte.„Auf der Suche nach der Struktur unfalsifizierbarer Behauptungen“ Interesse von. Schade, dass dieser Artikel bisher kaum Beachtung gefunden hat, Google ScholarNur 2 Mal zitiert

Das ist überraschend.

„Jiazi Guangnian“ glaubt, dassdieser Aufsatzstark unterschätzt

Grund 1: Das in diesem Artikel behandelte Problem ist äußerst kritisch (das zugrunde liegende Narrativ von nicht fälschbaren Daten in sozialen Medien);

Grund zwei: Dieser Artikel bietet wichtige theoretische Neuerungen (ternäre Annotationsmethode und SNaCK-Satz);

Grund drei: Dieser Artikel liefert praktische technische Ergebnisse (Datensatzkonstruktion und detaillierter experimenteller Vergleich).


Autoren des Artikels Peter Ebert Christensen, Frederik Warburg, Menglin Jia und Serge Belongie;

Dieses Papier ist nicht schwer zu verstehenWiderlegbarkeitDas Konzept wird eingeführt.

Falsifizierbarkeit wird auch Widerlegbarkeit genannt.Wissenschaftsphilosophien verwenden oft strenge BegriffeFälschungsmethodeUm festzustellen, ob eine Theorie wissenschaftlich ist„Diese Schlussfolgerungen müssen zulassenLogikDie Existenz von Gegenbeispielen zu

Karl Popper schlug 1934 vor, dass, wenn eine Theorie oder Hypothese durch empirische Tests bestehender Techniken logisch widerlegt werden kann, dies der Fall istFalsifizierbar von. Und wenn ein Ausdruck so tadellos ist, dass die Welt keinen Raum für einen Kommentar hat, hält er oft nur alle auf Distanz, was dem wissenschaftlichen Fortschritt nicht förderlich ist.

Die Probleme, die Wissenschaftler untersuchen können oder sollten, müssen mehr oder weniger begrenzt sein, damit andere die Möglichkeit haben, sie anzugreifen oder sogar umzustürzen. Der Zweck der Falsifizierbarkeit besteht darin, die Theorie vorhersagbar und überprüfbar zu machen.daher in der Praxis nützlich

Serges Artikel„Auf der Suche nach der Struktur unfalsifizierbarer Behauptungen“besprochenDie Komplexität der Interpretation unwiderlegbarer Behauptungen in sozialen Medien

Die Hauptidee des Papiers:

Social-Media-Plattformen werden mit Beiträgen und Kommentaren überschwemmt und viele Behauptungen können nicht widerlegt werden. Jedoch,Unzureichende Instrumente zur Faktenprüfung, mangelnde Struktur bei Diskussionen in sozialen Netzwerken, Schwierigkeiten bei der Identifizierung von Narrativen und mangelnde Qualität bei öffentlichen Diskussionenusw., was viel Ärger verursacht.

Der Artikel untersucht, wie man Menschen in sozialen Medien identifiziert und verstehtunwiderlegbare Behauptungenund fassen Sie diese Behauptungen zusammen alsEine begrenzte Anzahl von Erzählungen, um Diskussionen und Debatten in den sozialen Medien besser zu erleichtern.

Interessanterweise hat der Autor ein Tool namens erstelltPAPIEREin Datensatz, der die Debatte über Händetrocknungsmethoden in öffentlichen Toiletten (Papierhandtücher vs. Lufttrockner), 600 kurze Textauszüge, 31 Erzählungen und 4 Superkategorien enthält, um dominante Erzählungen in Online-Diskussionen zu verstehen und zu entdecken.

Dieses Papier stellt vorEin neuer Ansatz, der über die Möglichkeiten bestehender Technologien zur Faktenprüfung hinausgeht, leistet einen wichtigen Beitrag zur Verwaltung und zum Verständnis der Auswirkungen nicht fälschbarer Behauptungen in digitalen Kommunikationsumgebungen – indem dieser Prozess genutzt wird, um dominante Narrative zu entdecken, und gezeigt wird, dass dieser Prozess aktuelle groß angelegte Transformationsmodelle und hochmoderne Modelle unbeaufsichtigter Subjekte übertrifft .

durch Experimente,Der Autor gefundenVerwenden Sie einen modernen Satzkonverter(z. B. T5-Modell)Einbettung des Anfangssatzesist der Schlüssel .Sie fanden auch heraus, dass die Sampling-Strategie insbesondere für die Generierung qualitativ hochwertiger Einbettungen von entscheidender Bedeutung ist„Distance-Rnd“-StrategieBeste Leistung.

Experimentelle Ergebnisse zeigen, dass die Kombination menschlicher AnmerkungenDreiergruppenkann Compliance offenbarenkristallisierte Erzählunginteressante Clusterbildung.

Nur 2 Zitate

„Jiazi Guangnian“ ist der Ansicht, dass die möglichen Gründe dafür, dass dieses Papier bisher in der Branche keine Beachtung gefunden hat, unter anderem folgende sein können:

(1) Die theoretische Analyse ist relativ schwach und die Analyse der experimentellen Ergebnisse bleibt qualitativ (der 11-seitige Text enthält nur eine halbe Seite mit Formeln);

(2) Es gibt fast keine Einführung in mehrere zum Vergleich verwendete Algorithmen;

(3) Möglicherweise gibt es in der akademischen Gemeinschaft in diesem Bereich noch keinen einheitlichen Datensatz, was dazu führt, dass es innerhalb der akademischen Gemeinschaft kein „Out-of-the-Circle“ gibt;

(4) Der Autor betonte die Kritikalität von T5, beschrieb jedoch nicht klar die Überlegenheit seines Algorithmus.


Serge Belongies akademischer Austausch beim CVPR2024, Quelle: Fotografiert von „Jiazi Guangnian“

Obwohl die oben genannten Arbeiten wenig bekannt sind, ist Serge selbst ein sehr einflussreicher Wissenschaftler auf dem Gebiet der Computervision und des maschinellen Lernens. Seine verschiedenen Arbeiten wurden insgesamt 1.789,71 Millionen Mal zitiert.

Serge Belongie ist Professor für Informatik an der Universität Kopenhagen und Direktor des Danish Pioneer Center for Artificial Intelligence. Zuvor war er stellvertretender Dekan und Andrew H. und Ann R. Tisch Professor für Informatik an der Cornell Tech.

Die würdigste Einführung istSerge ist der Hauptautor von MSCOCO

Der MSCOCO-Datensatz ist einer der bekanntesten groß angelegten Datensätze für Computer Vision.Im Jahr 2000 haben Serge und Jitendra Malik (heute Professor für Informatik an der University of California, Berkeley und ein berühmter Gelehrter auf dem Gebiet der Computer Vision)schlugen gemeinsam das Konzept des „Shape Context“ vor,Es handelt sich um eine weit verbreitete Methode zur Beschreibung von Formmerkmalen in den Bereichen Computer Vision und Objekterkennung.

Im Jahr 2004 wurde Serge vom MIT Technology Review zum „Young Technology Innovator under 35“ ernannt, 2007 erhielten er und Jitendra Malik eine lobende Erwähnung für den Marr-Preis, Serge erhielt den ICCV Helmholtz Award, dieser Preis wird hauptsächlich an Autoren vergeben von Artikeln, die grundlegende Beiträge im Bereich Computer Vision geleistet haben.

Serge ist außerdem Mitbegründer mehrerer Unternehmen, darunter Digital Persona (fusioniert mit CrossMatch im Jahr 2014), CarCode (übernommen von Transport Data Systems), Anchovi Labs (übernommen von Dropbox im Jahr 2012) und Orpix.

Derzeit das Serge-TeamErschließung neuer Dimensionen in der Analyse sozialer Netzwerke——Ausgehend von einer Vielzahl trivialer Bemerkungen, denen bisher keine Beachtung geschenkt wurde und die für die herkömmliche Faktenprüfung nicht geeignet sind,Analysieren Sie die Problemeinstellung undNarrative Manipulation

Dies ist in dieser Zeit von besonderer Bedeutung:

Nach dem Antifaschistischen Weltkrieg erlebten sie alle im Laufe der Zeit Höhen und Tiefen im historischen Bild, egal ob sich technologische Durchbrüche oder Engpässe abwechselten. Genau wie „Entlang des Flusses während des Qingming-Festes“, das sich im Zeit- und Raumkoordinatensystem abspielt, ist es mit Tausenden von Szenen und Erscheinungen antiker und moderner Wesen gefüllt.

Das Folgende ist das Gespräch von Frau A. mit Serge.

Folgen Sie dem öffentlichen Konto „Jiazi Guangnian“ und antworten Sie im Hintergrund mit „Kann gefälscht werden“, um die im Artikel genannten Informationen zu erhalten„Auf der Suche nach der Struktur unfalsifizierbarer Behauptungen“UndMSCOCO-DatensatzZwei Papiere.

1. Die Fälschbarkeit wird in Frage gestellt

Forscher in der Praxis lassen sich oft von Erzählungen beeinflussen, die ihnen gefallen oder nicht gefallen – ähnlich wie bei den Trendthemen auf Instagram.

Vermisse ein: „Wenn etwas nicht gefälscht werden kann, kann es nicht wissenschaftlich sein“ ist in der wissenschaftlichen Gemeinschaft zu einem allgemeinen Konsens geworden. Viele Philosophen haben dies jedoch in Frage gestellt und argumentiert, dass das Prinzip der Falsifizierbarkeit zu endlosen wissenschaftlichen Debatten führen könnte.Ist Falsifizierbarkeit eine notwendige Voraussetzung für wissenschaftlichen Fortschritt?

SergeNach allgemeiner Meinung muss eine wissenschaftliche Theorie falsifizierbar sein.

Vermisse ein:Dies ist die weit verbreitete Ansicht, aber ist Falsifizierbarkeit das vorherrschende Paradigma?

Serge: Die Literatur zum Thema maschinelles Lernen ist in den letzten 15 Jahren explosionsartig gewachsen, und täglich werden zahlreiche Artikel veröffentlicht und zitiert. In diesen Arbeiten zitieren die zugehörigen Werkabschnitte häufig andere Literatur, die Zitate sind jedoch nicht unbedingt die relevanteste Literatur für ihre Arbeit. Das liegt daran, dass die Menge an Literatur riesig ist;Die Forscher reagieren tatsächlich auf das vorherrschende Narrativ auf diesem Gebiet.

Wir betrachten uns oft als Wissenschaftler in der Tradition von Karl Popper, die nur falsifizierbaren Behauptungen unterliegen. Allerdings gibt es auch Trends in der wissenschaftlichen Forschung, etwa bei Technologien wie generativen kontradiktorischen generativen Netzwerken und Transformern. Obwohl diese Arbeiten darauf abzielen, der wissenschaftlichen Tradition zu folgen,Forscher werden in der Praxis oft von Narrativen beeinflusst, die ihnen gefallen oder nicht gefallen——Ein bisschen wie Trendthemen auf Instagram

Vermisse ein:Sie meinen, dass Wissenschaftler seit maschinellem Lernen begonnen haben, von der Norm der Falsifizierbarkeit abzuweichen?

Serge:Wissenschaftler behaupten oft, sie seien gegenüber diesen Einflüssen immun und betrachten sich selbst als objektiv, aber sie sind schließlich Menschen und lassen sich von diesen populären Meinungen beeinflussen.Das halten wir für unwissenschaftlich und eher für ein Bauchgefühl und eine Meinung.

Vermisse ein:Wie definieren Sie unwiderlegbare Behauptungen in sozialen Medien?

Serge: Wir müssen zunächst die Literatur zur Faktenprüfung besprechen. Professorin Isabelle Augenstein von der Universität Kopenhagen hat beispielsweise eine Methode entwickelt, die mit der Bestimmung des Verifikationswerts einer Aussage beginnt. Wir prüfen eine Abrechnung,und bestimmen Sie seinen Verifizierungswert im Bereich von 0 bis 1

Beispielsweise eignet sich die Aussage, dass die Hauptstadt Kaliforniens Sacramento ist, ideal für die Grammatik- und Syntaxprüfung, da sie in mehreren strukturierten Wissensdatenbanken zu finden ist. Wir könnten eine Aussage wie „Die Hauptstadt von Kalifornien ist Sacramento“ untersuchen und ihr einen Testbarkeitswert von wahrscheinlich nahe 0,99 geben. Anschließend übermitteln wir es an eine strukturierte Wissensdatenbank, um die Antwort zu bestätigen. Dieses auf Deep Learning basierende Testbarkeitssystem verarbeitet große Mengen an Ansprüchen und Trainingsdaten, um den Verifizierungswert verschiedener Ansprüche zu bewerten.

Aber einige Aussagen,Beispielsweise spiegelt „Einwanderung nach Kalifornien ist schlecht“ eher persönliche Meinungen wider und eignet sich nicht zur Faktenprüfung.Im Gegensatz dazu haben Aussagen wie „Seit 2020 ist die Zahl der Einwanderer in Kalifornien weiter gestiegen“ einen hohen Nachweiswert.

AlsoBesonderes Augenmerk legen wir auf schwer überprüfbare Behauptungen——Diese Behauptungen können nicht direkt überprüft werden, aber die Diskussion, die sie in den sozialen Medien ausgelöst haben, ist bedeutsam.Mehrere Überprüfungen können uns helfen, bessere Urteile zu fällen.

Vermisse ein:Welche spezifischen Techniken oder Werkzeuge werden in Ihrer Forschung verwendet, um nicht falsifizierbare Behauptungen zu identifizieren und zu analysieren?

Serge:Wir verwenden Techniken der Verarbeitung natürlicher Sprache (NLP), Clustering- und Gruppierungsalgorithmen sowie Methoden des maschinellen Lernens.

Unser Ziel istSchaffung einer globalen Narrative Information Facility (GNIF), um Social-Media-Inhalte zu recherchieren und zu organisieren

Die Kombination dieser Technologien und Tools ermöglicht es uns, große Mengen narrativer Inhalte besser zu verstehen und zu verarbeiten.Hilft indirekt dabei, nicht fälschbare Behauptungen zu identifizieren

Wir sind in der Lage, verschiedene Textformen zu analysieren.Ob Tweet oder Reddit-Kommentar, verwenden wir NLP-Technologie, um die Erzählungen und Themen in diesen Inhalten zu extrahieren und zu verstehen.

Zweitens haben wir verwendetClustering- und Gruppierungsalgorithmen . Diese Algorithmen helfen uns, große Mengen an Social-Media-Inhalten in verschiedene Themen oder Erzählungen zu organisieren.

Zum Beispiel,Wir können Tausende von Tweets unter Millionen von Tweets finden, die sich sehr ähneln, weil sie alle das gleiche zugrunde liegende Narrativ thematisieren.

passierenNarratives Clustering und Assertion-Gruppierung Wir organisieren große Mengen an Inhalten in kleineren Clustern, sodass Faktenprüfer sie effizienter verarbeiten können, ohne jedes Element einzeln prüfen zu müssen. Auf diese Weise können selbst nicht falsifizierbare Behauptungen durch Clustering und Gruppierung identifiziert und klassifiziert werden, um die weitere Analyse und Verarbeitung zu erleichtern.

Wir betrachten zwei Eingaben, sagen wir zwei Tweets, und messen ihre Ähnlichkeit anhand verschiedener narrativer Aspekte –Dabei kann es sich beispielsweise um Themen wie die Debatte um Kernkraft oder um grüne Energie oder um Diskussionen über Säuglingsanfangsnahrung gegenüber Kuhmilch handeln.

Im Internet gibt es viele heiß diskutierte Themen, oft das Ergebnis von Desinformationskampagnen Diese Aktivitäten können sehr vage sein. Wir versuchen zu verstehen, wie sich diese unterschiedlichen Aussagen in Form von Sprache oder Memes manifestieren, die Bilder, Texte, Audioaussagen usw. enthalten können.Sieht nach einem ganz anderen Inhalt aus . Sie sammeln möglicherweise Millionen von Diskussionen zu einem Thema auf einer Social-Media-Plattform, aber alle Daten repräsentieren möglicherweise nur ein paar Dutzend Meinungen. Wir versuchen, diese Phänomene durch Technologien wie große Sprachmodelle und tiefes metrisches Lernen zu verstehen.


Visualisierung von durch Menschen kommentierten Paaren, Unterfigur (a) zeigt positive Paare, d. h. ähnliche oder konsistente, von Menschen kommentierte Erzählpaare. Unterfigur (b) zeigt negative Paare, d. h. unterschiedliche oder inkonsistente Erzählpaare, die von Menschen beschriftet wurden. Quelle: „Auf der Suche nach Struktur in nicht fälschbaren Behauptungen“


2. Jenseits von „wahr und falsch“

Nicht alle Behauptungen verdienen eine Faktenprüfung, und nicht alle Faktenprüfungen führen zu wahren oder falschen Ergebnissen.

Vermisse ein: Der von Ihnen erstellte MSCOCO-Datensatz ist einer der bekanntesten groß angelegten Computer-Vision-Datensätze. Wie hat es angefangen?

Serge: Wir haben vor 15 Jahren mit der Objekterkennungsforschung begonnen, angefangen mit einem kleinen Datensatz CUB200 mit über 200 Vogelarten. Der COCO-Datensatz war ursprünglich ein Sommerpraktikumsprojekt meines Doktoranden Tsung-Yi Lin bei Microsoft Research. Sein damaliger Mentor war ein weiterer Doktorand von mir, Piotr Dollá. Das Projekt entwickelte sich zu einem Konsortium von Forschern aus Wissenschaft und Industrie. Sie hoffen, einen Datensatz zu erstellen, der Alltagsgegenstände in der natürlichen Umgebung detailliert beschreibt und ihre Namen und räumlichen Standorte genau kommentiert.

Vermisse ein: Sie haben den Datensatz MSCOCO genannt. „Coco“ gefällt mir sehr gut und sein englischer Name ist auch Coco.

Serge:Ja, wir alle lieben den Namen „COCO“, er macht Spaß und ist leicht zu merken.

Vermisse ein:Nach der Entstehung des MSCOCO-Datensatzes war die Entwicklung des Bereichs Computer Vision wie ein Raketenflug.

Serge:Nun, wir haben immer mehr Wissensgemeinschaften rund um COCO organisiert und COCO wurde von Millionen von Menschen genutzt.Wir haben klein angefangen und schließlich ein Forschungsgebiet entwickelt, das tiefgreifende Auswirkungen hatte.

Die erste Computer-Vision-Konferenz, an der ich teilnahm, war CVPR 1994, ebenfalls in Seattle. Das war vor dreißig Jahren und es waren etwa 300 Menschen anwesend. Derzeit nehmen beim CVPR 2024 in Seattle 12.000 Menschen an der Konferenz teil.

Vermisse ein:Was treibt Sie seit 30 Jahren an? Was treibt Ihre anhaltende Leidenschaft für Computer Vision und Forschung im Bereich der künstlichen Intelligenz an?

Serge: Solange ich mich erinnern kann, interessiere ich mich für Muster und die Kategorisierung von Dingen. In der Mittelschule habe ich ein Klassenprojekt zur Klassifizierung von Schrauben, Bolzen und anderen Verbindungselementen durchgeführt. Während meines Studiums interessierte ich mich für Audiomuster, insbesondere für Bioakustik, wie zum Beispiel die Geräusche von Vögeln oder Walen.Was die Bilder angeht, waren es vor allem die Fingerabdrücke und Gesichter, die mich anzogen.

Ich habe anhand von Videos recherchiert, wie man von den Lippen liest. Alle Aspekte dieses Problems faszinieren mich: die Verschmelzung von Audio und Bild, die Unterschiede zwischen verschiedenen Sprechern und die rechnerischen Herausforderungen. In den frühen 1990er-Jahren kamen Digitalkameras gerade erst auf den Markt, aber sie verfügten noch über keinerlei Rechenkenntnisse. Heutzutage gehen Sie vielleicht davon aus, dass Ihr Sucher über Gesichtserkennungsrahmen verfügt oder dass Sie über eine Fotoalbum-Software verfügen, mit der Sie Fotos Ihrer gesamten Familie intelligent organisieren können, aber das gab es damals noch nicht.

Ich hatte damals das Gefühl, dass die Nachfrage nach dieser Technologie sehr groß sein würde, und zwar gleichzeitigMir gefällt auch die Mathematik hinter der Technologie . Mir gefiel die Technologie, die in diesen Bereichen zum Einsatz kam, aber ich wollte weder Mathematik noch Physik als Hauptfach belegen. Zum Beispiel die Verwendung komplexer mathematischer Methoden zur Lösung von Problemen in der Ton-, Video- und Bildverarbeitung.

Ich habe immer das Gefühl, dass es meine Mission auf dieser Welt ist, diese Art von Arbeit zu leisten.

Vermisse ein:Welchen akademischen Austausch haben Sie dieses Jahr beim CVPR durchgeführt?

Serge: Mein Team hat auf der CVPR-Hauptkonferenz mehrere Beiträge eingereicht, und ich habe sie auch auf zwei Seminaren vorgestellt. Einer der Berichte befasst sich mit der Geschichte der Computer-Vision-Forschung und soll vor allem jungen Wissenschaftlern helfen, die klassische Computer-Vision-Technologie zu verstehen, also die Technologie vor Deep Learning und Transformern. Ich habe auch das Visipedia-Projekt vorgestellt, das mit einer erweiterten Version des 2011 veröffentlichten CUB200-Datensatzes begann. Derzeit hat sich der Forschungsinhalt von Visipedia auf Zehntausende Pflanzen, Tiere und Pilze ausgeweitet und bietet eine wichtige Forschungsgrundlage für die Objekterkennung in der Natur.

Ich möchte mich in meinem heutigen Interview auf einen weiteren Bericht konzentrieren, der sich auf Narrative, öffentliche Meinung und Falschinformationen bezieht, insbesondere im Kontext der Entwicklung sozialer Medien.

Vermisse ein:Welche Innovationen hat Ihre Arbeit auf diesem Gebiet gebracht?

Serge: Das klassische Problem in der Welt der Desinformation und der sozialen Medien ist die Überprüfung von Fakten Beispielsweise gibt es an der Universität Kopenhagen viele verwandte Arbeiten. Der allgemeine Ansatz besteht darin, dass wir für bestimmte Bemerkungen, die überprüft werden müssen, künstliche Intelligenzsysteme verwenden, um nach relevanten Fakten zu suchen und auf der Grundlage der Fakten einen Authentizitätswert zwischen 0 und 1 vorherzusagen.

Vermisse ein:Was sind die Herausforderungen bei diesem Ansatz?

Serge:Bei dieser Methode selbst gibt es keine großen Probleme, die Herausforderung ergibt sich aus dem Problem selbst.Nicht alle Behauptungen verdienen eine Faktenprüfung, und nicht alle Faktenprüfungen führen zu wahren oder falschen Ergebnissen. „Pandas sind Chinas Nationalschatz“ ist beispielsweise eine Aussage, mit der Modelle trainiert und Authentizität durch eine strukturierte Wissensbasis und große Datenmengen überprüft werden können. Nicht so beim Satz „Umzug nach Kalifornien“.

Vermisse ein:Sie sehen also in solchen Aussagen Forschungspotenzial?

Serge: Diese letztere Art von Aussage wurde nicht ausführlich untersucht, ist aber ein ebenso wichtiges Thema. Für diese Aussagen gibt es zwar keine strikte Definition von wahr/falsch, sie lösen aber in den sozialen Medien viele Diskussionen aus. Diese Herausforderung gab es in der Zeit, in der nur Nachrichtenmedien auf Fakten überprüft werden mussten, jedoch in den heutigen hochentwickelten sozialen Medien zu einem Thementyp, der hitzige Diskussionen auslöst, schwer wissenschaftlich zu charakterisieren ist oder nicht verfälscht werden kann forschungswürdig.

Vermisse ein:Können Sie mir einen Fall nennen, der echte Auswirkungen hatte oder sogar einen ernsthaften Konflikt verursachte?

Serge: Ich freue mich, dass Sie diese Frage gestellt haben. Lassen Sie uns ein interessantes Beispiel geben. Nachdem Sie Ihre Hände in einer öffentlichen Toilette gewaschen haben, haben Sie zwei Möglichkeiten, sie zu trocknen. Ich bin mir nicht sicher, welche Methode in China üblicherweise verwendet wird. In Europa kann man entweder Papierhandtücher herausnehmen oder einen Heißluftfön verwenden.

Vermisse ein:Diese beiden Methoden sind auch in China am weitesten verbreitet.

Serge: Hersteller von Trocknern und Papierhandtüchern können durch den Abschluss von Verträgen mit jeder Hotelkette viel Geld verdienen, und der gesamte Markt wird wahrscheinlich Einnahmen in Milliardenhöhe generieren. Aber viele Menschen in Europa haben inzwischen eine sehr klare Meinung über den Unterschied zwischen den beiden Methoden. Viele Leute sagen, dass eine dieser Methoden Krankheiten verbreiten könnte, während andere sagen, dass der Verbrauch von viel Strom oder die Papierherstellung durch die Verschwendung von Bäumen zu Umweltschäden führen würde. Die meisten Menschen, die diese Ansichten vertreten, sind keine Experten für öffentliche Gesundheit oder Umwelt.

Vermisse ein:Sind die Behauptungen selbst wahr?

Serge: Die Authentizität unserer Aussagen ist uns eigentlich egal, denn viele Themen in den sozialen Medien lassen sich nicht strikt beweisen oder falsifizieren. Aber das Thema wird angesprochen, weil eine kleine Gruppe von Menschen die Massen davon überzeugen will, dass der eine Weg besser ist als der andere. Sie haben wahrscheinlich Hunderttausende von Bot-generierten Inhalten erstellt. Sucht man heutzutage in sozialen Netzwerken nach Diskussionen über Papierhandtücher und Lufttrockner, findet man Millionen von Kommentaren. Der Schwerpunkt unserer Studie liegt nicht auf einem gründlichen Vergleich der Vor- und Nachteile der beiden Ansätze und der Präsentation von Faktenprüfungsergebnissen.Uns geht es mehr darum, diese entworfenen Probleme zu erkennen.

3. „COCO“-Datensatz in sozialen Medien

Vermeiden Sie voreilige Entscheidungen.

Frau A: Ihre Forschung hat eine neue Dimension eröffnet.Die traditionelle Faktenprüfung konzentriert sich auf die Wahrheit der Semantik, während sich Ihre Forschung auf die Wahrheit von Aussagen oder Behauptungen konzentriert.klarPragmatik——Das Ziel der Vorhersage beschränkt sich nicht darauf, ob sie wahr ist oder nicht, sondern erstreckt sich auch auf Themendiskussionen, die von einigen Benutzern oder einer großen Anzahl von Robotern in sozialen Netzwerken erstellt werden, um bestimmte Ziele zu erreichen.Wissen Sie, was diese Studie bedeutet?

Serge: Ja, wir schaffen etwas völlig Neues. Die meisten relevanten Studien, die uns bekannt sind, konzentrieren sich ausschließlich auf die Überprüfung von Fakten. Aber wir versuchen, themenbezogene Technologie natürlicher Sprache zu nutzen, um Diskussionen in sozialen Medien zu gruppieren und zu bündeln, um Einzelpersonen, Unternehmen und Strategieentwicklern zu helfen, zu verstehen, was in sozialen Medien passiert.Wir fällen keine Werturteile zu diesen Themen und Diskussionsinhalten, sondern zeigen lediglich objektiv die Form auf, in der die einzelnen Themen angesprochen werden.

Vermisse ein: Um dieses Ziel zu erreichen, benötigen wir zunächst einen Datensatz. Die Erstellung dieses Datensatzes sollte eine große Herausforderung sein. Als Sie Pionierarbeit in der Computer-Vision-Forschung leisteten, haben Sie von einem kleinen Vogeldatensatz zu COCO expandiert. Wie sind Sie diesmal vorgegangen?

Serge: Diese Art von Social-Networking-Verhalten zeichnet sich oft durch eines aus. Es kann eine Million Tweets zu einem Thema geben und scheinbar Tausende von Accounts nehmen an der Diskussion teil.Durch eine Analyse können wir jedoch feststellen, dass Hunderttausende dieser Tweets tatsächlich genau dasselbe gepostet haben, mit sehr ähnlichen oder sogar identischen Erzählungen. Bedenken Sie jedoch, dass dies nicht bedeutet, dass diese Diskussionen richtig oder falsch sind. Wir ermöglichen Benutzern, Cluster und Gruppierungen verschiedener Aussagen zu sehen, was es Faktenprüfern und Analysten sozialer Netzwerke erleichtert, große Mengen an Inhalten zu verarbeiten und zu verstehen, ohne sich mit einem plötzlichen Zustrom von Millionen von Tweets auseinandersetzen zu müssen.

Vermisse ein:Kann dieses System verschiedene kontroverse Themen in sozialen Medien in Echtzeit verarbeiten?

Serge:Ich denke, dass es möglich ist, und ich hoffe es. Angenommen, im Mittelmeer treffen zwei Schiffe aufeinander, ein russisches und ein amerikanisches. In sozialen Netzwerken beginnen Diskussionen und eine Erzählung entsteht. Alle paar Stunden tauchen neue Informationen auf, darunter eine Aussage eines Kapitäns oder eine Handyaufzeichnung. In diesem Fall gewinnen einige Erzählungen und Themen an Aufmerksamkeit, während andere möglicherweise irrelevant werden.

Fräulein A: Das hoffen SieEchtzeitGrab-Probleme

Serge:und andere Informationen.Um professionelle Diplomaten zu unterstützen, möchten wir eine erstellenArmaturenbrett(Armaturenbrett) , liefert umfassende relevante Informationen und ordnet diese Ereignisse auch in den Weltkontext ein.Dieses System kannHalten Sie Menschen davon ab, voreilige Entscheidungen zu treffen . Ich möchte betonen, dass das System nicht selbst entscheidet, welche Seite Recht hat, sondern die Informationen umfassend organisiert.

Vermisse ein:Welche Schwachstellen müssen angegangen werden, um eine zuverlässige Funktionalität zu erreichen?

Serge: Es gibt sowohl traditionelle als auch neue Herausforderungen . Zu den traditionellen Herausforderungen gehören die Auswirkungen von Sprache, Kultur und emotionalen Vorurteilen.

Zum Beispiel, „Die kleine Meerjungfrau“ und „Das hässliche Entlein“ sind beide Werke dänischer Schriftsteller, aber ihre Disney-Filmversionen der Geschichten wurden an die amerikanische Kultur angepasst. Aufgrund der größeren Dominanz des amerikanischen Narrativs gegenüber dem dänischen Narrativ in sozialen Netzwerken ist die Originalversion von Andersens Geschichte bei Internetnutzern in vielen anderen Ländern nahezu unbekannt.

Der Prozess der Datenannotation, insbesondere der Annotation von Daten aus sozialen Netzwerken, wird von Sprache und Kultur beeinflusst. Ein weiteres Beispiel ist, dass die Stimmungsanalyse bereits ein wichtiger Teil der Faktenprüfung ist und das Stimmungsvorhersagemodell selbst möglicherweise viele Vorurteile und Stereotypen im Training aufweist.Das Training von KI-Modellen ist ein Prozess des Ein- und Auslagerns von Müll. Es ist schwierig, die durch Trainingsdaten verursachten Probleme zu lösen. Daher müssen wir verstehen, welche Trainingsdaten das Modell verwendet.Wir können sagen, dass eine Faktenprüfung ohne menschliche Beteiligung nicht existiert (unzuverlässig).

Vermisse ein:Was sind die neuen Herausforderungen?

Serge: Durch Sprachmodelle generierte falsche Inhalte sind eine neue Herausforderung, vor der wir stehen. Frühere gefälschte Social-Media-Konten wiesen oft sehr einfache Muster auf. Aber mit GPT- und Bildgenerierungsmodellen können Fake-Account-Ersteller komplexere und natürlichere Fake-Profile erstellen und dann Social-Media-Accounts fälschen, die echt aussehen. Diese Konten sind mit herkömmlichen Modellen zur Identifizierung gefälschter Konten nicht leicht zu finden. Diese generativen KI-Modelle bringen auch entsprechende Herausforderungen für traditionelle Faktenprüfungsaufgaben mit sich. daher,Generative KI erstellt und identifiziert falsche Informationen, was das Katz-und-Maus-Spiel unserer Zeit sein wird.

4.KI-Zukunft

Sie (OpenAI) kennen unsere Pläne möglicherweise noch nicht.

Vermisse ein:Es scheint, dass diese Herausforderungen nicht einfach durch Modelle gelöst werden können, sondern möglicherweise die Dimension der Zusammenarbeit zwischen KI und Menschen erreichen.DuerscheinenEntdecken Sie immer neue Probleme in neuen Dimensionen und lösen Sie sie dann aus einer einfachen Perspektive.

Serge:Ja.Unsere neue Idee lässt sich mit Wikipedia vergleichen. Früher dachte man, dass derselbe Wikipedia-Knoten nur Seiten in verschiedenen Sprachen mit derselben Semantik benötige. Die Realität ist, dass nicht nur die Sprache anders ist.

Sprache, Kultur, Werte, Traditionen – alle Faktoren werden auf verschiedenen Seiten desselben Eintrags vermischt. Atomenergie und fossile Brennstoffe beispielsweise werden in verschiedenen Sprachen und in verschiedenen Teilen der Welt sehr unterschiedlich behandelt. Das erinnert uns daran, dass das KI-System, das wir aufbauen wollen, weder rein automatisiert noch ein eigenständiges Modell ist. Dies ist ein System, an dem Menschen beteiligt sind. Das bedeutet, dass viele verschiedene menschliche Gemeinschaften auf der ganzen Welt benötigt werden, um die Daten zu kennzeichnen und zu organisieren und die verschiedenen Teile zu erfassen.Das ist ein großes und tiefgreifendes Problem, denn Vorurteile wird es immer geben.

Vermisse ein:Wie bei MSCOCO ist es das Ziel dieser Forschung, Daten so umfassend und fair wie möglich zu organisieren.

Serge: Dies ist der Prozess der Organisation aller verschiedenen Arten von Gemeinschaften. In verschiedenen Teilen der Welt studieren Menschen unterschiedlichen Alters unterschiedliche Hauptfächer wie Literatur, Geschichte, Naturwissenschaften usw., und jedes Fach hat seine eigene Geschichte. Damit die von mir beschriebene Forschung erfolgreich ist,Wir benötigen viele Anmerkungen, die eine Vielzahl von Themen verstehenVon Sie müssen keine Experten sein, aber sie müssen über gewisse Kenntnisse der zu taggenden Inhalte verfügen, wie etwa Kernenergie, Unternehmertum oder Kryptowährung, um die Ähnlichkeiten in den Erzählungen und Themen zu erkennen. Daher ist die größte Herausforderung die Organisation der Community und nicht die grundlegenden KI-Rechner- und Speichereinrichtungen.

Vermisse ein:Haben Sam Altman oder Yann Lecun Ihre Meinung kommentiert?

Serge: Möglicherweise kennen sie unsere Pläne noch nicht.

Vermisse ein:Ich scheine Zeuge der ersten Phasen einer Initiative zu sein:Entdecken Sie Probleme in einer höheren Dimension und finden Sie den direktesten Einstiegspunkt.

Serge: Wenn wir diese Infrastruktur zur Problemerkennung entwickeln, könnte sie, wie viele andere Technologien auch, zum Guten oder Schlechten genutzt werden.Im Gegensatz zu vielen kommerziellen KIsWir versuchen, offene, transparente und überprüfbare Managementsysteme zu entwickeln . Daher verfügen wir über eine vollständig transparente Wissensdatenbank, und Benutzer können den Bearbeitungsverlauf der Daten sehen, einschließlich des Zeitpunkts der Dateneinbindung und der Annotatoren, von denen sie kommentiert wurden.

Vermisse ein:Wie kann die Genauigkeit und Objektivität der Daten sichergestellt werden?

Serge:Die einfache Antwort lautet:wir können nicht garantieren

Aber das Beste, was wir tun können, ist, ein System zu schaffen, das Zehntausende Menschen, die sich für verschiedene Diskussionsbereiche interessieren, dazu bringt, das System zu kommentieren. So viele Annotatoren wie möglich zu haben, kann uns helfen, statistische Objektivität zu erreichen. Auch Wikipedia verfügt über Mechanismen, die auf Transparenz und Rechenschaftspflicht ausgelegt sind, und wir werden das Gleiche tun.

Vermisse ein:Welchen Einfluss wird diese Forschung auf politische Entscheidungsträger, Pädagogen und Technologen haben?

Serge: Betrachten Sie das, was wir tun, als Ergänzung zum logischen oder sachlichen Denken.

Nehmen wir an, ein Unternehmen möchte seine Vielfalt, Gerechtigkeit und Inklusion verbessern. Deshalb hielt ihr Vorstand eine Sitzung ab, um über die Einstellung von mehr Frauen oder Minderheiten zu diskutieren. Diese Art der Diskussion ist in vielen Unternehmen üblich, und an einer Universität studieren beispielsweise möglicherweise nicht viele Frauen Elektrotechnik, und der Fachbereich möchte Schritte unternehmen, um dies zu ändern. Während dieser Treffen kann es zu vielen Diskussionen kommen, die nicht durch Wissen oder Informationen gestützt werden.

Manche Menschen vertreten die voreingenommene Meinung, dass Frauen nicht gut in Mathematik seien. Was benötigt wird, ist ein System, das dem Abteilungsleiter, CEO oder Lehrer, der diese Diskussionen leiten muss, helfen kann und eine Reihe von Erzählungen aus dem System extrahieren kann, um die Diskussion zu strukturieren. Sobald das System seine Arbeit aufnimmt, indiziert es außerdem Aussagen und analysiert sie in bereits vorhandene Narrative. Auf diese Weise kann ein CEO, Lehrer oder Besprechungsleiter minderwertige oder verwirrende Gespräche vermeiden, über ein effektives Struktur- und Klassifizierungssystem verfügen, Diskussionen leiten und überflüssige Gespräche verhindern.

Vermisse ein:Was sind Ihrer Meinung nach die potenziellen Forschungsrichtungen für die technologische Entwicklung für zukünftige Narrative und Problemanalysen in sozialen Medien?

Serge: Verschiedene Bereiche haben ihre eigenen, einzigartigen Herausforderungen. Bei einigen davon handelt es sich um klassische Probleme wie die Verarbeitung großer Datenmengen und deren Kennzeichnung, die Abschwächung von Verzerrungen usw. Aber auch bei der Visualisierung stehen wir vor großen Herausforderungen.

Wir haben gerade die Unterschiede erwähnt, mit denen verschiedene Sprachen und Kulturen konfrontiert sind. Jedes spezifische Thema hat viele unterschiedliche Perspektiven und verschiedene Kommentatoren werden aufgrund ihrer eigenen Voreingenommenheit unterschiedliche Anmerkungen liefern. Aus informationstheoretischer Sicht kann der Versuch, diese unterschiedlichen Konten zu komprimieren, zum Verlust oder zur Beschädigung von Informationen führen. Diese Art von Fragen wird im Laufe des Projekts auftauchen und wir werden ihnen häufig begegnen.

Vermisse ein: Welche neuesten Entwicklungen in der visuellen Technologie werden Ihrer Meinung nach einen tiefgreifenden Einfluss auf die Zukunft haben?

Serge: Jetzt beginnen immer mehr Forscher, auf multimodale Daten zu achten und mehrere Datentypen wie Bilder, Text und Audio gleichzeitig in einem Modell zu verarbeiten. Diese Methode verwendet normalerweise Modellarchitekturen wie Transformer, um komplexe praktische Probleme zu lösen . Ich glaube, dass sich dieser Trend fortsetzen wird und zukünftige Neueinsteiger auf dem Gebiet der künstlichen Intelligenz es natürlicher finden werden, mehrere berufliche Fähigkeiten gleichzeitig zu beherrschen, als sich nur in einen Bereich wie die Verarbeitung natürlicher Sprache oder Computer Vision zu vertiefen.

Persönlich denke ich, dass diese Aussage zwar übertrieben ist, obwohl einige Leute behaupten, dass künstliche Intelligenz Ärzte vollständig ersetzen wird. Aber ich bin davon überzeugt, dass sich KI-gestützte Systeme in Bereichen wie der Radiologie, Dermatologie und Histopathologie durchsetzen und allen zugute kommen werden.

Was selbstfahrende Autos betrifft, so gab es in der Vergangenheit zwar Vorhersagen, dass Fortschritte in der Bildverarbeitungstechnologie und der künstlichen Intelligenz die breite Einführung selbstfahrender Autos ermöglichen werden, ich halte dies jedoch für unwahrscheinlich. Sofern die Regierung keine Schritte unternimmt, um den Betrieb konventioneller Autos auf bestimmten Fahrspuren einzuschränken oder sie ganz zu verbieten, ist es höchst unwahrscheinlich, dass selbstfahrende Autos in den Vereinigten Staaten zur Norm werden.

Vermisse ein : Ich mag deine Arbeit. Meine Gedanken sind ähnlich.Die technologische Entwicklung erschließt gleichzeitig neue kognitive Dimensionen. Die wertvollste Methodik ist eine, die einen minimalistischen Einstiegspunkt hat, aber die Gesamtsituation ausstrahlen kann.

Serge:Welche Methodik interessiert Sie am meisten?

Vermisse ein:Geben Sie ein kleines Beispiel.Auf dem Weg der Falsifizierbarkeit wird die Wissenschaft den iterativen Weg der Negation der Negation einschlagen … und damit zur Struktur der wissenschaftlichen Revolution zurückkehren, mit der wir alle vertraut sind.

*Hang Zhou hat ebenfalls zu diesem Artikel beigetragen.

Da es sich bei diesem Artikel um wissenschaftliche Diskussionen handelt, finden Sie hier eine kurze Einführung in den Autor:

  • Zhang Yijia, der Gründer von Jiazi Guangnian, schloss 2013 die School of Mathematical Sciences der Universität Peking ab und erhielt einen Doppelabschluss in Wirtschaftswissenschaften vom National Institute of Development. Er gewann eine Goldmedaille bei der chinesischen Mathematikolympiade und wurde für die ausgewählt Nationales Trainingsteam; seine Forschungsinteressen sind Finanzmathematik und Spieltheorie, und er ist gleichzeitig Direktor der School of Mathematical Sciences der Peking-Universität.

  • Zhou Hang, der Verantwortliche für Jiazi Brain, schloss 2019 sein Studium an der School of Mathematical Sciences der Peking-Universität ab; seine Forschungsrichtung ist spärliche Optimierung und nicht-konvexe Optimierung.


*Verweise
  • Suche nach Struktur in nicht widerlegbaren Behauptungen.pdf

  • 978-3-319-10602-1_48.pdf „Microsoft COCO: Common Objects in Context“ MSCOCO-Datensatz: Serges am häufigsten zitierter Artikel.

  • Thomas Samuel Kuhn „Die Struktur wissenschaftlicher Revolutionen“


Folgen Sie dem öffentlichen Konto „Jiazi Guangnian“ und antworten Sie im Hintergrund mit „Kann gefälscht werden“, um die im Artikel genannten Informationen zu erhalten„Auf der Suche nach der Struktur unfalsifizierbarer Behauptungen“UndMSCOCO-DatensatzZwei Papiere.

|Vermisse einRezension der Dialogreihe|