notizia

Conversazione della signorina A con Serge Belongie: datevi un “proiettile” falsificabile |

2024-07-31

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina


La falsificabilità è sia un angelo che un diavolo, in definitiva, la falsificabilità è una stretta di mano che allinea il mondo.

Autore|Zhang Yijia Sukhoi‍‍

Dieci anni fa un accademico europeo mi disse: "Ci sono non meno di un centinaio di percorsi suddivisi nell’intelligenza artificiale e gli Stati Uniti definiranno uno o due percorsi popolari. , e poi imprenditori e investitori globali si sono affrettati a mettersi al passo con questi due percorsi. "

Nei dieci anni successivi, il trend dell’intelligenza artificiale ha avuto un’inversione, e l’intelligenza artificiale è passata dal non consenso al piccolo consenso, e dal piccolo consenso al grande consenso, ma questa frase non è mai saltata fuori.

Questa conversazione con Serge è iniziata con la revisione di un articolo scritto da lui due anni fa."Ricerca della struttura nelle affermazioni non falsificabili" interesse di. È un peccato che finora questo articolo non abbia quasi ricevuto attenzione, Google ScholarCitato solo 2 volte

Ciò è sorprendente.

"Jiazi Guangnian" crede che,questa provagrossolanamente sottovalutato

Motivo 1: la questione affrontata da questo articolo è estremamente critica (la narrativa di fondo dei dati non falsificabili nei social media);

Motivo due, questo articolo fornisce importanti innovazioni teoriche (metodo di annotazione ternaria e set SNaCK);

Motivo tre: questo articolo fornisce risultati pratici di ingegneria (costruzione di set di dati e confronto sperimentale dettagliato).


Autori dell'articolo Peter Ebert Christensen, Frederik Warburg, Menglin Jia e Serge Belongie ARXIV2022

Questo documento non è difficile da capireFalsificabilitàIl concetto comincia ad essere introdotto.

La falsificabilità è detta anche confutabilità.Le filosofie della scienza spesso usano il termine rigorosometodo di falsificazionePer determinare se una teoria è scientifica, cioè"Queste conclusioni devono consentirelogicaL'esistenza di controesempi a

Karl Popper propose nel 1934 che se una teoria o ipotesi può essere logicamente contraddetta dalla verifica empirica delle tecniche esistenti, allora èFalsificabile Di. E se un’espressione è così impeccabile che il mondo non ha spazio per commenti, spesso non farà altro che tenere tutti a distanza, il che non aiuta a promuovere il progresso scientifico.

I problemi che gli scienziati possono o dovrebbero studiare devono essere più o meno recintati, dando ad altri l’opportunità di attaccarli o addirittura ribaltarli. Lo scopo della falsificabilità è rendere la teoria predittiva e verificabile.quindi utile nella pratica

Il documento di Serge"Ricerca della struttura nelle affermazioni non falsificabili"discussoLa complessità dell’interpretazione delle affermazioni non falsificabili sui social media

L'idea principale del documento:

Le piattaforme di social media sono inondate di post e commenti e molte affermazioni non possono essere smentite. Tuttavia,Strumenti di fact-checking insufficienti, mancanza di struttura nelle discussioni sui social network, difficoltà nell’identificare le narrazioni e mancanza di qualità nelle discussioni pubblicheecc., causando non pochi problemi.

Il documento esamina come identificare e comprendere coloro che sono sui social mediaaffermazioni infalsificabili, e riassumere queste affermazioni comeUn numero limitato di narrazioni, per facilitare meglio la discussione e il dibattito sui social media.

È interessante notare che l'autore ha creato uno strumento chiamatoCARTAIOLOUn set di dati contenente il dibattito sui metodi di asciugatura delle mani nei bagni pubblici (asciugamani di carta vs asciugatori ad aria), 600 brevi estratti di testo, 31 narrazioni e 4 supercategorie per comprendere e scoprire le narrazioni dominanti nelle discussioni online.

Questo articolo introduceUn nuovo approccio che va oltre le capacità delle tecnologie di verifica dei fatti esistenti, fornisce un importante contributo alla gestione e alla comprensione dell'impatto delle affermazioni non falsificabili negli ambienti di comunicazione digitale, utilizzando questo processo per scoprire le narrazioni dominanti e dimostrando che questo processo supera i recenti modelli di trasformazione su larga scala e i soggetti non supervisionati all'avanguardia. .

attraverso esperimenti,L'autore ha trovatoUtilizza un convertitore di frasi moderno(come il modello T5)Incorporamento della frase inizialeè la chiave .Hanno anche scoperto che la strategia di campionamento è fondamentale soprattutto per generare incorporamenti di alta qualitàStrategia "Distanza-Rnd".La prestazione migliore.

I risultati sperimentali mostrano che la combinazione di annotazioni umaneterzinepuò rivelare la conformitànarrativa cristallizzataraggruppamento interessante.

Solo 2 citazioni

"Jiazi Guangnian" ritiene che le possibili ragioni per cui questo documento finora ha mancato di attenzione nel settore includono ma non sono limitate a:

(1) L'analisi teorica è relativamente debole e l'analisi dei risultati sperimentali rimane qualitativa (il testo di 11 pagine ha solo mezza pagina di formule);

(2) Non c'è quasi nessuna introduzione ai diversi algoritmi utilizzati per il confronto;

(3) Potrebbe non esistere ancora un insieme di dati unificato nella comunità accademica in questo campo, il che non porterebbe a una situazione "fuori dal cerchio" all'interno della comunità accademica;

(4) L'autore ha sottolineato la criticità di T5, ma non ha descritto chiaramente la superiorità del suo algoritmo.


Condivisione accademica di Serge Belongie al CVPR2024, fonte: fotografata da "Jiazi Guangnian"

Sebbene gli articoli sopra menzionati siano poco conosciuti, Serge stesso è uno scienziato molto influente nel campo della visione artificiale e dell'apprendimento automatico. Si occupa principalmente del riconoscimento degli oggetti e della segmentazione delle immagini. I suoi vari articoli sono stati citati complessivamente 1.789,71 milioni di volte.

Serge Belongie è professore di informatica all'Università di Copenaghen e direttore del Centro danese Pioneer per l'intelligenza artificiale. In precedenza, è stato preside associato e professore di informatica presso Andrew H. e Ann R. Tisch presso la Cornell Tech.

Il più degno di introduzione èSerge è l'autore principale di MSCOCO

Il set di dati MSCOCO è uno dei set di dati su larga scala più famosi per la visione artificiale.Nel 2000, Serge e Jitendra Malik (ora professore di informatica all'Università della California, Berkeley, e famoso studioso nel campo della visione artificiale)hanno proposto congiuntamente il concetto di “Shape Context”,È un metodo di descrizione delle caratteristiche della forma ampiamente utilizzato nei campi della visione artificiale e del riconoscimento degli oggetti.

Nel 2004, Serge è stato nominato Young Technology Innovator under 35 dalla MIT Technology Review nel 2007, lui e Jitendra Malik hanno ricevuto una menzione d'onore per il Premio Marr nel 2015, Serge ha ricevuto l'ICCV Helmholtz Award, questo premio viene assegnato principalmente agli autori di articoli che hanno dato contributi fondamentali nel campo della visione artificiale.

Serge è anche co-fondatore di diverse società, tra cui Digital Persona (fusa con CrossMatch nel 2014), CarCode (acquisita da Transport Data Systems), Anchovi Labs (acquisita da Dropbox nel 2012) e Orpix.

Attualmente, la squadra SergeApertura di nuove dimensioni nell’analisi dei social network——Partendo da un gran numero di osservazioni banali a cui non è stata prestata attenzione prima e che non sono adatte al tradizionale fact-checking,Analizzare l'impostazione del problema emanipolazione narrativa

Ciò ha un significato speciale in questo momento:

Dopo la guerra antifascista mondiale, non importa se si sono alternati progressi tecnologici o colli di bottiglia, tutti hanno vissuto alti e bassi nel quadro storico con il passare del tempo. Proprio come "Lungo il fiume durante il Festival di Qingming" si è svolto nel sistema di coordinate spazio-temporali, è pieno di migliaia di scene e apparizioni di esseri antichi e moderni.

Quella che segue è la conversazione di Miss A con Serge.

Segui l'account pubblico "Jiazi Guangnian" e rispondi "può essere falsificato" in background per ottenere le informazioni menzionate nell'articolo"Ricerca della struttura nelle affermazioni non falsificabili"ESet di dati MSCOCODue documenti.

1. La falsificabilità è messa in discussione

Nella pratica, i ricercatori sono spesso influenzati da narrazioni che apprezzano o non apprezzano, in qualche modo simili agli argomenti di tendenza su Instagram.

Manca un: "Se non può essere falsificato, non può essere scientifico" è diventato un consenso generale nella comunità scientifica. Ma molti filosofi lo hanno messo in dubbio, sostenendo che il principio di falsificabilità può portare a dibattiti scientifici senza fine.La falsificabilità è una condizione necessaria per il progresso scientifico?

SergeSecondo l’opinione popolare, una teoria scientifica deve essere falsificabile.

Manca un:Questa è l’opinione popolare, ma la falsificabilità è il paradigma prevalente?

Serge: La letteratura sul machine learning è esplosa negli ultimi 15 anni, con un gran numero di articoli pubblicati e citati ogni giorno. In questi articoli, le sezioni del lavoro correlato citano spesso altra letteratura, ma le citazioni non sono necessariamente la letteratura più rilevante per il loro lavoro. Questo perché la quantità di letteratura è enorme;I ricercatori stanno effettivamente rispondendo alla narrativa dominante nel campo.

Spesso pensiamo a noi stessi come scienziati nella tradizione di Karl Popper, soggetti solo ad affermazioni falsificabili. Tuttavia, ci sono anche tendenze nella ricerca scientifica, come tecnologie come le reti generative avversarie generative e i Transformer. Sebbene questi articoli mirino a seguire la tradizione scientifica,Nella pratica, i ricercatori sono spesso influenzati da narrazioni che apprezzano o non apprezzano——Un po’ come gli argomenti di tendenza su Instagram

Manca un:Vuoi dire che, a partire dall'apprendimento automatico, gli scienziati hanno iniziato a deviare dalla norma della falsificabilità?

Serge:Gli scienziati spesso affermano di essere immuni da queste influenze e si considerano obiettivi, ma dopotutto sono esseri umani e si lasciano influenzare da queste opinioni popolari.Questo è qualcosa che consideriamo non scientifico e più una sensazione e un'opinione viscerale.

Manca un:Come si definiscono le affermazioni infalsificabili nei social media?

Serge: Dobbiamo prima discutere la letteratura sul fact-checking. La professoressa Isabelle Augenstein dell'Università di Copenaghen, ad esempio, ha sviluppato un metodo che inizia con la determinazione del valore di verifica di un'affermazione. Controlleremo una dichiarazione,e determinarne il valore di verifica nell'intervallo da 0 a 1

Ad esempio, l'affermazione che la capitale della California è Sacramento è ideale per il controllo grammaticale e sintattico perché può essere trovata in più basi di conoscenza strutturate. Potremmo esaminare un'affermazione del tipo: "La capitale della California è Sacramento" e assegnarle un punteggio di testabilità probabilmente vicino a 0,99. Lo sottoponiamo quindi a una base di conoscenza strutturata per confermare la risposta. Questo sistema di testabilità basato sul deep learning elabora grandi quantità di dichiarazioni e dati di formazione per valutare il valore di verifica di diverse dichiarazioni.

Ma alcune affermazioniAd esempio, "Immigrare in California è negativo" riflette opinioni più personali e non è adatto alla verifica dei fatti.Al contrario, affermazioni come “Dal 2020, il numero di immigrati in California ha continuato ad aumentare” hanno un alto valore di verifica.

COSÌPrestiamo particolare attenzione alle affermazioni difficili da verificare——Queste affermazioni non possono essere verificate direttamente, ma la discussione che hanno suscitato sui social media è significativa.Più controlli possono aiutarci a formulare giudizi migliori.

Manca un:Nella tua ricerca, quali tecniche o strumenti specifici vengono utilizzati per identificare e analizzare affermazioni non falsificabili?

Serge:Utilizziamo tecniche di elaborazione del linguaggio naturale (NLP), algoritmi di clustering e raggruppamento e metodi di apprendimento automatico.

il nostro obiettivo èCreazione di una struttura globale di informazione narrativa (GNIF), per ricercare e organizzare i contenuti dei social media

La combinazione di queste tecnologie e strumenti ci consente di comprendere ed elaborare meglio grandi quantità di contenuti narrativi,Aiuta indirettamente a identificare affermazioni non falsificabili

Siamo in grado di analizzare varie forme di testo.Che si tratti di un tweet o di un commento su Reddit, utilizziamo la tecnologia PNL per estrarre e comprendere le narrazioni e i temi di questo contenuto.

In secondo luogo, abbiamo usatoAlgoritmi di clustering e raggruppamento . Questi algoritmi ci aiutano a organizzare grandi quantità di contenuti dei social media in diversi temi o narrazioni.

Per esempio,Possiamo trovare migliaia di tweet tra milioni di tweet che sono molto simili perché affrontano tutti la stessa narrativa di fondo.

passaggioClustering narrativo e raggruppamento di asserzioni , organizziamo grandi quantità di contenuti in cluster più piccoli, consentendo ai fact-checker di elaborarli in modo più efficiente senza dover controllare ogni elemento singolarmente. In questo modo, anche le affermazioni non falsificabili possono essere identificate e classificate attraverso clustering e raggruppamenti per facilitare ulteriori analisi ed elaborazioni.

Consideriamo due input, diciamo due tweet, e misuriamo la loro somiglianza in base a diversi aspetti narrativi -Questi potrebbero riguardare argomenti come il dibattito sul nucleare rispetto all'energia verde o le discussioni sul latte artificiale rispetto al latte vaccino.

Sono molti gli argomenti molto dibattuti online, spesso frutto di campagne di disinformazione Queste attività possono essere molto vaghe. Ciò che stiamo cercando di capire è come queste diverse affermazioni si manifestano sotto forma di linguaggio o meme, che possono contenere immagini, testo, dichiarazioni audio, ecc.Sembra un contenuto completamente diverso . Potresti raccogliere milioni di discussioni su un argomento su una piattaforma di social media, ma tutti i dati potrebbero rappresentare solo poche dozzine di opinioni. Cerchiamo di comprendere questi fenomeni attraverso tecnologie come modelli linguistici di grandi dimensioni e apprendimento metrico profondo.


Visualizzazione di coppie annotate da esseri umani, la sottofigura (a) mostra coppie positive, ovvero coppie narrative simili o coerenti annotate da esseri umani. La sottofigura (b) mostra coppie negative, cioè coppie narrative dissimili o incoerenti etichettate dagli esseri umani. Fonte: "Ricerca della struttura nelle affermazioni non falsificabili"


2. Oltre il “vero e il falso”

Non tutte le affermazioni meritano la verifica dei fatti e non tutti i controlli dei fatti producono risultati veri o falsi.

Manca un: Il set di dati MSCOCO che hai creato è uno dei set di dati di visione artificiale su larga scala più famosi. Come é iniziato?

Serge: Abbiamo iniziato la ricerca sul rilevamento di oggetti 15 anni fa, iniziando con un piccolo set di dati CUB200 contenente oltre 200 specie di uccelli. Il set di dati COCO era originariamente un progetto di tirocinio estivo del mio dottorando Tsung-Yi Lin presso Microsoft Research. Il suo mentore all'epoca era un altro mio dottorando, Piotr Dollá. Il progetto si è evoluto in un consorzio di ricercatori provenienti dal mondo accademico e industriale. Sperano di creare un set di dati che descriva in dettaglio gli oggetti di uso quotidiano nell'ambiente naturale e annoti accuratamente i loro nomi e le posizioni spaziali.

Manca un: Hai chiamato il set di dati MSCOCO. Mi piace molto "Coco" e anche il suo nome inglese è Coco.

Serge:Sì, tutti amiamo il nome "COCO", è divertente e facile da ricordare.

Manca un:Dopo l’emergere del set di dati MSCOCO, lo sviluppo del campo della visione artificiale è stato come viaggiare su un razzo.

Serge:Ebbene, abbiamo organizzato attorno ad esso sempre più comunità di conoscenza e COCO è stato utilizzato da milioni di persone.Abbiamo iniziato in piccolo e alla fine abbiamo sviluppato un campo di ricerca che ha avuto un impatto profondo.

La prima conferenza sulla visione artificiale a cui ho partecipato è stata la CVPR del 1994, sempre a Seattle. Questo accadde trent'anni fa e c'erano circa 300 persone presenti. Ora, al CVPR di Seattle del 2024, ci sono 12.000 persone presenti alla conferenza.

Manca un:Sono passati 30 anni, cosa guida la tua costante passione per la visione artificiale e la ricerca sull'intelligenza artificiale?

Serge: Da quanto ricordo, mi sono interessato agli schemi e alla categorizzazione delle cose. Alle medie ho svolto un progetto in classe sulla classificazione di viti, bulloni e altri elementi di fissaggio. Mentre ero al college mi sono interessato ai modelli audio, in particolare alla bioacustica, come i suoni degli uccelli o delle balene.In termini di immagini, sono state le impronte digitali e i volti ad attrarmi.

Ho studiato come leggere le labbra dai video. Tutti gli aspetti di questo problema mi affascinano: la fusione di audio e visione, le differenze tra i diversi parlanti e le sfide computazionali. All'inizio degli anni '90 stavano appena uscendo le fotocamere digitali, ma non avevano ancora alcuna forma di comprensione computazionale. Oggi potresti dare per scontato di avere cornici per il rilevamento dei volti nel mirino o un software per album fotografici in grado di organizzare in modo intelligente le foto di tutta la tua famiglia, ma allora non esistevano.

Sentivo in quel momento che la domanda per questa tecnologia sarebbe stata molto grande, e allo stesso tempoMi piace anche la matematica dietro la tecnologia . Mi piaceva la tecnologia utilizzata in questi campi, ma non volevo specializzarmi in matematica o fisica. Come l'utilizzo di metodi matematici complessi per risolvere problemi nell'elaborazione di suoni, video e immagini.

Sento sempre che la mia missione in questo mondo è fare questo tipo di lavoro.

Manca un:Quale condivisione accademica hai fatto al CVPR quest'anno?

Serge: Il mio team ha presentato numerosi documenti alla conferenza principale del CVPR e li ho condivisi anche in due seminari. Uno dei rapporti riguarda la storia della ricerca sulla visione artificiale, principalmente per aiutare i giovani studiosi a comprendere la tecnologia classica della visione artificiale, ovvero la tecnologia prima del deep learning e dei trasformatori. Ho anche introdotto il progetto Visipedia, iniziato con il rilascio di una versione ampliata del set di dati CUB200 nel 2011. Attualmente, il contenuto della ricerca di Visipedia si è esteso a decine di migliaia di piante, animali e funghi, fornendo un'importante base di ricerca per il riconoscimento degli oggetti in natura.

Un altro rapporto è quello su cui voglio concentrarmi condividendo nell’intervista di oggi, che è legato alla narrativa, all’opinione pubblica e alle false informazioni, soprattutto nel contesto dello sviluppo dei social media.

Manca un:Quali innovazioni ha portato sul campo il tuo lavoro?

Serge: Il problema classico nel mondo della disinformazione e dei social media è il controllo dei fatti Ad esempio, l’Università di Copenaghen ha molti lavori correlati. L’approccio generale è che per alcune osservazioni che devono essere verificate, utilizziamo sistemi di intelligenza artificiale per cercare fatti rilevanti e prevedere un punteggio di autenticità compreso tra 0 e 1 in base ai fatti.

Manca un:Quali sono le sfide con questo approccio?

Serge:Non ci sono molti problemi con questo metodo in sé, la sfida deriva dal problema stesso.Non tutte le affermazioni meritano la verifica dei fatti e non tutti i controlli dei fatti producono risultati veri o falsi. Ad esempio, "I panda sono il tesoro nazionale della Cina" è un'affermazione che può essere utilizzata per addestrare modelli e verificarne l'autenticità attraverso una base di conoscenza strutturata e grandi quantità di dati. Non così con la frase "trasferirsi in California".

Manca un:Vedete quindi del potenziale di ricerca in affermazioni come quest'ultima?

Serge: Quest'ultimo tipo di affermazione non è stato studiato approfonditamente, ma è una questione altrettanto importante. Queste affermazioni potrebbero non avere una definizione rigorosa di vero/falso, ma generano molte discussioni sui social media. Questa sfida non esisteva nell'era in cui solo i mezzi di informazione dovevano essere verificati. Tuttavia, nei social media altamente sviluppati di oggi, un tipo di argomento che innesca discussioni accese, è difficile da caratterizzare scientificamente o non può essere falsificato è diventato molto diffuso. degno di ricerca.

Manca un:Potete citarmi un caso che ha avuto un impatto reale o che ha addirittura causato un grave conflitto?

Serge: Sono felice che tu abbia posto questa domanda, facciamo un esempio interessante. Dopo esserti lavato le mani in un bagno pubblico, hai due opzioni per asciugarle. Non sono sicuro di quale sia il metodo comunemente usato in Cina, in Europa puoi togliere i tovaglioli di carta o utilizzare un essiccatore ad aria calda.

Manca un:Questi due metodi sono anche più comuni in Cina.

Serge: I produttori di asciugatrici e asciugamani di carta possono guadagnare un sacco di soldi firmando contratti con qualsiasi catena alberghiera e l’intero mercato genererà probabilmente miliardi di dollari di entrate. Ma molte persone in Europa ora hanno opinioni molto forti sulla differenza tra i due metodi. Molte persone sostengono che uno di questi metodi potrebbe diffondere malattie, mentre altri sostengono che l’uso di molta elettricità o la produzione di carta causerebbero danni ambientali a causa della distruzione degli alberi. La maggior parte delle persone che sostengono queste opinioni non sono esperti di salute pubblica o ambientali.

Manca un:Le affermazioni stesse sono vere?

Serge: In realtà non ci interessa l’autenticità delle nostre affermazioni, perché molti argomenti sui social media non possono essere rigorosamente provati o falsificati. Ma l’argomento viene sollevato perché un piccolo gruppo di persone vuole convincere le masse che un modo è migliore di un altro. Probabilmente hanno creato centinaia di migliaia di contenuti generati dai bot. Se oggigiorno cerchi discussioni sugli asciugamani di carta e sugli asciugatori d'aria sui social network, troverai milioni di commenti. Il nostro studio non si concentra sul confronto rigoroso dei pro e contro dei due approcci e sulla presentazione dei risultati del fact-checking.Siamo più interessati a rilevare questi problemi progettati.

3. Set di dati “COCO” nei social media

Evita di prendere decisioni affrettate.

Ms. A: La tua ricerca ha aperto un'altra dimensione.Il fact-checking tradizionale si concentra sulla verità della semantica, mentre la tua ricerca si concentra sulla verità di affermazioni o affermazioni.chiaropragmatica——L'obiettivo della previsione non si limita al fatto che sia vero o meno, ma si estende alle discussioni sugli argomenti creati da alcuni utenti o da un gran numero di robot sui social network per raggiungere scopi specifici.Sapete cosa significa questo studio?

Serge: Sì, stiamo creando qualcosa di completamente nuovo. Gli studi più rilevanti di cui siamo a conoscenza si concentrano esclusivamente sul controllo dei fatti. Ma stiamo cercando di utilizzare la tecnologia del linguaggio naturale correlata all’argomento per raggruppare e raggruppare le discussioni sui social media per aiutare gli individui, le aziende e i creatori di strategie a capire cosa sta succedendo sui social media.Non esprimiamo giudizi di valore su questi argomenti e contenuti di discussione, ma mostriamo solo oggettivamente la forma in cui viene sollevata ciascuna questione.

Manca un: Per raggiungere questo obiettivo, abbiamo prima bisogno di un set di dati. Costruire questo set di dati dovrebbe essere una grande sfida. Quando sei stato pioniere nella ricerca sulla visione artificiale, sei passato dal set di dati di piccoli uccelli a COCO. Come ti sei avvicinato a questa volta?

Serge: Questo tipo di comportamento sui social network è spesso caratterizzato da una cosa. Potrebbero esserci un milione di tweet su un argomento, con apparentemente migliaia di account che partecipano alla discussione.Ma attraverso l’analisi, potremmo scoprire che centomila di quei tweet in realtà pubblicavano la stessa identica cosa, con narrazioni molto simili o addirittura identiche. Tuttavia, tieni presente che ciò non significa che queste discussioni siano giuste o sbagliate. Permettiamo agli utenti di vedere cluster e raggruppamenti di dichiarazioni diverse, rendendo più semplice per i fact-checker e gli analisti dei social network elaborare e comprendere grandi quantità di contenuti senza dover gestire un improvviso afflusso di milioni di tweet.

Manca un:Questo sistema può gestire vari argomenti controversi sui social media in tempo reale?

Serge:Penso che si possa, e lo spero. Supponiamo che nel Mediterraneo si incontrino due navi, russa e americana. Iniziano le discussioni sui social e nasce una narrazione. Ogni poche ore compaiono nuove informazioni, inclusa una dichiarazione di un capitano o una registrazione sul cellulare. In questo caso, alcune narrazioni e questioni attirano l’attenzione mentre altre potrebbero diventare irrilevanti.

Signorina A: Speritempo realeAfferra i problemi

Serge:e altre informazioni.Per assistere i diplomatici professionisti, vorremmo creare unpannello di controllo(Pannello di controllo) , fornisce informazioni pertinenti e complete e colloca questi eventi nel contesto mondiale.Questo sistema puòImpedisci alle persone di prendere decisioni affrettate . Vorrei sottolineare che il sistema stesso non decide quale parte ha ragione, ma piuttosto organizza le informazioni in modo esaustivo.

Manca un:Quali punti critici devono essere affrontati per ottenere una funzionalità affidabile?

Serge: Ci sono sia sfide tradizionali che nuove . Le sfide tradizionali includono l’impatto della lingua, della cultura e dei pregiudizi emotivi.

Per esempio, "La Sirenetta" e "Il Brutto Anatroccolo" sono entrambe opere di scrittori danesi, ma le loro versioni cinematografiche Disney delle storie sono state adattate per adattarsi alla cultura americana. A causa del maggiore predominio della narrativa americana su quella danese sui social network, la versione originale della storia di Andersen è quasi sconosciuta tra gli utenti Internet di molti altri paesi.

Nel processo di annotazione dei dati, in particolare nell'annotazione dei dati dei social network, sarà influenzato dalla lingua e dalla cultura. Un altro esempio è che l’analisi del sentiment è già una parte importante del fact-checking e il modello di previsione del sentiment stesso potrebbe contenere molti pregiudizi e stereotipi nella formazione.L'addestramento del modello AI è un processo di spazzatura in ingresso e in uscita. È difficile risolvere i problemi causati dai dati di addestramento, quindi dobbiamo capire quali dati di addestramento utilizza il modello.Possiamo dire che il fact-checking senza il coinvolgimento umano è inesistente (inaffidabile).

Manca un:Quali sono le nuove sfide?

Serge: I falsi contenuti generati dai modelli linguistici rappresentano una nuova sfida che dobbiamo affrontare. I precedenti account falsi sui social media spesso avevano schemi molto semplici da seguire. Ma con GPT e i modelli di generazione di immagini, i creatori di account falsi possono generare profili falsi più complessi e naturali, e quindi account falsi sui social media che sembrano reali. Questi account non vengono facilmente individuati con i tradizionali modelli di identificazione degli account falsi. Questi modelli di intelligenza artificiale generativa comportano anche sfide corrispondenti ai tradizionali compiti di verifica dei fatti. Perciò,L’intelligenza artificiale generativa crea e identifica informazioni false, che sarà il gioco del gatto e del topo di questa era.

4.Futuro dell'intelligenza artificiale

Loro (OpenAI) potrebbero non conoscere ancora i nostri piani.

Manca un:Sembra che queste sfide non possano essere risolte semplicemente attraverso modelli, ma possano raggiungere la dimensione della cooperazione tra l’intelligenza artificiale e gli esseri umani.VoisembrareScopri sempre nuovi problemi in nuove dimensioni e poi risolvili da una prospettiva semplice.

Serge:SÌ.La nostra nuova idea può essere paragonata a Wikipedia. Una volta si pensava che lo stesso nodo Wikipedia necessitasse solo di pagine in lingue diverse con la stessa semantica. La realtà è che non è solo la lingua a essere diversa.

Lingua, cultura, valori, tradizioni, tutti fattori mescolati insieme in pagine diverse della stessa voce. L’energia atomica e i combustibili fossili, ad esempio, sono trattati in modo molto diverso nelle diverse lingue e nelle diverse parti del mondo. Questo ci ricorda quindi che il sistema di intelligenza artificiale che stiamo cercando di costruire non è puramente automatizzato, né è un modello autonomo. Questo è un sistema che coinvolge l’uomo, il che significa che sono necessarie molte comunità umane diverse in tutto il mondo per etichettare e organizzare i dati e tenere conto di tutti i diversi pezzi.Questo è un problema grande e profondo perché il pregiudizio esisterà sempre.

Manca un:Quindi, come MSCOCO, organizzare i dati nel modo più completo ed equo possibile è di per sé l’ambizione di questa ricerca.

Serge: Questo è il processo di organizzazione di tutti i diversi tipi di comunità. In diverse parti del mondo, persone di età diverse studiano discipline diverse come letteratura, storia, scienze, ecc., e ogni campo ha la sua storia. Affinché la ricerca che descrivo abbia successo,Abbiamo bisogno di molte annotazioni che comprendano una varietà di argomentiDi Non devono essere esperti, ma devono avere una certa conoscenza dei contenuti da taggare, come l’energia nucleare, l’imprenditorialità o la criptovaluta, per conoscere le somiglianze nelle narrazioni e nelle questioni. Pertanto, la sfida più grande è l’organizzazione della comunità, non le strutture di base per l’elaborazione e l’archiviazione dell’intelligenza artificiale.

Manca un:Sam Altman o Yann Lecun hanno commentato il tuo pensiero?

Serge: Potrebbero non conoscere ancora i nostri piani.

Manca un:Mi sembra di assistere alle prime fasi di un'iniziativa:Scopri i problemi in una dimensione superiore e trova il punto di accesso più diretto.

Serge: Se sviluppiamo questa infrastruttura per il rilevamento dei problemi, come molte tecnologie, potrebbe essere utilizzata nel bene e nel male.Pertanto, a differenza di molte IA commerciali,Cerchiamo di sviluppare sistemi di gestione aperti, trasparenti e verificabili . Pertanto, avremo una base di conoscenza completamente trasparente e gli utenti potranno vedere la cronologia delle modifiche dei dati, incluso quando i dati sono stati inclusi e da quali annotatori sono stati annotati.

Manca un:Come garantire l'accuratezza e l'obiettività dei dati?

Serge:La risposta semplice è:non possiamo garantire

Ma la cosa migliore che possiamo fare è creare un sistema che attiri decine di migliaia di persone interessate a diverse aree di discussione per annotare il sistema. Avere il maggior numero possibile di annotatori può aiutarci a garantire obiettività statistica. Wikipedia dispone anche di meccanismi progettati per la trasparenza e la responsabilità, e noi faremo lo stesso.

Manca un:In che modo questa ricerca avrà un impatto su politici, educatori e tecnologi?

Serge: Pensa a ciò che stiamo facendo come a un complemento al ragionamento logico o fattuale.

Supponiamo che un'azienda voglia migliorare la propria diversità, equità e inclusione. Quindi il loro consiglio di amministrazione ha tenuto una riunione per discutere l’assunzione di più donne o minoranze. Questo tipo di discussione è comune in molte aziende e in un’università, ad esempio, potrebbero non esserci molte donne che studiano ingegneria elettrica e il dipartimento vuole adottare misure per cambiare questa situazione. In questi incontri possono esserci molte discussioni che non sono supportate da conoscenze o informazioni.

Alcune persone esprimono opinioni distorte secondo cui le donne non sono brave in matematica. Ciò che serve è un sistema che possa aiutare il presidente del dipartimento, l’amministratore delegato o l’insegnante che deve condurre queste discussioni e che possa estrarre una serie di narrazioni dal sistema per strutturare la discussione. Inoltre, una volta che il sistema inizia a funzionare, indicizza e analizza le dichiarazioni in narrazioni preesistenti. In questo modo, un CEO, un insegnante o un facilitatore di riunioni può evitare conversazioni di bassa qualità o confuse, avere una struttura e un sistema di classificazione efficaci, guidare le discussioni e prevenire conversazioni ridondanti.

Manca un:Per quanto riguarda la futura narrativa sui social media e l’analisi dei problemi, quali pensi siano le potenziali direzioni di ricerca per lo sviluppo tecnologico?

Serge: Campi diversi hanno le loro sfide uniche. Alcuni di essi sono problemi classici come l’elaborazione di grandi quantità di dati e come etichettarli, come mitigare i bias, ecc. Ma affrontiamo grandi sfide anche quando si tratta di visualizzazione.

Abbiamo appena accennato alle differenze affrontate dalle diverse lingue e culture. Ogni argomento specifico ha molte prospettive diverse e annotatori diversi forniranno annotazioni diverse a causa dei propri pregiudizi. Dal punto di vista della teoria dell’informazione, il tentativo di comprimere questi diversi resoconti può comportare la perdita o la corruzione delle informazioni. Questo tipo di domande si presenteranno durante tutto il progetto e le incontreremo frequentemente.

Manca un: Secondo te, quali ultimi sviluppi nella tecnologia visiva avranno un profondo impatto sul futuro?

Serge: Ora sempre più ricercatori stanno iniziando a prestare attenzione ai dati multimodali, elaborando più tipi di dati come immagini, testo e audio contemporaneamente in un modello. Questo metodo di solito utilizza architetture modello come Transformer per risolvere problemi pratici complessi . Credo che questa tendenza continuerà e i futuri nuovi arrivati ​​nel campo dell’intelligenza artificiale troveranno più naturale padroneggiare più competenze professionali contemporaneamente piuttosto che approfondire un’unica area, come l’elaborazione del linguaggio naturale o la visione artificiale.

Personalmente penso che, sebbene alcuni affermino che l’intelligenza artificiale sostituirà completamente i medici, questa affermazione sia esagerata. Ma sono convinto che in campi come la radiologia, la dermatologia e l’istopatologia, i sistemi assistiti dall’intelligenza artificiale si diffonderanno e andranno a vantaggio di tutti.

Per quanto riguarda le auto a guida autonoma, anche se in passato sono state fatte previsioni secondo cui i progressi nella tecnologia visiva e nell’intelligenza artificiale consentirebbero un’adozione diffusa di auto a guida autonoma, penso che sia improbabile che ciò accada. A meno che il governo non adotti misure per limitare la circolazione delle auto convenzionali in determinate corsie o vietarle del tutto, è altamente improbabile che le auto a guida autonoma diventino la norma negli Stati Uniti.

Manca un : Mi piace il tuo giornale. I miei pensieri sono simili.Lo sviluppo tecnologico sta sbloccando contemporaneamente nuove dimensioni cognitive. La metodologia più preziosa è quella che ha un punto di ingresso minimalista ma può irradiare la situazione complessiva.

Serge:Quale metodologia ti interessa di più?

Manca un:Fai un piccolo esempio.Lungo il percorso della falsificabilità, la scienza intraprenderà il percorso iterativo della negazione della negazione... ritornando alla struttura della rivoluzione scientifica che tutti conosciamo.

*Anche Hang Zhou ha contribuito a questo articolo.

Poiché questo articolo coinvolge discussioni accademiche, ecco una breve introduzione all’autore:

  • Zhang Yijia, il fondatore di Jiazi Guangnian, si è laureato alla Scuola di Scienze Matematiche dell'Università di Pechino nel 2013 e ha conseguito una doppia laurea in economia presso l'Istituto Nazionale per lo Sviluppo, ha vinto una medaglia d'oro alle Olimpiadi della Matematica Cinese ed è stato selezionato per le Olimpiadi team di formazione nazionale; i suoi interessi di ricerca sono la matematica finanziaria e la teoria dei giochi e ricopre il ruolo di direttore contemporaneamente della Scuola di Scienze Matematiche dell'Università di Pechino.

  • Zhou Hang, il responsabile di Jiazi Brain, si è laureato alla Scuola di Scienze Matematiche dell'Università di Pechino nel 2019; la sua direzione di ricerca è l'ottimizzazione sparsa e l'ottimizzazione non convessa;


*Riferimenti
  • Alla ricerca della struttura nelle affermazioni non falsificabili.pdf

  • 978-3-319-10602-1_48.pdf "Microsoft COCO: Oggetti comuni nel contesto" Set di dati MSCOCO: l'articolo più citato di Serge.

  • Thomas Samuel Kuhn "La struttura delle rivoluzioni scientifiche"


Segui l'account pubblico "Jiazi Guangnian" e rispondi "può essere falsificato" in background per ottenere le informazioni menzionate nell'articolo"Ricerca della struttura nelle affermazioni non falsificabili"ESet di dati MSCOCODue documenti.

|Manca unRecensione della serie di dialoghi|