Συζήτηση της δεσποινίδας Α με τον Serge Belongie: Να σας δώσει μια παραποιήσιμη «σφαίρα»

Η συνομιλία της δεσποινίδας Α με τον Σερζ Μπελόνγκι: Να σας δώσει μια παραποιήσιμη «σφαίρα» |

2024-07-31

Η παραποίηση είναι και άγγελος και διάβολος, τελικά, η παραποίηση είναι μια χειραψία που ευθυγραμμίζει τον κόσμο.

Συγγραφέας Zhang Yijia Sukhoi‍‍

Πριν από δέκα χρόνια, ένας Ευρωπαίος ακαδημαϊκός μου είπε:Δεν υπάρχουν λιγότερα από εκατό υποδιαιρούμενα κομμάτια στην τεχνητή νοημοσύνη και οι Ηνωμένες Πολιτείες θα ορίσουν ένα ή δύο δημοφιλή κομμάτια. , και στη συνέχεια παγκόσμιοι επιχειρηματίες και επενδυτές έσπευσαν να καλύψουν τη διαφορά με αυτά τα δύο κομμάτια. "

Τα επόμενα δέκα χρόνια, η τάση της τεχνητής νοημοσύνης έχει περιστραφεί και η τεχνητή νοημοσύνη έχει περάσει από μη συναίνεση σε μικρή συναίνεση και από μικρή συναίνεση σε μεγάλη συναίνεση, αλλά αυτή η πρόταση δεν ξεπήδησε ποτέ.

Αυτή η συνομιλία με τον Σερζ ξεκίνησε με μια ανασκόπηση μιας εργασίας που συνέταξε πριν από δύο χρόνια."Αναζήτηση δομής σε μη παραποιήσιμες αξιώσεις" ενδιαφέρον του. Είναι κρίμα που αυτό το άρθρο δεν έχει σχεδόν καμία προσοχή μέχρι στιγμής, Google ScholarΑναφέρθηκε μόνο 2 φορές。

Αυτό είναι εκπληκτικό.

Ο "Jiazi Guangnian" πιστεύει ότι,αυτό το δοκίμιοχονδρικά υποτιμημένο。

Λόγος 1: Το ζήτημα που αντιμετωπίζει αυτό το άρθρο είναι εξαιρετικά κρίσιμο (η υποκείμενη αφήγηση των μη παραποιήσιμων δεδομένων στα μέσα κοινωνικής δικτύωσης).

Λόγος δεύτερος, αυτό το άρθρο παρέχει σημαντικές θεωρητικές καινοτομίες (μέθοδος τριαδικού σχολιασμού και σύνολο SNaCK).

Λόγος τρίτος: Αυτό το άρθρο παρέχει πρακτικά αποτελέσματα μηχανικής (κατασκευή συνόλων δεδομένων και λεπτομερής πειραματική σύγκριση).

Συγγραφείς της εργασίας Peter Ebert Christensen, Frederik Warburg, Menglin Jia and Serge Belongie ARXIV2022

Αυτό το χαρτί δεν είναι δύσκολο να το καταλάβει κανείςΠαραποιησιμότηταΗ έννοια αρχίζει να εισάγεται.

Η παραποίηση ονομάζεται επίσης και διαψευσιμότητα.Οι φιλοσοφίες της επιστήμης χρησιμοποιούν συχνά αυστηρέςμέθοδος παραποίησηςΓια να καθοριστεί αν μια θεωρία είναι επιστημονική, δηλαδή«Αυτά τα συμπεράσματα πρέπει να επιτρέπουνλογικήΗ ύπαρξη αντιπαραδειγμάτων προς。

Ο Karl Popper πρότεινε το 1934 ότι εάν μια θεωρία ή υπόθεση μπορεί να αντικρουστεί λογικά με εμπειρικό έλεγχο των υπαρχουσών τεχνικών, τότε είναιΠαραποιήσιμο του. Και αν μια έκφραση είναι τόσο άψογη που ο κόσμος δεν έχει περιθώρια σχολιασμού, συχνά κρατά τους πάντες σε απόσταση, κάτι που δεν βοηθά στην προώθηση της επιστημονικής προόδου.

Τα προβλήματα που μπορούν ή πρέπει να μελετήσουν οι επιστήμονες πρέπει να είναι λίγο-πολύ περιορισμένα, δίνοντας στους άλλους την ευκαιρία να τους επιτεθούν ή ακόμα και να τους ανατρέψουν. Ο σκοπός της παραποιησιμότητας είναι να καταστήσει τη θεωρία προβλέψιμη και ελεγχόμενη.άρα χρήσιμο στην πράξη。

Το χαρτί του Σερζ"Αναζήτηση δομής σε μη παραποιήσιμες αξιώσεις"συζητήθηκεΗ πολυπλοκότητα της ερμηνείας μη παραποιημένων ισχυρισμών στα μέσα κοινωνικής δικτύωσης。

Η κύρια ιδέα της εργασίας:

Οι πλατφόρμες μέσων κοινωνικής δικτύωσης πλημμυρίζουν από αναρτήσεις και σχόλια και πολλοί ισχυρισμοί δεν μπορούν να διαψευστούν. Ωστόσο,Ανεπαρκή εργαλεία ελέγχου δεδομένων, έλλειψη δομής στις συζητήσεις κοινωνικών δικτύων, δυσκολίες στον εντοπισμό αφηγήσεων και έλλειψη ποιότητας στις δημόσιες συζητήσειςκ.λπ., προκαλώντας πολλά προβλήματα.

Η εργασία εξετάζει τον τρόπο αναγνώρισης και κατανόησης αυτών στα μέσα κοινωνικής δικτύωσηςαδιαπραγμάτευτους ισχυρισμούς, και συνοψίστε αυτούς τους ισχυρισμούς ωςΠεριορισμένος αριθμός αφηγήσεων, για να διευκολυνθεί καλύτερα η συζήτηση και ο διάλογος στα μέσα κοινωνικής δικτύωσης.

Είναι ενδιαφέρον ότι ο συγγραφέας κατασκεύασε ένα εργαλείο που ονομάζεταιΠΛΗΡΩΤΗΣΈνα σύνολο δεδομένων που περιέχει τη συζήτηση σχετικά με τις μεθόδους στεγνώματος των χεριών σε δημόσιες τουαλέτες (χαρτοπετσέτες έναντι στεγνωτηρίων αέρα), 600 αποσπάσματα σύντομων κειμένων, 31 αφηγήσεις και 4 υπερκατηγορίες για την κατανόηση και την ανακάλυψη κυρίαρχων αφηγήσεων σε διαδικτυακές συζητήσεις.

Αυτή η εργασία εισάγειΜια νέα προσέγγιση που υπερβαίνει τις δυνατότητες των υφιστάμενων τεχνολογιών ελέγχου δεδομένων, παρέχει μια σημαντική συμβολή στη διαχείριση και την κατανόηση του αντίκτυπου των μη παραποιημένων ισχυρισμών σε περιβάλλοντα ψηφιακής επικοινωνίας - χρησιμοποιώντας αυτήν τη διαδικασία για να ανακαλύψετε κυρίαρχες αφηγήσεις και δείχνοντας ότι αυτή η διαδικασία υπερτερεί των πρόσφατων μοντέλων μετασχηματισμού μεγάλης κλίμακας και του προηγμένου μοντέλου χωρίς επίβλεψη θεμάτων .

μέσα από πειράματα,Ο συγγραφέας βρήκεΧρησιμοποιήστε σύγχρονο μετατροπέα προτάσεων(όπως το μοντέλο T5)Ενσωμάτωση αρχικής πρότασηςείναι το κλειδί .Διαπίστωσαν επίσης ότι η στρατηγική δειγματοληψίας είναι ζωτικής σημασίας για τη δημιουργία ενσωματώσεων υψηλής ποιότητας, ειδικάΣτρατηγική "Distance-Rnd".Η καλύτερη επίδοση.

Πειραματικά αποτελέσματα δείχνουν ότι ο συνδυασμός ανθρώπινων σχολιασμώντρίδυμαμπορεί να αποκαλύψει τη συμμόρφωσηαποκρυσταλλωμένη αφήγησηενδιαφέρουσα ομαδοποίηση.

Μόνο 2 παραπομπές

Ο "Jiazi Guangnian" πιστεύει ότι οι πιθανοί λόγοι για τους οποίους αυτό το έγγραφο έχει στερηθεί προσοχής στον κλάδο μέχρι στιγμής περιλαμβάνουν, αλλά δεν περιορίζονται σε:

(1) Η θεωρητική ανάλυση είναι σχετικά αδύναμη και η ανάλυση των πειραματικών αποτελεσμάτων παραμένει ποιοτική (το κείμενο των 11 σελίδων έχει μόνο μισή σελίδα τύπων).

(2) Δεν υπάρχει σχεδόν καμία εισαγωγή σε αρκετούς αλγόριθμους που χρησιμοποιούνται για σύγκριση.

(3) Μπορεί να μην υπάρχει ακόμη ένα ενοποιημένο σύνολο δεδομένων στην ακαδημαϊκή κοινότητα σε αυτόν τον τομέα, με αποτέλεσμα να μην υπάρχει "εκτός κύκλου" εντός της ακαδημαϊκής κοινότητας.

(4) Ο συγγραφέας τόνισε την κρισιμότητα του Τ5, αλλά δεν περιέγραψε ξεκάθαρα την υπεροχή του αλγορίθμου του.

Η ακαδημαϊκή κοινή χρήση του Serge Belongie στο CVPR2024, πηγή: Φωτογραφία "Jiazi Guangnian"

Αν και οι προαναφερθείσες εργασίες είναι ελάχιστα γνωστές, ο ίδιος ο Serge είναι ένας επιστήμονας με μεγάλη επιρροή στον τομέα της όρασης υπολογιστών και της μηχανικής μάθησης.

Ο Serge Belongie είναι καθηγητής επιστήμης υπολογιστών στο Πανεπιστήμιο της Κοπεγχάγης και διευθυντής του Κέντρου Τεχνητής Νοημοσύνης του Δανικού Πρωτοπόρου. Προηγουμένως, υπηρέτησε ως αναπληρωτής κοσμήτορας και Andrew H. and Ann R. Tisch Καθηγητής Επιστήμης Υπολογιστών στο Cornell Tech.

Το πιο άξιο εισαγωγής είναιΟ Serge είναι ο κύριος συγγραφέας του MSCOCO。

Το σύνολο δεδομένων MSCOCO είναι ένα από τα πιο διάσημα σύνολα δεδομένων μεγάλης κλίμακας για την όραση υπολογιστών.Το 2000, ο Serge and Jitendra Malik (τώρα καθηγητής της επιστήμης των υπολογιστών στο Πανεπιστήμιο της Καλιφόρνια στο Μπέρκλεϋ, και διάσημος μελετητής στον τομέα της όρασης υπολογιστών)πρότειναν από κοινού την έννοια του «Πλαίσιο σχήματος»,Είναι μια ευρέως χρησιμοποιούμενη μέθοδος περιγραφής χαρακτηριστικών σχήματος στα πεδία της όρασης υπολογιστή και της αναγνώρισης αντικειμένων.

Το 2004, ο Serge ονομάστηκε Young Technology Innovator κάτω των 35 ετών από το MIT Technology Review το 2007, αυτός και ο Jitendra Malik έλαβαν τιμητική διάκριση για το βραβείο Marr το 2015, ο Serge έλαβε το βραβείο ICCV Helmholtz. των εργασιών που έχουν συνεισφέρει θεμελιώδη στον τομέα της όρασης υπολογιστών.

Ο Serge είναι επίσης συνιδρυτής πολλών εταιρειών, όπως η Digital Persona (συγχωνεύτηκε με το CrossMatch το 2014), η CarCode (που αποκτήθηκε από την Transport Data Systems), η Anchovi Labs (εξαγοράστηκε από το Dropbox το 2012) και η Orpix.

Επί του παρόντος, η ομάδα SergeΑνοίγοντας νέες διαστάσεις στην ανάλυση των κοινωνικών δικτύων——Ξεκινώντας από έναν μεγάλο αριθμό ασήμαντων παρατηρήσεων που δεν έχουν δοθεί στο παρελθόν προσοχή και δεν είναι κατάλληλες για παραδοσιακό έλεγχο γεγονότων,Αναλύστε τη ρύθμιση προβλημάτων και“αφηγηματική χειραγώγηση”。

Αυτό έχει ιδιαίτερη σημασία αυτή τη στιγμή:

Μετά τον Παγκόσμιο Αντιφασιστικό Πόλεμο, ανεξάρτητα από το αν εναλλάσσονταν τεχνολογικές ανακαλύψεις ή συμφόρηση, όλοι γνώρισαν σκαμπανεβάσματα στην ιστορική εικόνα όσο περνούσε ο καιρός. Ακριβώς όπως το "Along the River Κατά τη διάρκεια του Φεστιβάλ Qingming" που εκτυλίχθηκε στο σύστημα συντεταγμένων του χρόνου και του χώρου, είναι γεμάτο με χιλιάδες σκηνές και εμφανίσεις αρχαίων και σύγχρονων όντων.

Ακολουθεί η συνομιλία της δεσποινίδας Α με τον Σερζ.

Ακολουθήστε τον δημόσιο λογαριασμό "Jiazi Guangnian" και απαντήστε "μπορεί να παραποιηθεί" στο παρασκήνιο για να λάβετε τις πληροφορίες που αναφέρονται στο άρθρο"Αναζήτηση δομής σε μη παραποιήσιμες αξιώσεις"καιΔεδομένα MSCOCOΔύο χαρτιά.

1. Αμφισβητείται η παραποίηση

Οι ερευνητές στην πράξη επηρεάζονται συχνά από αφηγήσεις που τους αρέσουν ή δεν τους αρέσουν—κάπως παρόμοια με μοντέρνα θέματα στο Instagram.

Δεσποινίς Α: «Εάν δεν μπορεί να παραποιηθεί, δεν μπορεί να είναι επιστημονικό» έχει γίνει μια γενική συναίνεση στην επιστημονική κοινότητα. Αλλά πολλοί φιλόσοφοι το αμφισβήτησαν αυτό, υποστηρίζοντας ότι η αρχή της παραποιησιμότητας μπορεί να οδηγήσει σε ατέρμονες επιστημονικές συζητήσεις.Είναι η παραποιησιμότητα απαραίτητη προϋπόθεση για την επιστημονική πρόοδο;

Ραβδωτό μάλλινο ύφασμα：Σύμφωνα με τη δημοφιλή άποψη, μια επιστημονική θεωρία πρέπει να είναι παραποιήσιμη.

Δεσποινίς Α:Αυτή είναι η δημοφιλής άποψη, αλλά είναι η παραποιησιμότητα το κυρίαρχο παράδειγμα;

Ραβδωτό μάλλινο ύφασμα: Η βιβλιογραφία της μηχανικής μάθησης έχει εκραγεί τα τελευταία 15 χρόνια, με μεγάλο αριθμό εργασιών που δημοσιεύονται και αναφέρονται καθημερινά. Σε αυτές τις εργασίες, οι σχετικές ενότητες εργασίας συχνά παραθέτουν άλλη βιβλιογραφία, αλλά οι παραπομπές δεν είναι απαραίτητα η πιο σχετική βιβλιογραφία για το έργο τους. Αυτό συμβαίνει επειδή ο όγκος της λογοτεχνίας είναι τεράστιος.Οι ερευνητές στην πραγματικότητα ανταποκρίνονται στην κυρίαρχη αφήγηση στο πεδίο.

Συχνά θεωρούμε τους εαυτούς μας ως επιστήμονες σύμφωνα με την παράδοση του Karl Popper, υποκείμενοι μόνο σε παραποιήσιμους ισχυρισμούς. Ωστόσο, υπάρχουν και τάσεις στην επιστημονική έρευνα, όπως τεχνολογίες όπως τα δίκτυα παραγωγής αντιπάλων και οι μετασχηματιστές. Αν και αυτές οι εργασίες στοχεύουν να ακολουθήσουν την επιστημονική παράδοση,Οι ερευνητές συχνά επηρεάζονται στην πράξη από αφηγήσεις που τους αρέσουν ή δεν τους αρέσουν——Κάπως σαν τα δημοφιλή θέματα στο Instagram。

Δεσποινίς Α:Εννοείς, από τη μηχανική μάθηση, οι επιστήμονες άρχισαν να αποκλίνουν από τον κανόνα της παραποιησιμότητας;

Ραβδωτό μάλλινο ύφασμα:Οι επιστήμονες συχνά ισχυρίζονται ότι έχουν ανοσία σε αυτές τις επιρροές και θεωρούν τους εαυτούς τους αντικειμενικούς, αλλά τελικά είναι άνθρωποι και θα επηρεαστούν από αυτές τις δημοφιλείς απόψεις.Αυτό είναι κάτι που θεωρούμε αντιεπιστημονικό και περισσότερο ως εντερικό συναίσθημα και άποψη.

Δεσποινίς Α:Πώς ορίζετε τους μη παραποιήσιμους ισχυρισμούς στα μέσα κοινωνικής δικτύωσης;

Ραβδωτό μάλλινο ύφασμα: Πρέπει πρώτα να συζητήσουμε τη βιβλιογραφία σχετικά με τον έλεγχο γεγονότων. Η καθηγήτρια Isabelle Augenstein του Πανεπιστημίου της Κοπεγχάγης, για παράδειγμα, έχει αναπτύξει μια μέθοδο που ξεκινά με τον προσδιορισμό της τιμής επαλήθευσης μιας δήλωσης. Θα ελέγξουμε μια δήλωση,και προσδιορίστε την τιμή επαλήθευσης στην περιοχή από 0 έως 1。

Για παράδειγμα, η δήλωση ότι η πρωτεύουσα της Καλιφόρνια είναι το Σακραμέντο είναι ιδανική για έλεγχο γραμματικής και σύνταξης, επειδή μπορεί να βρεθεί σε πολλαπλές δομημένες βάσεις γνώσεων. Θα μπορούσαμε να εξετάσουμε μια δήλωση όπως: "Η πρωτεύουσα της Καλιφόρνια είναι το Σακραμέντο" και να της δώσουμε μια βαθμολογία δοκιμασιμότητας πιθανώς κοντά στο 0,99. Στη συνέχεια, το υποβάλλουμε σε μια δομημένη βάση γνώσεων για να επιβεβαιώσουμε την απάντηση. Αυτό το σύστημα δοκιμασιμότητας που βασίζεται σε βαθιά μάθηση επεξεργάζεται μεγάλες ποσότητες αξιώσεων και δεδομένων εκπαίδευσης για να αξιολογήσει την αξία επαλήθευσης διαφορετικών αξιώσεων.

Κάποιες δηλώσεις όμως,Για παράδειγμα, το "Η μετανάστευση στην Καλιφόρνια είναι κακό" αντανακλά πιο προσωπικές απόψεις και δεν είναι κατάλληλο για έλεγχο γεγονότων.Αντίθετα, δηλώσεις όπως «Από το 2020, ο αριθμός των μεταναστών στην Καλιφόρνια συνέχισε να αυξάνεται» έχουν υψηλή αξία επαλήθευσης.

ΈτσιΔίνουμε ιδιαίτερη προσοχή σε ισχυρισμούς που είναι δύσκολο να επαληθευτούν——Αυτοί οι ισχυρισμοί δεν μπορούν να επαληθευτούν άμεσα, αλλά η συζήτηση που έχουν πυροδοτήσει στα μέσα κοινωνικής δικτύωσης είναι σημαντική.。Οι πολλαπλοί έλεγχοι μπορεί να μας βοηθήσουν να κάνουμε καλύτερες κρίσεις.

Δεσποινίς Α:Στην έρευνά σας, ποιες συγκεκριμένες τεχνικές ή εργαλεία χρησιμοποιούνται για τον εντοπισμό και την ανάλυση μη παραποιημένων ισχυρισμών;

Ραβδωτό μάλλινο ύφασμα:Χρησιμοποιούμε τεχνικές επεξεργασίας φυσικής γλώσσας (NLP), αλγόριθμους ομαδοποίησης και ομαδοποίησης και μεθόδους μηχανικής μάθησης.

στόχος μας είναιΔημιουργία διευκόλυνσης παγκόσμιας αφήγησης πληροφοριών (GNIF), για την έρευνα και οργάνωση του περιεχομένου των μέσων κοινωνικής δικτύωσης。

Ο συνδυασμός αυτών των τεχνολογιών και εργαλείων μας επιτρέπει να κατανοούμε καλύτερα και να επεξεργαζόμαστε μεγάλες ποσότητες αφηγηματικού περιεχομένου,Βοηθά έμμεσα στον εντοπισμό μη παραποιημένων ισχυρισμών。

Μπορούμε να αναλύσουμε διάφορες μορφές κειμένου.Είτε πρόκειται για ένα tweet είτε για ένα σχόλιο στο Reddit, χρησιμοποιούμε την τεχνολογία NLP για την εξαγωγή και την κατανόηση των αφηγήσεων και των θεμάτων σε αυτό το περιεχόμενο.

Δεύτερον, χρησιμοποιήσαμεΑλγόριθμοι ομαδοποίησης και ομαδοποίησης . Αυτοί οι αλγόριθμοι μας βοηθούν να οργανώσουμε μεγάλες ποσότητες περιεχομένου κοινωνικών μέσων σε διαφορετικά θέματα ή αφηγήσεις.

Για παράδειγμα,Μπορούμε να βρούμε χιλιάδες tweets από εκατομμύρια tweets που μοιάζουν πολύ, επειδή όλα αφορούν την ίδια υποκείμενη αφήγηση.

πέρασμαΟμαδοποίηση αφήγησης και ομαδοποίηση ισχυρισμών , οργανώνουμε μεγάλες ποσότητες περιεχομένου σε μικρότερα συμπλέγματα, επιτρέποντας στους ελέγχους δεδομένων να το επεξεργάζονται πιο αποτελεσματικά χωρίς να χρειάζεται να ελέγχουν κάθε στοιχείο ξεχωριστά. Με αυτόν τον τρόπο, ακόμη και μη παραποιήσιμοι ισχυρισμοί μπορούν να εντοπιστούν και να ταξινομηθούν μέσω ομαδοποίησης και ομαδοποίησης για να διευκολυνθεί η περαιτέρω ανάλυση και επεξεργασία.

Λαμβάνουμε υπόψη δύο εισροές, ας πούμε δύο tweets, και μετράμε την ομοιότητά τους με βάση διαφορετικές αφηγηματικές πτυχές -Αυτά μπορεί να καλύπτουν θέματα όπως η συζήτηση για την πυρηνική έναντι της πράσινης ενέργειας ή συζητήσεις σχετικά με το βρεφικό γάλα έναντι του γάλακτος αγελάδας.

Υπάρχουν πολλά θέματα που συζητούνται έντονα στο διαδίκτυο, συχνά αποτέλεσμα εκστρατειών παραπληροφόρησης。 Αυτές οι δραστηριότητες μπορεί να είναι πολύ ασαφείς. Αυτό που προσπαθούμε να καταλάβουμε είναι πώς εκδηλώνονται αυτές οι διαφορετικές δηλώσεις με τη μορφή γλώσσας ή μιμιδίων, τα οποία μπορεί να περιέχουν εικόνες, κείμενο, ηχητικές δηλώσεις κ.λπ.Μοιάζει με ένα εντελώς διαφορετικό κομμάτι περιεχομένου . Μπορεί να συλλέξετε εκατομμύρια συζητήσεις για ένα θέμα σε μια πλατφόρμα κοινωνικής δικτύωσης, αλλά όλα τα δεδομένα μπορεί να αντιπροσωπεύουν μόνο μερικές δεκάδες απόψεις. Προσπαθούμε να κατανοήσουμε αυτά τα φαινόμενα μέσω τεχνολογιών όπως τα μεγάλα γλωσσικά μοντέλα και η βαθιά μετρική εκμάθηση.

Οπτικοποίηση ανθρώπινων σχολιασμένων ζευγών, Η υποεικόνα (α) δείχνει θετικά ζεύγη, δηλαδή παρόμοια ή συνεπή, αφηγηματικά ζεύγη σχολιασμένα από ανθρώπους. Η υποεικόνα (β) δείχνει αρνητικά ζεύγη, δηλ. ανόμοια ή ασυνεπή αφηγηματικά ζεύγη που επισημαίνονται από ανθρώπους. Πηγή: «Αναζήτηση δομής σε μη παραποιήσιμες αξιώσεις»

2. Πέρα από το «αληθινό και το ψέμα»

Δεν αξίζουν όλοι οι ισχυρισμοί έλεγχος γεγονότων και δεν δίνουν όλοι οι έλεγχοι γεγονότων αληθή ή ψευδή αποτελέσματα.

Δεσποινίς Α: Το σύνολο δεδομένων MSCOCO που δημιουργήσατε είναι ένα από τα πιο διάσημα σύνολα δεδομένων υπολογιστικής όρασης μεγάλης κλίμακας. Πώς ξεκίνησε;

Ραβδωτό μάλλινο ύφασμα: Ξεκινήσαμε την έρευνα ανίχνευσης αντικειμένων πριν από 15 χρόνια, ξεκινώντας με ένα μικρό σύνολο δεδομένων CUB200 που περιέχει πάνω από 200 είδη πουλιών. Το σύνολο δεδομένων COCO ήταν αρχικά ένα πρόγραμμα καλοκαιρινής πρακτικής άσκησης του διδακτορικού μου φοιτητή Tsung-Yi Lin στο Microsoft Research, ο μέντοράς του εκείνη την εποχή ήταν ένας άλλος διδακτορικός φοιτητής μου, ο Piotr Dollá. Το έργο εξελίχθηκε σε μια κοινοπραξία ερευνητών από τον ακαδημαϊκό χώρο και τη βιομηχανία. Ελπίζουν να δημιουργήσουν ένα σύνολο δεδομένων που θα περιγράφει λεπτομερώς τα καθημερινά αντικείμενα στο φυσικό περιβάλλον και θα σχολιάζει με ακρίβεια τα ονόματά τους και τις χωρικές τοποθεσίες τους.

Δεσποινίς Α: Ονομάσατε το σύνολο δεδομένων MSCOCO. Μου αρέσει πολύ το "Coco" και το αγγλικό του όνομα είναι επίσης Coco.

Ραβδωτό μάλλινο ύφασμα:Ναι, όλοι αγαπάμε το όνομα "COCO", είναι διασκεδαστικό και εύκολο να το θυμόμαστε.

Δεσποινίς Α:Μετά την εμφάνιση του συνόλου δεδομένων MSCOCO, η ανάπτυξη του οπτικού πεδίου υπολογιστών ήταν σαν να οδηγείς έναν πύραυλο.

Ραβδωτό μάλλινο ύφασμα:Λοιπόν, έχουμε οργανώσει όλο και περισσότερες κοινότητες γνώσης γύρω από αυτό, και το COCO έχει χρησιμοποιηθεί από εκατομμύρια ανθρώπους.Ξεκινήσαμε μικρά και τελικά αναπτύξαμε ένα πεδίο έρευνας που είχε βαθύ αντίκτυπο.

Το πρώτο συνέδριο υπολογιστικής όρασης που παρακολούθησα ήταν το CVPR 1994, επίσης στο Σιάτλ. Αυτό έγινε πριν από τριάντα χρόνια, και ήταν περίπου 300 άτομα παρόντα. Τώρα, στο 2024 Seattle CVPR, υπάρχουν 12.000 άτομα που παρακολουθούν το συνέδριο.

Δεσποινίς Α:Έχουν περάσει 30 χρόνια, τι οδηγεί το σταθερό σας πάθος για την έρευνα για την όραση υπολογιστών και την τεχνητή νοημοσύνη;

Ραβδωτό μάλλινο ύφασμα: Από όσο θυμάμαι τον εαυτό μου, με ενδιέφεραν τα μοτίβα και η κατηγοριοποίηση των πραγμάτων. Στο γυμνάσιο έκανα μια εργασία στην τάξη για την ταξινόμηση βιδών, μπουλονιών και άλλων συνδετήρων. Ενώ στο κολέγιο άρχισα να ενδιαφέρομαι για τα ηχητικά μοτίβα, συγκεκριμένα τη βιοακουστική, όπως οι ήχοι πουλιών ή φαλαινών.Όσον αφορά τις εικόνες, ήταν τα δακτυλικά αποτυπώματα και τα πρόσωπα που με τράβηξαν.

Έχω ερευνήσει πώς να διαβάζω τα χείλη από βίντεο. Όλες οι πτυχές αυτού του προβλήματος με γοητεύουν: η συγχώνευση ήχου και όρασης, οι διαφορές μεταξύ διαφορετικών ηχείων και οι υπολογιστικές προκλήσεις. Στις αρχές της δεκαετίας του 1990, οι ψηφιακές φωτογραφικές μηχανές μόλις έβγαιναν, αλλά δεν είχαν ακόμη καμία μορφή υπολογιστικής κατανόησης. Σήμερα, μπορεί να θεωρείτε δεδομένο ότι έχετε καρέ ανίχνευσης προσώπου στο σκόπευτρο ή λογισμικό άλμπουμ φωτογραφιών που μπορεί να οργανώσει έξυπνα φωτογραφίες ολόκληρης της οικογένειάς σας, αλλά αυτά δεν υπήρχαν τότε.

Ένιωσα τότε ότι η ζήτηση για αυτή την τεχνολογία θα ήταν πολύ μεγάλη και ταυτόχροναΜου αρέσουν επίσης τα μαθηματικά πίσω από την τεχνολογία . Μου άρεσε η τεχνολογία που χρησιμοποιείται σε αυτούς τους τομείς, αλλά δεν ήθελα να ασχοληθώ με τα μαθηματικά ή τη φυσική. Όπως η χρήση πολύπλοκων μαθηματικών μεθόδων για την επίλυση προβλημάτων στην επεξεργασία ήχου, βίντεο και εικόνας.

Πάντα νιώθω ότι η αποστολή μου σε αυτόν τον κόσμο είναι να κάνω αυτού του είδους τη δουλειά.

Δεσποινίς Α:Τι ακαδημαϊκό μοίρασμα κάνατε στο CVPR φέτος;

Ραβδωτό μάλλινο ύφασμα: Η ομάδα μου υπέβαλε πολλές εργασίες στο κύριο συνέδριο CVPR και τις μοιράστηκα επίσης σε δύο σεμινάρια. Μία από τις εκθέσεις αφορά την ιστορία της έρευνας της όρασης υπολογιστών, κυρίως για να βοηθήσει τους νέους μελετητές να κατανοήσουν την κλασική τεχνολογία όρασης υπολογιστών, δηλαδή την τεχνολογία πριν από τη βαθιά μάθηση και τους μετασχηματιστές. Παρουσίασα επίσης το έργο Visipedia, το οποίο ξεκίνησε με την κυκλοφορία μιας διευρυμένης έκδοσης του συνόλου δεδομένων CUB200 το 2011. Προς το παρόν, το ερευνητικό περιεχόμενο της Visipedia έχει επεκταθεί σε δεκάδες χιλιάδες φυτά, ζώα και μύκητες, παρέχοντας μια σημαντική ερευνητική βάση για την αναγνώριση αντικειμένων στη φύση.

Μια άλλη αναφορά είναι αυτό στο οποίο θέλω να εστιάσω να μοιραστώ στη σημερινή συνέντευξη, η οποία σχετίζεται με την αφήγηση, την κοινή γνώμη και τις ψευδείς πληροφορίες, ειδικά στο πλαίσιο της ανάπτυξης των μέσων κοινωνικής δικτύωσης.

Δεσποινίς Α:Τι καινοτομίες έχει φέρει η δουλειά σας στο χώρο;

Σερζ: Το κλασικό πρόβλημα στον κόσμο της παραπληροφόρησης και των μέσων κοινωνικής δικτύωσης είναι ο έλεγχος των γεγονότων。 Για παράδειγμα, το Πανεπιστήμιο της Κοπεγχάγης έχει πολλές σχετικές εργασίες. Η γενική προσέγγιση είναι ότι για ορισμένες παρατηρήσεις που πρέπει να επαληθευτούν, χρησιμοποιούμε συστήματα τεχνητής νοημοσύνης για να αναζητήσουμε σχετικά γεγονότα και να προβλέψουμε μια βαθμολογία γνησιότητας μεταξύ 0 και 1 με βάση τα γεγονότα.

Δεσποινίς Α:Ποιες είναι οι προκλήσεις με αυτήν την προσέγγιση;

Ραβδωτό μάλλινο ύφασμα:Δεν υπάρχει μεγάλο πρόβλημα με αυτήν την ίδια τη μέθοδο, η πρόκληση προέρχεται από το ίδιο το πρόβλημα.Δεν αξίζουν όλοι οι ισχυρισμοί έλεγχος γεγονότων και δεν δίνουν όλοι οι έλεγχοι γεγονότων αληθή ή ψευδή αποτελέσματα. Για παράδειγμα, "Τα πάντα είναι ο εθνικός θησαυρός της Κίνας" είναι μια δήλωση που μπορεί να χρησιμοποιηθεί για την εκπαίδευση μοντέλων και την επαλήθευση της αυθεντικότητας μέσω μιας δομημένης βάσης γνώσεων και μεγάλων ποσοτήτων δεδομένων. Δεν συμβαίνει το ίδιο με την πρόταση "μετακόμιση στην Καλιφόρνια".

Δεσποινίς Α:Βλέπετε λοιπόν ερευνητικές δυνατότητες σε δηλώσεις όπως η τελευταία;

Σερζ: Αυτός ο τελευταίος τύπος δήλωσης δεν έχει μελετηθεί εκτενώς, αλλά είναι ένα εξίσου σημαντικό ζήτημα. Αυτές οι δηλώσεις μπορεί να μην έχουν αυστηρό ορισμό του αληθινού/λάθους, αλλά προκαλούν πολλή συζήτηση στα μέσα κοινωνικής δικτύωσης. Αυτή η πρόκληση δεν υπήρχε στην εποχή που μόνο τα μέσα ενημέρωσης χρειαζόταν να ελέγχονται τα γεγονότα, ωστόσο, στα σημερινά πολύ ανεπτυγμένα μέσα κοινωνικής δικτύωσης, ένα είδος θέματος που πυροδοτεί έντονες συζητήσεις, είναι δύσκολο να χαρακτηριστεί επιστημονικά ή δεν μπορεί να παραποιηθεί. άξια έρευνας.

Δεσποινίς Α:Μπορείτε να μου δώσετε μια υπόθεση που είχε πραγματικό αντίκτυπο ή έστω προκάλεσε σοβαρή σύγκρουση;

Ραβδωτό μάλλινο ύφασμα: Χαίρομαι που κάνατε αυτή την ερώτηση, ας δώσουμε ένα ενδιαφέρον παράδειγμα. Αφού πλύνετε τα χέρια σας σε μια δημόσια τουαλέτα, έχετε δύο επιλογές για να τα στεγνώσετε. Δεν είμαι σίγουρος ποια μέθοδος χρησιμοποιείται συνήθως στην Κίνα, στην Ευρώπη μπορείτε είτε να βγάλετε χαρτοπετσέτες είτε να χρησιμοποιήσετε στεγνωτήριο ζεστού αέρα.

Δεσποινίς Α:Αυτές οι δύο μέθοδοι είναι επίσης πιο κοινές στην Κίνα.

Ραβδωτό μάλλινο ύφασμα: Οι κατασκευαστές στεγνωτηρίων και χαρτοπετσετών μπορούν να βγάλουν πολλά χρήματα υπογράφοντας συμβόλαια με οποιαδήποτε αλυσίδα ξενοδοχείων και ολόκληρη η αγορά πιθανότατα θα αποφέρει έσοδα δισεκατομμυρίων δολαρίων. Αλλά πολλοί άνθρωποι στην Ευρώπη έχουν τώρα πολύ ισχυρές απόψεις για τη διαφορά μεταξύ των δύο μεθόδων. Πολλοί άνθρωποι λένε ότι μία από αυτές τις μεθόδους θα μπορούσε να μεταδώσει ασθένειες, ενώ άλλοι λένε ότι η χρήση πολλής ηλεκτρικής ενέργειας ή η κατασκευή χαρτιού θα προκαλούσε περιβαλλοντική ζημιά με τη σπατάλη των δέντρων. Οι περισσότεροι άνθρωποι που έχουν αυτές τις απόψεις δεν είναι ειδικοί στη δημόσια υγεία ή στο περιβάλλον.

Δεσποινίς Α:Είναι οι ίδιοι οι ισχυρισμοί αληθινοί;

Σερζ: Στην πραγματικότητα δεν μας ενδιαφέρει η αυθεντικότητα των δηλώσεών μας, γιατί πολλά θέματα στα μέσα κοινωνικής δικτύωσης δεν μπορούν να αποδειχθούν αυστηρά ή να παραποιηθούν. Αλλά το θέμα τίθεται επειδή μια μικρή ομάδα ανθρώπων θέλει να πείσει τις μάζες ότι ένας τρόπος είναι καλύτερος από τον άλλο. Πιθανότατα δημιούργησαν εκατοντάδες χιλιάδες περιεχόμενο που δημιουργήθηκε από bot. Αν αναζητήσετε συζητήσεις για χαρτοπετσέτες και στεγνωτήρια αέρα στα κοινωνικά δίκτυα αυτές τις μέρες, θα βρείτε εκατομμύρια σχόλια. Η μελέτη μας δεν εστιάζει στην αυστηρή σύγκριση των πλεονεκτημάτων και των μειονεκτημάτων των δύο προσεγγίσεων και στην παρουσίαση αποτελεσμάτων ελέγχου δεδομένων.Μας ενδιαφέρει περισσότερο να εντοπίσουμε αυτά τα σχεδιασμένα ζητήματα.

3. Σύνολο δεδομένων «COCO» στα μέσα κοινωνικής δικτύωσης

Αποφύγετε να πάρετε βιαστικές αποφάσεις.

Κα Α: Η έρευνά σας άνοιξε μια άλλη διάσταση.Ο παραδοσιακός έλεγχος γεγονότων εστιάζει στην αλήθεια της σημασιολογίας, ενώ η έρευνά σας επικεντρώνεται στην αλήθεια των δηλώσεων ή των ισχυρισμών.Σαφήπραγματισμός——Ο στόχος της πρόβλεψης δεν περιορίζεται στο αν είναι αλήθεια ή όχι, αλλά επεκτείνεται σε συζητήσεις για θέματα που δημιουργούνται από ορισμένους χρήστες ή μεγάλο αριθμό ρομπότ στα κοινωνικά δίκτυα για την επίτευξη συγκεκριμένων σκοπών.Ξέρετε τι σημαίνει αυτή η μελέτη;

Ραβδωτό μάλλινο ύφασμα: Ναι, δημιουργούμε κάτι εντελώς νέο. Οι περισσότερες σχετικές μελέτες που γνωρίζουμε επικεντρώνονται αποκλειστικά στον έλεγχο γεγονότων. Ωστόσο, προσπαθούμε να χρησιμοποιήσουμε τεχνολογία φυσικής γλώσσας που σχετίζεται με θέματα για να ομαδοποιήσουμε και να ομαδοποιήσουμε συζητήσεις στα μέσα κοινωνικής δικτύωσης για να βοηθήσουμε τα άτομα, τις επιχειρήσεις και τους υπεύθυνους χάραξης στρατηγικής να κατανοήσουν τι συμβαίνει στα μέσα κοινωνικής δικτύωσης.Δεν κάνουμε αξιολογικές κρίσεις για αυτά τα θέματα και το περιεχόμενο συζήτησης, αλλά εμφανίζουμε μόνο αντικειμενικά τη μορφή με την οποία τίθεται κάθε θέμα.

Δεσποινίς Α: Για να πετύχουμε αυτόν τον στόχο, χρειαζόμαστε πρώτα ένα σύνολο δεδομένων. Η δημιουργία αυτού του συνόλου δεδομένων θα πρέπει να είναι μια μεγάλη πρόκληση. Όταν πρωτοστατήσατε στην έρευνα για την όραση υπολογιστή, επεκταθήκατε από ένα μικρό σύνολο δεδομένων πουλιών στο COCO. Πώς προσέγγισες αυτή τη φορά;

Ραβδωτό μάλλινο ύφασμα: Αυτός ο τύπος συμπεριφοράς κοινωνικής δικτύωσης συχνά χαρακτηρίζεται από ένα πράγμα. Μπορεί να υπάρχουν ένα εκατομμύριο tweets για ένα θέμα, με φαινομενικά χιλιάδες λογαριασμούς να συμμετέχουν στη συζήτηση.Αλλά μέσω της ανάλυσης, μπορεί να διαπιστώσουμε ότι εκατό χιλιάδες από αυτά τα tweets δημοσίευσαν το ίδιο ακριβώς πράγμα, με πολύ παρόμοιες ή και πανομοιότυπες αφηγήσεις. Ωστόσο, έχετε κατά νου ότι αυτό δεν σημαίνει ότι αυτές οι συζητήσεις είναι σωστές ή λάθος. Επιτρέπουμε στους χρήστες να βλέπουν συμπλέγματα και ομαδοποιήσεις διαφορετικών δηλώσεων, διευκολύνοντας τους ελεγκτές γεγονότων και τους αναλυτές κοινωνικών δικτύων να επεξεργάζονται και να κατανοούν μεγάλες ποσότητες περιεχομένου χωρίς να χρειάζεται να αντιμετωπίσουν μια ξαφνική εισροή εκατομμυρίων tweet.

Δεσποινίς Α:Μπορεί αυτό το σύστημα να χειριστεί διάφορα αμφιλεγόμενα θέματα στα μέσα κοινωνικής δικτύωσης σε πραγματικό χρόνο;

Ραβδωτό μάλλινο ύφασμα:Νομίζω ότι μπορεί, και το ελπίζω. Ας υποθέσουμε ότι στη Μεσόγειο συναντώνται δύο πλοία, ρωσικό και αμερικανικό. Οι συζητήσεις ξεκινούν στα κοινωνικά δίκτυα και γεννιέται μια αφήγηση. Κάθε λίγες ώρες εμφανίζονται νέες πληροφορίες, συμπεριλαμβανομένης μιας δήλωσης από έναν καπετάνιο ή μια ηχογράφηση κινητού τηλεφώνου. Σε αυτήν την περίπτωση, ορισμένες αφηγήσεις και ζητήματα κερδίζουν την προσοχή ενώ άλλες μπορεί να γίνουν άσχετες.

Δεσποινίς Α: Ελπίζετεπραγματικός χρόνοςΘέματα αρπαγής？

Ραβδωτό μάλλινο ύφασμα:και άλλες πληροφορίες.Για να βοηθήσουμε τους επαγγελματίες διπλωμάτες, θα θέλαμε να δημιουργήσουμε έναταμπλό(Ταμπλό) , παρέχει ολοκληρωμένες σχετικές πληροφορίες και επίσης τοποθετεί αυτά τα γεγονότα σε παγκόσμιο πλαίσιο.Αυτό το σύστημα μπορείΑποτρέψτε τους ανθρώπους από βιαστικές αποφάσεις . Θα ήθελα να τονίσω ότι το ίδιο το σύστημα δεν αποφασίζει ποια πλευρά έχει δίκιο, αλλά οργανώνει τις πληροφορίες ολοκληρωμένα.

Δεσποινίς Α:Ποια σημεία πόνου πρέπει να αντιμετωπιστούν για να επιτευχθεί αξιόπιστη λειτουργικότητα;

Σερζ: Υπάρχουν τόσο παραδοσιακές όσο και νέες προκλήσεις . Οι παραδοσιακές προκλήσεις περιλαμβάνουν τον αντίκτυπο της γλώσσας, του πολιτισμού και της συναισθηματικής προκατάληψης.

για παράδειγμα, Το "The Little Mermaid" και το "The Ugly Duckling" είναι και τα δύο έργα Δανών συγγραφέων, αλλά οι κινηματογραφικές τους εκδοχές της Disney των ιστοριών έχουν προσαρμοστεί ώστε να ταιριάζουν στην αμερικανική κουλτούρα. Λόγω της μεγαλύτερης κυριαρχίας της αμερικανικής αφήγησης έναντι της δανικής αφήγησης στα κοινωνικά δίκτυα, η αρχική εκδοχή της ιστορίας του Άντερσεν είναι σχεδόν άγνωστη στους χρήστες του Διαδικτύου σε πολλές άλλες χώρες.

Κατά τη διαδικασία του σχολιασμού δεδομένων, ειδικά του σχολιασμού δεδομένων κοινωνικών δικτύων, θα επηρεαστεί από τη γλώσσα και τον πολιτισμό. Ένα άλλο παράδειγμα είναι ότι η ανάλυση συναισθήματος είναι ήδη ένα σημαντικό μέρος του ελέγχου γεγονότων και το ίδιο το μοντέλο πρόβλεψης συναισθήματος μπορεί να έχει πολλές προκαταλήψεις και στερεότυπα στην εκπαίδευση.Η εκπαίδευση μοντέλων τεχνητής νοημοσύνης είναι μια διαδικασία εισόδου και εξόδου των σκουπιδιών. Είναι δύσκολο να λυθούν τα προβλήματα που προκαλούνται από τα δεδομένα εκπαίδευσης.Μπορούμε να πούμε ότι ο έλεγχος δεδομένων χωρίς ανθρώπινη συμμετοχή είναι ανύπαρκτος (αναξιόπιστος).

Δεσποινίς Α:Ποιες είναι οι νέες προκλήσεις;

Serge: Το ψευδές περιεχόμενο που δημιουργείται από γλωσσικά μοντέλα είναι μια νέα πρόκληση που αντιμετωπίζουμε. Οι προηγούμενοι ψεύτικοι λογαριασμοί μέσων κοινωνικής δικτύωσης είχαν συχνά πολύ απλά μοτίβα για να ακολουθήσουν. Αλλά με τα μοντέλα GPT και δημιουργίας εικόνων, οι δημιουργοί ψεύτικων λογαριασμών μπορούν να δημιουργήσουν πιο περίπλοκα και φυσικά πλαστά προφίλ και στη συνέχεια ψεύτικους λογαριασμούς στα μέσα κοινωνικής δικτύωσης που φαίνονται αληθινοί. Αυτοί οι λογαριασμοί δεν εντοπίζονται εύκολα από τα παραδοσιακά μοντέλα αναγνώρισης ψεύτικων λογαριασμών. Αυτά τα παραγωγικά μοντέλα AI φέρνουν επίσης αντίστοιχες προκλήσεις στις παραδοσιακές εργασίες ελέγχου γεγονότων. επομένως,Το Generative AI δημιουργεί και προσδιορίζει ψευδείς πληροφορίες, που θα είναι το παιχνίδι γάτας και ποντικιού αυτής της εποχής.

4. AI μέλλον

Αυτοί (OpenAI) μπορεί να μην γνωρίζουν ακόμη τα σχέδιά μας.

Δεσποινίς Α:Φαίνεται ότι αυτές οι προκλήσεις δεν μπορούν να επιλυθούν απλώς μέσω μοντέλων, αλλά ενδέχεται να φτάσουν στη διάσταση της συνεργασίας μεταξύ της τεχνητής νοημοσύνης και των ανθρώπων.εσείςφαίνομαιΠάντα να ανακαλύπτετε νέα προβλήματα σε νέες διαστάσεις και στη συνέχεια να τα επιλύετε από μια απλή προοπτική.

Ραβδωτό μάλλινο ύφασμα:Ναί.Η νέα μας ιδέα μπορεί να συγκριθεί με τη Wikipedia. Κάποτε οι άνθρωποι πίστευαν ότι ο ίδιος κόμβος Wikipedia χρειαζόταν μόνο σελίδες σε διαφορετικές γλώσσες με την ίδια σημασιολογία. Η πραγματικότητα είναι ότι δεν είναι μόνο η γλώσσα που διαφέρει.

Γλώσσα, πολιτισμός, αξίες, παραδόσεις, όλοι οι παράγοντες αναμειγνύονται σε διαφορετικές σελίδες του ίδιου λήμματος. Η ατομική ενέργεια και τα ορυκτά καύσιμα, για παράδειγμα, καλύπτονται πολύ διαφορετικά σε διαφορετικές γλώσσες και σε διαφορετικά μέρη του κόσμου. Αυτό μας υπενθυμίζει λοιπόν ότι το σύστημα AI που προσπαθούμε να δημιουργήσουμε δεν είναι αμιγώς αυτοματοποιημένο, ούτε αυτόνομο μοντέλο. Αυτό είναι ένα σύστημα που εμπλέκεται από τον άνθρωπο, που σημαίνει ότι χρειάζεστε πολλές διαφορετικές ανθρώπινες κοινότητες σε όλο τον κόσμο για να επισημάνουν και να οργανώσουν τα δεδομένα και να λάβουν υπόψη όλα τα διαφορετικά κομμάτια.Αυτό είναι ένα μεγάλο και βαθύ πρόβλημα γιατί η προκατάληψη θα υπάρχει πάντα.

Δεσποινίς Α:Έτσι, όπως η MSCOCO, η οργάνωση των δεδομένων όσο το δυνατόν πιο ολοκληρωμένων και δίκαιων είναι η ίδια η φιλοδοξία αυτής της έρευνας.

Ραβδωτό μάλλινο ύφασμα: Αυτή είναι η διαδικασία οργάνωσης όλων των διαφορετικών τύπων κοινοτήτων. Σε διάφορα μέρη του κόσμου, άνθρωποι διαφορετικών ηλικιών μελετούν διαφορετικές ειδικότητες όπως λογοτεχνία, ιστορία, επιστήμη κ.λπ., και κάθε τομέας έχει τη δική του ιστορία. Για να είναι επιτυχής η έρευνα που περιγράφω,Χρειαζόμαστε πολλούς σχολιασμούς που να κατανοούν διάφορα θέματαΜε。 Δεν χρειάζεται να είναι ειδικοί, αλλά πρέπει να έχουν κάποια γνώση του περιεχομένου που θα επισημανθεί, όπως η πυρηνική ενέργεια, η επιχειρηματικότητα ή το κρυπτονόμισμα, για να γνωρίζουν τις ομοιότητες σε αφηγήσεις και θέματα. Επομένως, η μεγαλύτερη πρόκληση είναι η οργάνωση της κοινότητας και όχι οι βασικές εγκαταστάσεις τεχνητής νοημοσύνης και αποθήκευσης.

Δεσποινίς Α:Ο Sam Altman ή ο Yann Lecun σχολίασαν τη σκέψη σας;

Σερζ: Μπορεί να μην ξέρουν ακόμα τα σχέδιά μας.

Δεσποινίς Α:Φαίνεται να παρακολουθώ τα πρώτα στάδια μιας πρωτοβουλίας:Ανακαλύψτε προβλήματα σε υψηλότερη διάσταση και βρείτε το πιο άμεσο σημείο εισόδου.

Serge: Εάν αναπτύξουμε αυτήν την υποδομή για τον εντοπισμό προβλημάτων, όπως πολλές τεχνολογίες, θα μπορούσε να χρησιμοποιηθεί για καλό ή κακό.Επομένως, σε αντίθεση με πολλά εμπορικά AI,Προσπαθούμε να αναπτύξουμε ανοιχτά, διαφανή και ελεγχόμενα συστήματα διαχείρισης . Επομένως, θα έχουμε μια εντελώς διαφανή βάση γνώσεων και οι χρήστες μπορούν να δουν το ιστορικό επεξεργασίας των δεδομένων, συμπεριλαμβανομένου του πότε συμπεριλήφθηκαν τα δεδομένα και από ποιους σχολιαστές σχολιάστηκαν.

Δεσποινίς Α:Πώς να διασφαλίσετε την ακρίβεια και την αντικειμενικότητα των δεδομένων;

Ραβδωτό μάλλινο ύφασμα:Η απλή απάντηση είναι,δεν μπορούμε να εγγυηθούμε。

Αλλά το καλύτερο που μπορούμε να κάνουμε είναι να δημιουργήσουμε ένα σύστημα που προσελκύει δεκάδες χιλιάδες άτομα που ενδιαφέρονται για διαφορετικούς τομείς συζήτησης για να σχολιάσουν το σύστημα. Το να έχουμε όσο το δυνατόν περισσότερους σχολιαστές μπορεί να μας βοηθήσει να φέρουμε στατιστική αντικειμενικότητα. Η Wikipedia έχει επίσης μηχανισμούς σχεδιασμένους για διαφάνεια και υπευθυνότητα, και θα κάνουμε το ίδιο.

Δεσποινίς Α:Πώς θα επηρεάσει αυτή η έρευνα τους φορείς χάραξης πολιτικής, τους εκπαιδευτικούς και τους τεχνολόγους;

Σερζ: Σκεφτείτε αυτό που κάνουμε ως συμπλήρωμα του λογικού ή πραγματικού συλλογισμού.

Ας υποθέσουμε ότι μια εταιρεία θέλει να βελτιώσει τη διαφορετικότητα, την ισότητα και τη συμπερίληψή της. Έτσι, το διοικητικό τους συμβούλιο πραγματοποίησε συνεδρίαση για να συζητήσει την πρόσληψη περισσότερων γυναικών ή μειονοτήτων. Αυτός ο τύπος συζήτησης είναι κοινός σε πολλές εταιρείες και σε ένα πανεπιστήμιο, για παράδειγμα, μπορεί να μην υπάρχουν πολλές γυναίκες που σπουδάζουν ηλεκτρολόγος μηχανικός και το τμήμα θέλει να λάβει μέτρα για να το αλλάξει αυτό. Σε αυτές τις συναντήσεις, μπορεί να υπάρξει πολλή συζήτηση που δεν υποστηρίζεται από γνώσεις ή πληροφορίες.

Μερικοί άνθρωποι εκφράζουν προκατειλημμένες απόψεις ότι οι γυναίκες δεν είναι καλές στα μαθηματικά. Αυτό που χρειάζεται είναι ένα σύστημα που μπορεί να βοηθήσει τον πρόεδρο του τμήματος, τον Διευθύνοντα Σύμβουλο ή τον δάσκαλο που χρειάζεται να ηγηθεί αυτών των συζητήσεων και μπορούν να εξαγάγουν ένα σύνολο αφηγήσεων από το σύστημα για να δομήσουν τη συζήτηση. Επιπλέον, μόλις το σύστημα αρχίσει να λειτουργεί, ευρετηριάζει και αναλύει τις δηλώσεις σε προϋπάρχουσες αφηγήσεις. Με αυτόν τον τρόπο, ένας Διευθύνων Σύμβουλος, ένας δάσκαλος ή ένας συντονιστής συσκέψεων μπορεί να αποφύγει συνομιλίες χαμηλής ποιότητας ή σύγχυσης, να έχει μια αποτελεσματική δομή και σύστημα ταξινόμησης, να καθοδηγεί τις συζητήσεις και να αποτρέψει περιττές συνομιλίες.

Δεσποινίς Α:Για τη μελλοντική αφήγηση των μέσων κοινωνικής δικτύωσης και ανάλυση ζητημάτων, ποιες πιστεύετε ότι είναι οι πιθανές κατευθύνσεις έρευνας για την τεχνολογική ανάπτυξη;

Ραβδωτό μάλλινο ύφασμα: Διαφορετικοί τομείς έχουν τις δικές τους μοναδικές προκλήσεις. Μερικά από αυτά είναι κλασικά προβλήματα, όπως η επεξεργασία μεγάλων ποσοτήτων δεδομένων και ο τρόπος επισήμανσης τους, ο μετριασμός της μεροληψίας κ.λπ. Αλλά αντιμετωπίζουμε επίσης μεγάλες προκλήσεις όσον αφορά την οπτικοποίηση.

Απλώς αναφέραμε τις διαφορές που αντιμετωπίζουν διαφορετικές γλώσσες και πολιτισμοί. Κάθε συγκεκριμένο θέμα έχει πολλές διαφορετικές προοπτικές και διαφορετικοί σχολιαστές θα παρέχουν διαφορετικούς σχολιασμούς λόγω των δικών τους προκαταλήψεων. Από την άποψη της θεωρίας της πληροφορίας, η προσπάθεια συμπίεσης αυτών των διαφορετικών λογαριασμών μπορεί να οδηγήσει σε απώλεια ή καταστροφή πληροφοριών. Αυτού του είδους οι ερωτήσεις θα προκύψουν σε όλο το έργο και θα τις συναντάμε συχνά.

Δεσποινίς Α: Κατά τη γνώμη σας, ποιες τελευταίες εξελίξεις στην οπτική τεχνολογία θα έχουν βαθύ αντίκτυπο στο μέλλον;

Ραβδωτό μάλλινο ύφασμα: Τώρα όλο και περισσότεροι ερευνητές αρχίζουν να δίνουν προσοχή σε πολυτροπικά δεδομένα, επεξεργάζοντας πολλαπλούς τύπους δεδομένων, όπως εικόνες, κείμενο και ήχο ταυτόχρονα σε ένα μοντέλο . Πιστεύω ότι αυτή η τάση θα συνεχιστεί και οι μελλοντικοί νεοεισερχόμενοι στον τομέα της τεχνητής νοημοσύνης θα θεωρήσουν πιο φυσικό να κατακτήσουν πολλές επαγγελματικές δεξιότητες ταυτόχρονα παρά να εμβαθύνουν σε έναν τομέα μόνο, όπως η επεξεργασία φυσικής γλώσσας ή η όραση υπολογιστή.

Προσωπικά, πιστεύω ότι αν και κάποιοι ισχυρίζονται ότι η τεχνητή νοημοσύνη θα αντικαταστήσει πλήρως τους γιατρούς, αυτή η δήλωση είναι υπερβολική. Αλλά είμαι πεπεισμένος ότι σε τομείς όπως η ακτινολογία, η δερματολογία και η ιστοπαθολογία, τα συστήματα που υποστηρίζονται από την τεχνητή νοημοσύνη θα γίνουν ευρέως διαδεδομένα και θα ωφελήσουν όλους.

Όσον αφορά τα αυτοοδηγούμενα αυτοκίνητα, ενώ στο παρελθόν υπήρξαν προβλέψεις ότι η πρόοδος στην τεχνολογία όρασης και την τεχνητή νοημοσύνη θα επιτρέψει την ευρεία υιοθέτηση αυτοοδηγούμενων αυτοκινήτων, νομίζω ότι αυτό είναι απίθανο να συμβεί. Εκτός και αν η κυβέρνηση λάβει μέτρα για να περιορίσει τα συμβατικά αυτοκίνητα να κινούνται σε συγκεκριμένες λωρίδες ή να τα απαγορεύσει εντελώς, είναι πολύ απίθανο τα αυτόνομα αυτοκίνητα να γίνουν ο κανόνας στις Ηνωμένες Πολιτείες.

Δεσποινίς Α : Μου αρέσει το χαρτί σου. Οι σκέψεις μου είναι παρόμοιες.Η τεχνολογική ανάπτυξη ξεκλειδώνει ταυτόχρονα νέες γνωστικές διαστάσεις Η πιο πολύτιμη μεθοδολογία είναι αυτή που έχει ένα μινιμαλιστικό σημείο εισόδου, αλλά μπορεί να εκπέμπει τη συνολική κατάσταση.

Ραβδωτό μάλλινο ύφασμα:Ποια μεθοδολογία σας ενδιαφέρει περισσότερο;

Δεσποινίς Α:Δώστε ένα μικρό παράδειγμα.Στο μονοπάτι της παραποιησιμότητας, η επιστήμη θα ξεκινήσει την επαναληπτική οδό της άρνησης της άρνησης...επιστρέφοντας στη δομή της επιστημονικής επανάστασης που όλοι γνωρίζουμε.

*Ο Hang Zhou συνέβαλε επίσης σε αυτό το άρθρο.

Δεδομένου ότι αυτό το άρθρο περιλαμβάνει ακαδημαϊκές συζητήσεις, ακολουθεί μια σύντομη εισαγωγή στον συγγραφέα:

Ο Zhang Yijia, ιδρυτής της Jiazi Guangnian, αποφοίτησε από τη Σχολή Μαθηματικών Επιστημών του Πανεπιστημίου του Πεκίνου το 2013 και έλαβε διπλό πτυχίο στα οικονομικά από το Εθνικό Ινστιτούτο Ανάπτυξης, κέρδισε ένα χρυσό μετάλλιο στην Κινεζική Μαθηματική Ολυμπιάδα και επιλέχθηκε για το Εθνική ομάδα εκπαίδευσης, τα ερευνητικά του ενδιαφέροντα είναι τα οικονομικά μαθηματικά και η θεωρία παιγνίων, και υπηρετεί ως ταυτόχρονα Διευθυντής της Σχολής Μαθηματικών Επιστημών του Πανεπιστημίου του Πεκίνου.
Ο Zhou Hang, ο υπεύθυνος του Jiazi Brain, αποφοίτησε από τη Σχολή Μαθηματικών Επιστημών του Πανεπιστημίου του Πεκίνου το 2019, η ερευνητική του κατεύθυνση είναι η αραιή βελτιστοποίηση και η μη κυρτή βελτιστοποίηση.

*Βιβλιογραφικές αναφορές

Αναζήτηση δομής σε μη παραποιήσιμες αξιώσεις.pdf
978-3-319-10602-1_48.pdf "Microsoft COCO: Common Objects in Context" Σύνολο δεδομένων MSCOCO: Το έγγραφο με τις περισσότερες αναφορές του Serge.
Thomas Samuel Kuhn "Η δομή των επιστημονικών επαναστάσεων"

|Δεσποινίς ΑΑνασκόπηση σειράς διαλόγου|

Νέα

Η συνομιλία της δεσποινίδας Α με τον Σερζ Μπελόνγκι: Να σας δώσει μια παραποιήσιμη «σφαίρα» |

Εισαγωγή

τα στοιχεία επικοινωνίας μου