Ma Yi από το Πανεπιστήμιο του Χονγκ Κονγκ: Τα μεγάλα μοντέλα χωρίς θεωρία για μεγάλο χρονικό διάστημα είναι σαν τυφλοί που προσπαθούν να πιάσουν έναν ελέφαντα μεγάλα ονόματα που συγκεντρώνονται για να μιλήσουν για το επόμενο βήμα του AI

Πανεπιστήμιο Οικονομικών και Οικονομικών του Χονγκ Κονγκ Ma Yi: Τα μεγάλα μοντέλα χωρίς θεωρία για μεγάλο χρονικό διάστημα είναι σαν τους τυφλούς που νιώθουν τον ελέφαντα να συγκεντρώνονται για να συζητήσουν το επόμενο βήμα της τεχνητής νοημοσύνης

2024-07-24

Ο δυτικός άνεμος προέρχεται από τον ναό Aofei
Qubits | Δημόσιος λογαριασμός QbitAI

"Θέλω να σας κάνω μια ερώτηση. Είτε είστε μαθητής στην Ακαδημία Qiuzhen είτε στην Κατηγορία Junior του Qiu Chengtong, αν δεν γνωρίζετε αυτήν την ερώτηση, τότε δεν πρέπει να είστε σε αυτήν την τάξη!"

Στο Διεθνές Συνέδριο Βασικής Επιστήμης του 2024 "Βασική Επιστήμη και Φόρουμ Τεχνητής Νοημοσύνης", Lenovo Group CTO και Ξένος Ακαδημαϊκός της Ευρωπαϊκής Ακαδημίας ΕπιστημώνΡούι ΓιονγκΜόλις βγήκαν αυτά τα λόγια, όλο το κοινό έγινε λίγο νευρικό.

Στη συνέχεια, όμως, η ερώτηση που έκανε ήταν:Ποιο είναι μεγαλύτερο, 13.11 ή 13.8;

Γεια σας παιδιά, απλώς ρωτήστε ποιος δεν ξέρει ακόμα αυτό το αστείο.

Αυτή τη φορά, όμως, δεν πρόκειται για την κοροϊδία της παραφροσύνης του μοντέλου. Αρκετοί εμπειρογνώμονες τεχνητής νοημοσύνης από τον ακαδημαϊκό χώρο και τη βιομηχανία ανέλυσαν μια σειρά προβλημάτων όπως η «ψευδαίσθηση» του μοντέλου και εξήγαγαν τις απόψεις τους σχετικά με «Ποιο είναι το επόμενο βήμα για την τεχνητή νοημοσύνη;«η γνώμη του.

Συνοπτικά, περιλαμβάνει τα ακόλουθα σημεία:

Το επόμενο βήμα στην ανάπτυξη μεγάλων μοντέλων είναι να απομακρυνθούμε από το παράδειγμα αναζήτησης «χωρίς αφηρημένη ικανότητα, χωρίς υποκειμενική αξία και χωρίς συναισθηματική γνώση».
Οι εμπορικές εφαρμογές υστερούν σε σχέση με την αύξηση της κλίμακας του ίδιου του μοντέλου και υπάρχει έλλειψη ενός σούπερ προϊόντος που μπορεί πραγματικά να αντανακλά την αξία της επένδυσης.
Κάτω από τον περιορισμό της ψευδαίσθησης, το επόμενο βήμα μπορεί να είναι να σκεφτούμε πώς να επεκτείνουμε τη γενίκευση και τη διαδραστικότητα του μοντέλου Η πολυτροπικότητα είναι μια επιλογή.
Είναι πολύ σημαντικό θέμα για τον ευφυή πράκτορα να γνωρίζει τα όρια των δυνατοτήτων του.

Κοσμήτορας της Σχολής Δεδομένων του Πανεπιστημίου του Χονγκ Κονγκ και Πρόεδρος του Τμήματος Επιστήμης Υπολογιστών του Πανεπιστημίου του Χονγκ ΚονγκΕπιτρέψτε μουΚατά τη διάρκεια της συζήτησης, τέθηκε ακόμη και ένα ερωτηματικό σχετικά με την «τεχνητή νοημοσύνη» που χρησιμοποιείται επί του παρόντος από το mainstream:

Η ανάπτυξη της τεχνολογίας τεχνητής νοημοσύνης έχει συσσωρεύσει μεγάλη εμπειρία, μερικές από τις οποίες μπορούμε να εξηγήσουμε, και μερικές από τις οποίες δεν μπορούμε να εξηγήσουμε Τώρα είναι η στιγμή που η θεωρία είναι πολύ απαραίτητη. Στην πραγματικότητα, μπορούμε να πούμε ότι η υποτροφία μας δεν έχει κάνει πολλές ανακαλύψεις τα τελευταία δέκα περίπου χρόνια.

Ας ρίξουμε μια ματιά σε αυτά που είπαν συγκεκριμένα οι μεγάλοι.

Ποια είναι η φύση της νοημοσύνης;

Στη σκηνή, Κοσμήτορας της Σχολής Δεδομένων του Πανεπιστημίου του Χονγκ Κονγκ και Πρόεδρος του Τμήματος Επιστήμης Υπολογιστών του Πανεπιστημίου του Χονγκ ΚονγκΕπιτρέψτε μου, εκφώνησε κεντρική ομιλία με τίτλο «Επιστροφή στα βασικά της θεωρίας και εξερευνώντας την ουσία της νοημοσύνης».

Οι απόψεις που εκφράζονται συμπίπτουν με τα θέματα που συζητήθηκαν στη στρογγυλή τράπεζα.

Το θέμα της ομιλίας του καθηγητή Ma Yi ήταν «Επιστροφή στις βασικές αρχές της θεωρίας και εξερευνώντας την ουσία της νοημοσύνης».

Πρώτα μίλησε για την εξέλιξη της ζωής και της ευφυΐας.

Κατά την προσωπική του άποψη, η ζωή είναι ο φορέας της νοημοσύνης και η ικανότητα της ζωής να παράγει και να εξελίσσεται είναι αποτέλεσμα της δράσης ευφυών μηχανισμών. και,Ο κόσμος δεν είναι τυχαίος, είναι προβλέψιμος, στη διαδικασία της συνεχούς εξέλιξης, η ζωή μαθαίνει πιο προβλέψιμες γνώσεις για τον κόσμο.

Η επιβίωση του ισχυρότερου μέσω της φυσικής επιλογής είναι ένα είδος ανατροφοδότησης από τη νοημοσύνη, παρόμοια με την τρέχουσα έννοια της ενισχυτικής μάθησης.

Από τα φυτά στα ζώα, τα ερπετά, τα πουλιά και μετά στους ανθρώπους, η ζωή βελτιώνει τη νοημοσύνη της, αλλά υπάρχει ένα φαινόμενο που φαίνεται να είναι ότι όσο πιο έξυπνη είναι η ζωή, τόσο περισσότερο θα ακολουθεί τους γονείς της μετά τη γέννησή της. Γιατί;

Ο καθηγητής Ma Yi εξήγησε περαιτέρω: Επειδή τα γονίδια δεν είναι αρκετά, πρέπει να μάθουμε κάποιες ικανότητες. Όσο ισχυρότερη είναι η ικανότητα μάθησης, τόσο περισσότερα πράγματα πρέπει να μάθουμε Αυτή είναι μια πιο προηγμένη μορφή νοημοσύνης.

Αν μαθαίνουμε με ατομικό τρόπο, δεν είναι αρκετά γρήγορο ή αρκετά καλό, έτσι οι άνθρωποι επινόησαν τη γλώσσα και η ανθρώπινη νοημοσύνη έγινε μια μορφή ομαδικής νοημοσύνης.

Παρήχθη ομαδική νοημοσύνη και επήλθε μια ποιοτική αλλαγή.Όχι μόνο μαθαίνουμε αυτά τα προβλέψιμα φαινόμενα από εμπειρικές παρατηρήσεις.αφηρημένη λογική σκέψη, το ονομάζουμε ανθρώπινη νοημοσύνη, ή αργότερα τεχνητή νοημοσύνη.

Στη συνέχεια, μίλησε για την προέλευση της νοημοσύνης μηχανών.

Από τη δεκαετία του 1940, οι άνθρωποι άρχισαν να προσπαθούν να αφήσουν τις μηχανές να προσομοιώσουν τη νοημοσύνη των ζωντανών όντων, ειδικά των ζώων.

Οι άνθρωποι άρχισαν να μοντελοποιούν νευρώνες και να εξερευνούν «πώς λειτουργεί η αντίληψη του εγκεφάλου, όλοι ανακάλυψαν ότι η προσομοίωση των νευρικών συστημάτων των ζώων θα έπρεπε να κατασκευαστεί από τεχνητά νευρωνικά δίκτυα και η έρευνα έγινε όλο και πιο περίπλοκη».

Αυτό το θέμα δεν εξελίχθηκε ομαλά Μετά από δύο κρύους χειμώνες, όλοι ανακάλυψαν ορισμένους περιορισμούς των νευρωνικών δικτύων και μερικοί άνθρωποι εξακολουθούν να επιμένουν στην επίλυση αυτών των προκλήσεων.

Στη συνέχεια, αναπτύχθηκε η υπολογιστική ισχύς δεδομένων και κατέστη δυνατή η εκπαίδευση νευρωνικών δικτύων άρχισαν να αναπτύσσονται βαθύτερα και βαθύτερα δίκτυα και η απόδοσή τους γινόταν όλο και καλύτερη.

Υπάρχει όμως το μεγαλύτερο πρόβλημα:Αυτά τα δίκτυα έχουν σχεδιαστεί εμπειρικά Είναι ένα μαύρο κουτί και το κουτί γίνεται όλο και μεγαλύτερο.

Τι συμβαίνει με ένα μαύρο κουτί; Από τεχνική άποψη, ο σχεδιασμός εμπειρίας είναι επίσης δυνατός και η δοκιμή και το σφάλμα μπορούν να συνεχιστούν. Ωστόσο, το κόστος είναι υψηλό, ο κύκλος είναι μακρύς και τα αποτελέσματα είναι δύσκολο να ελεγχθούν. επίσης:

Όσο υπάρχει ένα σημαντικό φαινόμενο στον κόσμο που κανείς δεν μπορεί να το εξηγήσει, και πολλοί άνθρωποι παραμένουν στο σκοτάδι, αυτό θα δημιουργεί πανικό.

Λοιπόν, πώς να ανοίξετε το μαύρο κουτί; Ο καθηγητής Ma Yi πρότεινε να επιστρέψουμε στην αρχική ερώτηση: Γιατί να σπουδάσω; Γιατί μπορεί να εξελιχθεί η ζωή;

Τόνισε ιδιαίτερα ότι πρέπει να μιλήσουμε για πράγματα που μπορούν να πραγματοποιηθούν μέσω υπολογισμού:

Μην μιλάτε για τίποτα αφηρημένο. Αυτή είναι η συμβουλή μου προς όλους.

Τι να μάθουμε λοιπόν;

Ο καθηγητής Ma Yi πιστεύει ότι πρέπει να μάθουμε πράγματα που να είναι προβλέψιμα και τακτικά.

Για παράδειγμα, αν κρατήσετε ένα στυλό στο χέρι σας και αφήσετε να φύγει, όλοι ξέρουν τι θα συμβεί, και αν κινηθείτε γρήγορα, μπορείτε να το πιάσετε. Αυτό ήταν γνωστό πριν από τον Νεύτωνα. Οι άνθρωποι και τα ζώα φαίνεται να έχουν καλά μοντέλα του εξωτερικού κόσμου.

Και στα μαθηματικά,Οι προβλέψιμες πληροφορίες αντικατοπτρίζονται ομοιόμορφα στη δομή χαμηλών διαστάσεων των δεδομένων σε χώρο υψηλών διαστάσεων.。

Ποιος είναι λοιπόν ο ενοποιημένος μηχανισμός υπολογισμού; Ο καθηγητής Ma Yi έδωσε την απάντηση:Παρόμοια πράγματα μαζεύονται και διαφορετικά είδη απωθούν το ένα το άλλο., η ουσία είναι τόσο απλή.

Πώς να μετρήσετε αν κάτι γίνεται καλά; Γιατί συμπίεση;

Έδωσε ένα παράδειγμα, όπως φαίνεται παρακάτω. Για παράδειγμα, ο κόσμος είναι τυχαίος, τίποτα δεν είναι γνωστό, και όλα μπορούν να συμβούν Αν χρησιμοποιούνται μπλε μπάλες, όλες οι μπλε μπάλες μπορούν να συμβούν στο επόμενο δευτερόλεπτο.

Αλλά αν θέλετε να θυμάστε ότι συνέβη ένα από αυτά τα πράγματα, πρέπει να κωδικοποιήσετε ολόκληρο τον χώρο, να του δώσετε έναν κωδικό και μόνο η περιοχή με τις πράσινες μπάλες μπορεί να συμβεί και οι μπλε μπάλες θα είναι πολύ λιγότερες.

Όταν ξέρουμε ότι οι περιοχές όπου θα συμβούν τα πράγματα γίνονται όλο και μικρότερες, γνωρίζουμε όλο και λιγότερα για τον κόσμο.

Για να βρούμε καλύτερα αυτές τις περιοχές πρασίνου, πρέπει να τις οργανώσουμε καλύτερα στον εγκέφαλο. Ο εγκέφαλός μας λοιπόν οργανώνει αυτό το φαινόμενο και αυτή τη δομή χαμηλών διαστάσεων.

Πώς μπορεί να επιτευχθεί αυτό υπολογιστικά;

Ο καθηγητής Ma Yi είπε ότι όλα τα βαθιά δίκτυα το κάνουν αυτό. Όπως το Transformer τώρα, το κάνει αυτό τμηματοποιώντας τις εικόνες και ταξινομώντας τις.

Στην πραγματικότητα, κάθε στρώμα του νευρωνικού δικτύου είναιΣυμπίεση δεδομένων。

Τα μαθηματικά παίζουν πολύ σημαντικό ρόλο σε αυτό. Πρέπει να μετρήσετε αυστηρά τι θέλετε να βελτιστοποιήσετε και πώς να το βελτιστοποιήσετε τρέχουσα εμπειρία. Πολλοί από τους χειριστές είναι πολύ παρόμοιοι.
Είτε το Transformer, είτε το ResNet, είτε το CNN, όλα το κάνουν αυτό με διαφορετικούς τρόπους. Και μπορεί να εξηγηθεί πλήρως στατιστικά και γεωμετρικά τι κάνει.

αλλάΗ ίδια η βέλτιστη λύση βελτιστοποίησης μπορεί να μην είναι η σωστή λύση , σημαντικές πληροφορίες μπορεί να χαθούν κατά τη διάρκεια της διαδικασίας συμπίεσης Πώς να αποδείξετε ότι οι υπάρχουσες διαστάσεις πληροφοριών είναι καλές; Πώς να αποδείξετε ότι δεν θα εμφανιστούν παραισθήσεις;

Επιστροφή στα βασικά της μάθησης, γιατί πρέπει να θυμόμαστε αυτά τα πράγματα;Είναι να είσαι εκείΟ εγκέφαλος προσομοιώνει τον φυσικό κόσμο,Για καλύτερη απόδοση σε φυσικό χώροπρολέγω。

Αργότερα ο Ma Yi ανέφερε την έννοια της ευθυγράμμισης:

Οπότε η ευθυγράμμιση δεν αφορά την ευθυγράμμιση με τους ανθρώπους, η ευθυγράμμιση είναι αυτήΤο μοντέλο ευθυγραμμίζεται με αυτό που έχει μάθει.

Η εκμάθηση μιας αυτόματης κωδικοποίησης από μέσα προς τα έξω δεν είναι αρκετή. Πώς μαθαίνουν τα ζώα στη φύση το φυσικό μοντέλο του εξωτερικού κόσμου.

Χρησιμοποιείτε συνεχώς τις δικές σας παρατηρήσεις για να προβλέψετε τον εξωτερικό κόσμο, αρκεί να είναι συνεπής με τις παρατηρήσειςσταθερός , αυτό είναι. Αυτό περιλαμβάνει την έννοια του κλειστού βρόχου.

Όσο υπάρχουν ζωντανά πλάσματα, όσο υπάρχουν έξυπνα πλάσματα, είναι όλα κλειστού βρόχου.

Ο καθηγητής Ma Yi τόνισε στη συνέχεια ότι απέχουμε ακόμα πολύ από την αληθινή νοημοσύνη.

Τι είναι η νοημοσύνη; Οι άνθρωποι συχνά συγχέουν τη γνώση και την ευφυΐα Έχει ένα σύστημα νοημοσύνη αν έχει γνώση; Ένα ευφυές σύστημα πρέπει να έχει τη βάση για αυτοβελτίωση και αύξηση της δικής του γνώσης.

Τέλος, ο καθηγητής Ma Yi κατέληξε.

Κοιτάζοντας πίσω στην ιστορία, στη δεκαετία του 1940 όλοι ήθελαν μηχανές να μιμούνται τα ζώα, αλλά στη δεκαετία του 1950 ο Turing πρότεινε ένα πράγμα - εάν οι μηχανές μπορούν να σκέφτονται όπως οι άνθρωποι. Στη διάσκεψη του Dartmouth το 1956, μια ομάδα ανθρώπων κάθισε μαζί και σκοπός τους ήταν να κάνουν κάτιΗ μοναδική νοημοσύνη που ξεχωρίζει τον άνθρωπο από τα ζώα：Αφηρημένη ικανότητα, συμβολικές πράξεις, λογικός συλλογισμός, αιτιολογική ανάλυσηΠερίμενε.

Αυτό όρισαν να κάνει η τεχνητή νοημοσύνη το 1956. Αργότερα, αυτοί οι άνθρωποι κέρδισαν βασικά το βραβείο Turing. Αν λοιπόν θέλετε να κερδίσετε το βραβείο Turing στο μέλλον, θα πρέπει να επιλέξετε να ακολουθήσετε το πλήθος ή να κάνετε κάτι μοναδικό...

Κοιτάζοντας πίσω, τι κάναμε τα τελευταία 10 χρόνια;

Η τρέχουσα «τεχνητή νοημοσύνη» κάνει αναγνώριση εικόνων, δημιουργία εικόνων, δημιουργία κειμένου, συμπίεση και αποθορυβοποίηση και ενίσχυση της μάθησης.Βασικά αυτό που κάνουμε είναι σε επίπεδο ζώων., συμπεριλαμβανομένης της πρόβλεψης του επόμενου διακριτικού και της επόμενης εικόνας καρέ.

Δεν είναι ότι δεν είχαμε ανθρώπους να το δουλέψουν αργότερα. Αλλά όχι ένα mainstream μεγάλο μοντέλο.

Εξήγησε περαιτέρω ότι εάν ρίξουν αρκετά χρήματα και ρίξουν αρκετά δεδομένα, η απόδοση πολλών μοντέλων θα συνεχίσει να αναπτύσσεται, αλλά αν δεν υπάρχει θεωρία για μεγάλο χρονικό διάστημα, θα προκύψουν προβλήματα, όπως ένας τυφλός που προσπαθεί να καταλάβει έξω ένας ελέφαντας.

Ο καθηγητής Ma Yi είπε ότι η κοινή χρήση του προσωπικού του ταξιδιού ελπίζει να δώσει κάποια έμπνευση στους νέους.

Μόλις έχουμε τις αρχές, μπορούμε να σχεδιάσουμε με τόλμη και δεν χρειάζεται πλέον να περιμένουμε την επόμενη γενιά να εφεύρει ένα φαινομενικά καλό δίκτυο και μπορούμε να το χρησιμοποιήσουμε μαζί. Πού είναι λοιπόν οι ευκαιρίες σας;

Ας ρίξουμε μια ματιά στο πώς απάντησαν άλλοι ειδικοί της τεχνητής νοημοσύνης στην ερώτηση «Ποιο είναι το επόμενο βήμα για την τεχνητή νοημοσύνη;» στο φόρουμ στρογγυλής τραπέζης.

Ποιο είναι το επόμενο βήμα για την τεχνητή νοημοσύνη;

Τα μεγάλα μοντέλα απαιτούν αλλαγές «παραδείγματος».

Μέλος της Βασιλικής Ακαδημίας Μηχανικής, της Ευρωπαϊκής Ακαδημίας Επιστημών, της Ακαδημίας Μηχανικών Επιστημών του Χονγκ Κονγκ και Επικεφαλής Αντιπρόεδρος του Πανεπιστημίου Επιστήμης και Τεχνολογίας του Χονγκ ΚονγκGuo YikeΝομίζω ότι βρισκόμαστε σε μια πολύ ενδιαφέρουσα στιγμή αυτή τη στιγμή -

Επειδή ο νόμος κλιμάκωσης είναι ευρέως αποδεκτός, ο πόλεμος των εκατό μοντέλων έχει γίνει σταδιακά πόλεμος πόρων.Φαίνεται ότι πρέπει να κάνουμε μόνο δύο πράγματα, αφού έχουμε το μοντέλο Transformer, αυτό που πρέπει να λυθεί είναιΜεγάλη υπολογιστική ισχύςκαιΜεγάλα δεδομέναΤο πρόβλημα.

Ωστόσο, κατά τη γνώμη του, αυτό δεν ισχύει.Η τρέχουσα ανάπτυξη της τεχνητής νοημοσύνης εξακολουθεί να αντιμετωπίζει πολλά προβλήματαΠεριορισμένη υπολογιστική ισχύς και άπειρη ζήτησηΤο πρόβλημα.

Σε αυτή την περίπτωση, πώς πρέπει να φτιάξουμε ένα μεγάλο μοντέλο; Ο ακαδημαϊκός Guo μοιράστηκε τις σκέψεις του μέσα από ορισμένες πρακτικές.

Πρώτα απ 'όλα, ο ακαδημαϊκός Guo ανέφερε τη χρήση πιο οικονομικού MOE υπό τον περιορισμό της υπολογιστικής ισχύος.μοντέλο μεικτού ειδικούΜπορεί επίσης να επιτύχει πολύ καλά αποτελέσματα.

Επιπλέον, το πώς να βελτιώνετε συνεχώς ένα μοντέλο με νέα δεδομένα μετά την εκπαίδευση, ώστε να μπορεί να θυμάται τι πρέπει να θυμάται, να ξεχνά τι πρέπει να ξεχνά και να μπορεί να θυμάται πράγματα που έχουν ξεχαστεί όταν χρειάζεται, είναι επίσης μια δύσκολη ερώτηση.

Ο ακαδημαϊκός Guo διαφωνεί με ορισμένους ισχυρισμούς στον κλάδο ότι "τα δεδομένα έχουν εξαντληθεί, απλώς το μοντέλο έχει συμπιεστεί και τα συμπιεσμένα δεδομένα μπορούν να αναδημιουργηθούν σε νέα δεδομένα", δηλαδή χρησιμοποιώντας γενετικά. μοντέλα για τη δημιουργία δεδομένων.

Στη συνέχεια, δεν χρειάζεται να μαθαίνονται όλα τα μοντέλα από την αρχήενσωμάτωση γνώσης στο βασικό μοντέλο. Υπάρχει πολλή δουλειά να γίνει και σε αυτόν τον τομέα.

Εκτός από την υπολογιστική ισχύ, υπάρχει ένα άλλο πρόβλημα με τον αλγόριθμο:Η καλλιέργεια της νοημοσύνης των μηχανών και η ίδια η ανθρώπινη νοημοσύνη έχει δύο πολικότητες。

Ο ακαδημαϊκός Guo πιστεύει ότι όταν εκπαιδεύετε μεγάλα μοντέλα, το πιο σημαντικό ζήτημα δεν είναι μπροστά, αλλά πίσω.

Όπως φαίνεται στο παρακάτω σχήμα, η εξελικτική πορεία του μεγάλου μοντέλου είναι από αυτομάθηση > έμμεση γνώση > αξίες > κοινή λογική, ενώ η διαδρομή καλλιέργειας της ανθρώπινης εκπαίδευσης είναι αντίθετη.

Εξαιτίας αυτού, ο ακαδημαϊκός Guo πιστεύει ότι πρέπει να βγούμε από το σημερινό παράδειγμα αναζήτησης μεγάλων μοντέλων με «χωρίς αφηρημένη ικανότητα, χωρίς υποκειμενική αξία και χωρίς συναισθηματική γνώση».

Όλοι γνωρίζουμε ότι η ανθρώπινη γλώσσα δεν είναι μόνο περιεχόμενο, όχι μόνο πληροφορίες, αλλά και η ανθρώπινη φύση και η ενέργεια της πληροφορίας. Αυτή είναι μια σημαντική κατεύθυνση για τη μελλοντική μας έρευνα.

Συνοψίζοντας, όσον αφορά το επόμενο βήμα για την τεχνητή νοημοσύνη, ο ακαδημαϊκός Guo πιστεύει ότι υπάρχουν τρία στάδια ανάπτυξης:

Το πρώτο στάδιο βασίζεται στην αυθεντικότητα στάδιο Μόνο όταν έχει αξίες μπορεί να καταλάβει τι είναι καινοτομία και μόνο με καινοτομία μπορεί να δημιουργήσει.

Όταν πρόκειται για τη δημιουργία αυτού του μοντέλου, η λεγόμενη ψευδαίσθηση δεν είναι πρόβλημα, επειδή η ψευδαίσθηση είναι πρόβλημα μόνο στο μοντέλο του παραδείγματος. Το να γράφεις ένα μυθιστόρημα πρέπει να είναι μια ψευδαίσθηση, δεν μπορείς να γράψεις ένα μυθιστόρημα απαιτεί Υπάρχει μια αλλαγή παραδείγματος.

Η ανάπτυξη μεγάλων μοντέλων στερείται ένα «σούπερ προϊόν»

Αντιπρόεδρος του JD.com, επίκουρος καθηγητής και διδακτορικός επόπτης στο Πανεπιστήμιο της ΟυάσιγκτονΑυτός XiaodongΠιστεύεται ότι η τεχνητή νοημοσύνη θα αντιμετωπίσει τρία προβλήματα στο επόμενο βήμα.

Καταρχάς, πιστεύει ότι κατά μία έννοια, η ανάπτυξη μεγάλων μοντέλων έχει εισέλθει σε μια περίοδο οροπεδίου.

Λόγω των περιορισμών στα δεδομένα και την υπολογιστική ισχύ, εάν οι βελτιώσεις βασίζονται απλώς στην κλίμακα, μπορεί να επιτευχθεί το ανώτατο όριο και οι υπολογιστικοί πόροι θα γίνονται όλο και πιο βαρύ φορτίο. Εάν ακολουθηθεί ο τελευταίος πόλεμος τιμών (τιμής), είναι πολύ πιθανό τα οικονομικά οφέλη που δημιουργούνται από τα μεγάλα μοντέλα να μην μπορούν να καλύψουν ούτε τον λογαριασμό του ρεύματος, επομένως είναι φυσικά μη βιώσιμο.

Δεύτερον, ο καθηγητής He πιστεύει ότι ολόκληρη η εμπορική εφαρμογή υστερεί σε σχέση με την ανάπτυξη του ίδιου του μοντέλου, μεσοπρόθεσμα και μακροπρόθεσμα, αυτό θα γίνει τελικά πρόβλημα.

Ειδικά όταν βλέπουμε μια τέτοια μεγάλη κλίμακα, δεν είναι πλέον απλώς ένα επιστημονικό πρόβλημα, θα γίνει επίσης ένα πρόβλημα μηχανικής. Τότε πρέπει να τεθεί ένα ερώτημα: η κοινωνική αξία που φέρνει.

Από αυτό, ο καθηγητής He πιστεύει ότι επί του παρόντοςΈλλειψη σούπερ εφαρμογής και σούπερ προϊόντος, μπορεί πραγματικά να αντικατοπτρίζει την αξία της επένδυσης.

Η τρίτη ερώτηση είναι μια σχετικά συγκεκριμένη ερώτηση, δηλαδήψευδαίσθηση μεγάλου μοντέλου。

Αν θέλουμε να χτίσουμε ένα κτίριο βιομηχανίας AI πάνω από μεγάλα μοντέλα, πρέπει να έχουμε εξαιρετικά υψηλές απαιτήσεις για τη βασική ψευδαίσθηση του μεγάλου μοντέλου. Εάν το ποσοστό σφάλματος του βασικού μεγάλου μοντέλου είναι πολύ υψηλό, είναι δύσκολο να φανταστεί κανείς ότι μπορούν να επικαλυφθούν περισσότερες εμπορικές εφαρμογές.
Οι σοβαρές βιομηχανικές εφαρμογές πρέπει να λύσουν την ψευδαίσθηση.

Ο καθηγητής He πιστεύει ότι κάτω από τον περιορισμό της ψευδαίσθησης, το επόμενο βήμα μπορεί να είναι να σκεφτούμε πώς να επεκτείνουμε τη γενίκευση και τη διαδραστικότητα του μοντέλου, καιπολυτροπικόΕίναι μια αναπόφευκτη επιλογή.

Τα μεγάλα μοντέλα δεν γνωρίζουν τα «όρια δυνατοτήτων»

CTO του Lenovo Group, ξένος ακαδημαϊκός της Ευρωπαϊκής Ακαδημίας ΕπιστημώνΡούι ΓιονγκΑπό βιομηχανική άποψη, έδωσε τις απόψεις του για το επόμενο βήμα της AI.

Είπε ότι από βιομηχανική άποψη, αυτό που είναι πιο σημαντικό είναι πώς εφαρμόζεται το μοντέλο. Όσον αφορά την εφαρμογή, ο Δρ Rui Yong μίλησε κυρίως για δύο σημεία:

Δεν αρκεί να έχουμε ένα μεγάλο μοντέλο, πρέπει να το αναπτύξουμεμέσο
Δεν αρκεί να έχετε ένα μεγάλο μοντέλο μέτρησης cloud, πρέπει να έχετε έναυβριδικό πλαίσιο

Συγκεκριμένα, ο Δρ Rui Yong απαρίθμησε αρχικά κάποιες μελέτες και επεσήμανε ότι οι περιορισμοί των μεγάλων μοντέλων γίνονται όλο και πιο εμφανείς. Για παράδειγμα, η ερώτηση "Ποιο είναι μεγαλύτερο, 13,8 ή 13,11" που αναφέρθηκε στην αρχή, δείχνει ότι το μοντέλο δεν κατανοεί πραγματικά το πρόβλημα.

Κατά τη γνώμη του, τα τρέχοντα μεγάλα μοντέλα συνδέουν μόνο τις τεράστιες κατακερματισμένες πληροφορίες που φαίνονται στον σημασιολογικό χώρο υψηλών διαστάσεων ανάπτυξη ευφυών πρακτόρων.

Ο Δρ Rui Yong τόνισε ιδιαίτερα το μεγάλο μοντέλοΌριο ικανότηταςερώτηση.

Τα σημερινά μεγάλα μοντέλα στην πραγματικότητα δεν γνωρίζουν πού βρίσκονται τα όρια των δυνατοτήτων τους.
Γιατί τα μεγάλα μοντέλα έχουν παραισθήσεις και γιατί λένε σοβαρές βλακείες; Στην πραγματικότητα, δεν προσπαθεί να μας εξαπατήσει, αλλά δεν ξέρει τι ξέρει ή τι δεν ξέρει τις δυνατότητές του.

Επιπλέον, ο Δρ Rui Yong είπε ότι η νοημοσύνη από μόνη της δεν αρκεί για την εφαρμογή της τεχνητής νοημοσύνης και ότι μεγάλα δημόσια μοντέλα στο cloud πρέπει να ιδιωτικοποιηθούν για τις επιχειρήσεις. Με γνώμονα τα δεδομένα και τη γνώση αποτελούν ένα υβριδικό μοντέλο τεχνητής νοημοσύνης και τα μικρά μοντέλα είναι επίσης πολύ χρήσιμα σε πολλές περιπτώσεις.

Δεν θα είναι ένα μεγάλο μοντέλο που βασίζεται αποκλειστικά σε δοκιμές στο cloud, αλλά ένα μεγάλο μοντέλο που συνδυάζει συσκευή, edge και cloud.

Νέα

Ποια είναι η φύση της νοημοσύνης;

Ποιο είναι το επόμενο βήμα για την τεχνητή νοημοσύνη;

Τα μεγάλα μοντέλα απαιτούν αλλαγές «παραδείγματος».

Η ανάπτυξη μεγάλων μοντέλων στερείται ένα «σούπερ προϊόν»

Τα μεγάλα μοντέλα δεν γνωρίζουν τα «όρια δυνατοτήτων»

Εισαγωγή

τα στοιχεία επικοινωνίας μου