τα στοιχεία επικοινωνίας μου
ταχυδρομείο[email protected]
2024-09-28
한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina
στις 28 σεπτεμβρίου, πραγματοποιήθηκε το 4ο φόρουμ «young scientists 50²» στο southern university of science and technology, shen xiangyang, ξένος ακαδημαϊκός της εθνικής ακαδημίας μηχανικής, έδωσε μια κεντρική ομιλία με θέμα «πώς πρέπει να σκεφτόμαστε τα μεγάλα μοντέλα στην περιοχή. εποχή γενικής τεχνητής νοημοσύνης» και έδωσε τις 10 σκέψεις του για μεγάλα μοντέλα.
ακολουθούν τα συγκεκριμένα περιεχόμενα των 10 σκέψεών του:
1. η υπολογιστική ισχύς είναι το κατώφλι: οι απαιτήσεις υπολογιστικής ισχύος μεγάλων μοντέλων ήταν τεράστιες τα τελευταία 10 χρόνια. σήμερα θα φτιάξουμε ένα μεγάλο μοντέλο τεχνητής νοημοσύνης, λέγοντας ότι το κολλημένο βλάπτει τα συναισθήματα και η έλλειψη μπλοκαρίσματος σημαίνει ότι δεν υπάρχουν συναισθήματα.
2. δεδομένα για δεδομένα: εάν βγει το gpt-5, ο όγκος δεδομένων μπορεί να φτάσει τους 200 τ. αλλά δεν υπάρχουν τόσο καλά δεδομένα στο διαδίκτυο μετά τον καθαρισμό, τα 20t μπορεί να είναι σχεδόν τα μέγιστα. θα χρειαστούν.
3. το επόμενο κεφάλαιο του μεγάλου μοντέλου: υπάρχει πολλή πολυτροπική επιστημονική έρευνα που πρέπει να γίνει. πιστεύω ότι μια πολύ σημαντική κατεύθυνση είναι η ενοποίηση της πολυτροπικής κατανόησης και παραγωγής.
4. μετατόπιση παραδείγματος της τεχνητής νοημοσύνης: μετά την εμφάνιση του o1, η αρχική ιδέα της προεκπαίδευσης gpt άλλαξε στη σημερινή ανεξάρτητη μαθησιακή διαδρομή, η οποία είναι μια διαδικασία ενίσχυσης της μάθησης στο βήμα συμπερασμάτων και συνεχούς αυτομάθησης. η όλη διαδικασία μοιάζει πολύ με τον τρόπο με τον οποίο οι άνθρωποι σκέφτονται και αναλύουν προβλήματα, και απαιτεί επίσης μεγάλη υπολογιστική ισχύ.
5. τα μεγάλα μοντέλα σαρώνουν χιλιάδες βιομηχανίες: στο κύμα κατασκευής μεγάλων μοντέλων στην κίνα, όλο και περισσότερα μεγάλα μοντέλα χρησιμοποιούνται σε βιομηχανίες. αυτή η τάση είναι σίγουρα έτσι, και το ποσοστό των γενικών μεγάλων μοντέλων θα γίνεται όλο και μικρότερο στο μέλλον.
6. ai agent, από το όραμα στην υλοποίηση: η σούπερ εφαρμογή υπάρχει από την αρχή αυτή η σούπερ εφαρμογή είναι ένας σούπερ βοηθός και ένας σούπερ πράκτορας.
7. ανοιχτός κώδικας έναντι κλειστού κώδικα: νομίζω ότι το meta's llama δεν είναι παραδοσιακό ανοιχτό κώδικα, αλλά απλώς ανοίγει ένα μοντέλο και δεν σας δίνει τον αρχικό κώδικα και τα δεδομένα το μυαλό να κατανοήσει πραγματικά τη μεγάλη εικόνα του συστήματος κλειστού κώδικα.
8. δώστε προσοχή στη διακυβέρνηση της τεχνητής νοημοσύνης: η τεχνητή νοημοσύνη έχει τεράστιο αντίκτυπο σε χιλιάδες βιομηχανίες και σε ολόκληρη την κοινωνία, και όλοι πρέπει να την αντιμετωπίσουν μαζί.
9. επανεξετάστε τη σχέση ανθρώπου-υπολογιστή: μόνο με την αληθινή κατανόηση της αλληλεπίδρασης ανθρώπου-υπολογιστή μπορούμε να γίνουμε ένας πραγματικά πολύτιμος ηγέτης από εμπορική άποψη για κάθε γενιά επιχειρήσεων υψηλής τεχνολογίας. μίλα τώραopenaiη προσθήκη της microsoft σημαίνει ότι αυτή η εποχή είναι ακόμα πολύ νωρίς. είναι ακόμα μπροστά, αλλά υπάρχει ακόμα πολύς χώρος για φαντασία στο μέλλον.
10. η φύση της νοημοσύνης: αν και τα μεγάλα μοντέλα έχουν συγκλονίσει τους πάντες, δεν έχουμε καμία θεωρία για τα μεγάλα μοντέλα και τη βαθιά μάθηση. γιαόλα συμπεριλαμβάνονταιη εμφάνιση του προβλήματος συζητήθηκε μόνο αλλά δεν εξηγήθηκε με σαφήνεια.
το "young scientists 50² forum" είναι η ετήσια ακαδημαϊκή συνάντηση του new cornerstone science foundation, που διοργανώνεται απόsouthern university of science and technology, η tencent sustainable social value division και το new cornerstone science foundation από κοινού. το new cornerstone science foundation ιδρύθηκε και λειτουργεί ανεξάρτητα από την tencent με επένδυση 10 δισεκατομμυρίων γιουάν σε διάστημα 10 ετών. είναι σήμερα ένα από τα μεγαλύτερα επιστημονικά ιδρύματα κοινωνικής πρόνοιας στην κίνα συγκεκριμένες δράσεις για τη χρηματοδότηση της επιστήμης.
το "young scientists 50² forum" είναι μια διεπιστημονική πλατφόρμα ακαδημαϊκών ανταλλαγών για τους νικητές του "scientific exploration award". το «βραβείο επιστημονικής εξερεύνησης» ιδρύθηκε το 2018. είναι ένα βραβείο κοινωνικής πρόνοιας που χρηματοδοτείται από το new cornerstone science foundation και διευθύνεται από επιστήμονες. κάθε νικητής θα μοιραστεί τη μεγαλη ιδεα του και την τελευταία του εξερεύνηση στο φόρουμ τουλάχιστον μία φορά κατά τη διάρκεια της πενταετούς περιόδου χρηματοδότησης. «50²» σημαίνει ότι οι 50 νέοι επιστήμονες που επιλέγονται από το «βραβείο επιστημονικής εξερεύνησης» κάθε χρόνο θα έχουν σημαντικό αντίκτυπο στις επιστημονικές και τεχνολογικές ανακαλύψεις τα επόμενα 50 χρόνια.
τα παρακάτω είναιshen xiangyangτο πλήρες κείμενο της ομιλίας σε αυτό το φόρουμ:
είμαι πολύ χαρούμενος που έχω την ευκαιρία να μοιραστώ μαζί σας μερικές πρόσφατες γνώσεις και εμπειρίες στην τεχνητή νοημοσύνη στο shenzhen σήμερα.
θα συνεχίσωyao qizhiτο θέμα της τεχνητής νοημοσύνης για το οποίο μίλησε ο κ. sir, επιτρέψτε μου να σας πω για μερικά από τα πράγματα που κάνουμε τώρα στην εποχή των μεγάλων μοντέλων, ειδικά κοιτάζοντας αυτό το θέμα από την οπτική της τεχνολογικής ολοκλήρωσης και της βιομηχανικής μετάβασης.
στην πραγματικότητα, δεν είναι μόνο η σημασία της τεχνολογικής ανάπτυξης στην εποχή της τεχνητής νοημοσύνης. ολόκληρη η ιστορία της ανθρώπινης ανάπτυξης είναι μια ιστορία τεχνολογικής ανάπτυξης. δεν θα κοιτάξουμε πίσω σε πράγματα όπως το τρύπημα ξύλου για να φτιάξουμε φωτιά ή η εφεύρεση του τροχού – θα δούμε απλώς τις πολλές αξιοσημείωτες ανακαλύψεις στη φυσική τα τελευταία 100 χρόνια και τις ανακαλύψεις στην τεχνητή νοημοσύνη και την επιστήμη των υπολογιστών τα τελευταία 70 χρόνια μπορούμε να δούμε ότι υπήρξαν πολλές εξελίξεις.
το θέμα για το οποίο μιλάμε σήμερα είναι η τεχνητή νοημοσύνη και τα μεγάλα μοντέλα. τα τελευταία χρόνια, όλοι πρέπει να έχουν συγκλονιστεί από τη νέα εμπειρία τεχνητής νοημοσύνης βήμα-βήμα.
θέλω να μιλήσω για τρία παραδείγματα: το πρώτο είναι η δημιουργία κειμένου από κείμενο, το δεύτερο είναι η δημιουργία εικόνων από κείμενο και το τρίτο είναι η δημιουργία βίντεο από κείμενο. μόλις τώρα μιλήσαμε για ένα σύστημα τεχνητής νοημοσύνης όπως το chatgpt, το οποίο δεν είναι διαθέσιμο μόνο διεθνώς αλλά και εγχώρια. για παράδειγμα, πριν έρθω εδώ για να δώσω μια ομιλία σήμερα, ζήτησα από το chatgpt ότι επρόκειτο να συμμετάσχω στο φόρουμ young scientists 50² της tencent και να κάνω μια ομιλία για τι είδους θέματα πρέπει να μιλήσω με βάση το ιστορικό μου; μπορεί να νομίζετε ότι είναι λίγο αστείο, αλλά στην πραγματικότητα, αφού το χρησιμοποιήσετε, πιστεύετε ότι είναι πολύ καλό.
όλοι είναι εξοικειωμένοι με το chatgpt πριν από δύο χρόνια, το openai κυκλοφόρησε ένα σύστημα που δημιουργεί γραφήματα. πριν από επτά μήνες, κυκλοφόρησε το you give it a message και δημιουργεί ένα βίντεο υψηλής ευκρίνειας 60 δευτερολέπτων για εσάς, όπως αυτό το βίντεο με το περπάτημα στους δρόμους του τόκιο. (δεν θα εμφανίσω το βίντεο λόγω χρονικών περιορισμών.)
επιτρέψτε μου να σας δώσω ένα παράδειγμα αυτού του βικεντιανού διαγράμματος. είμαι ειδικευμένος στα γραφικά υπολογιστών και νομίζω ότι έχω καλή αίσθηση του αν μια φωτογραφία είναι καλή ή κακή. πριν από δύο χρόνια, αυτή η φωτογραφία ήταν η πρώτη φωτογραφία που δημιουργήθηκε από τεχνητή νοημοσύνη στην ανθρώπινη ιστορία και εμφανίστηκε στο εξώφυλλο ενός αμερικανικού περιοδικού μόδας ("cosmopolitan"). ένας ψηφιακός καλλιτέχνης στο σαν φρανσίσκο χρησιμοποίησε το σύστημα openai και έκανε μια ερώτηση, η οποία κατέληξε σε αυτό το αποτέλεσμα. αυτό το απόσπασμα είναι: στον απέραντο έναστρο ουρανό, μια γυναίκα αστροναύτης έτρεξε στον άρη και περπάτησε προς έναν ευρυγώνιο φακό. δεν έχω τόσο πολύ καλλιτεχνικό ταλέντο, αλλά σοκαρίστηκα όταν είδα αυτή την εικόνα, νομίζω ότι θα συμφωνήσετε μαζί μου όταν η τεχνητή νοημοσύνη σχεδιάζει μια τέτοια εικόνα. αυτή λοιπόν η τεχνητή νοημοσύνη έχει φτάσει σε ένα πολύ ευφυές επίπεδο.
σήμερα έχουμε τέτοιες εκπληκτικές τεχνολογίες και ακόμη και τέτοια εκπληκτικά προϊόντα. εργαζόμαστε επίσης πολύ σκληρά στο σπίτι και χτίζουμε μοντέλα μεγάλης κλίμακας, εργαζόμαστε σε όλες τις πτυχές. μόλις τώρα, ο ακαδημαϊκός yao μίλησε επίσης για πολλές από τις τελευταίες εργασίες του πανεπιστημίου tsinghua. θέλω λοιπόν να μοιραστώ μαζί σας πώς πρέπει να σκεφτόμαστε τα μεγάλα μοντέλα στην εποχή της γενικής τεχνητής νοημοσύνης.
η πρώτη σκέψη είναι ότι η υπολογιστική ισχύς είναι το κατώφλι.
το πιο σημαντικό πράγμα για τη σημερινή γενική τεχνητή νοημοσύνη, τα μεγάλα μοντέλα και τη βαθιά μάθηση είναι η συνολική ανάπτυξη της υπολογιστικής ισχύος της τεχνητής νοημοσύνης τα τελευταία χρόνια.
τα τελευταία 10 χρόνια, η υπολογιστική ισχύς που χρησιμοποιούν τα μεγάλα μοντέλα έχει αυξηθεί, αρχικά κατά έξι έως επτά φορές το χρόνο και αργότερα κατά περισσότερο από τέσσερις φορές το χρόνο. να σας κάνω μια ερώτηση τώρα, αν κάτι αυξάνεται τέσσερις φορές το χρόνο, πόσες φορές θα αυξάνεται σε 10 χρόνια; σκέψου το πρώτα, θα επανέλθω σε αυτό το θέμα αργότερα.
όλοι γνωρίζουν ότι η εταιρεία που επωφελείται περισσότερο από αυτό το κύμα ανάπτυξης τεχνητής νοημοσύνης είναιnvidia, οι αποστολές της nvidia αυξάνονται χρόνο με το χρόνο, η υπολογιστική της ισχύς αυξάνεται σταδιακά και η αγοραία αξία ολόκληρης της εταιρείας έχει γίνει μία από τις τρεις εταιρείες στον κόσμο (microsoft, apple, nvidia) με αγοραία αξία 3 τρισεκατομμυρίων δολαρίων ηπα. το πιο σημαντικό είναι λόγω της απαίτησης όλων για υπολογιστική ισχύ κάθε χρόνο. ο αριθμός των τσιπ της nvidia που αγοράστηκε το 2024 εξακολουθεί να αυξάνεται με ταχείς ρυθμούς οι απαιτήσεις δικτύου είναι πολύ υψηλές.
σήμερα, μιλάμε για υπολογιστική ισχύ και μεγάλα μοντέλα. δυστυχώς, όταν όλος ο όγκος των δεδομένων αυξάνεται, η αύξηση της υπολογιστικής ισχύος δεν είναι γραμμική, αλλά η αύξηση της υπολογιστικής ισχύος μοιάζει περισσότερο με τετραγωνική ανάπτυξη.
επειδή όταν το μοντέλο γίνεται μεγαλύτερο, η ποσότητα των δεδομένων πρέπει να αυξηθεί για να εκπαιδεύσει το μοντέλο, επομένως, σχετικά, μοιάζει περισσότερο με τετραγωνική ανάπτυξη. ως εκ τούτου, οι απαιτήσεις για υπολογιστική ισχύ ήταν τεράστιες τα τελευταία 10 χρόνια. λοιπόν, θα πω μόνο ένα πράγμα: σήμερα θα φτιάξω ένα μεγάλο μοντέλο τεχνητής νοημοσύνης, αν έχει κολλήσει, βλάπτει τα συναισθήματά σας.
μόλις σας έκανα μια ερώτηση, αν αυξάνεται 4 φορές κάθε χρόνο, πόσες φορές θα αυξάνεται σε 10 χρόνια; όσοι από εμάς μελετάμε υπολογιστές όλοι γνωρίζουμε ότι υπάρχει κάτι που ονομάζεται «νόμος του μουρ», που σημαίνει ότι η υπολογιστική ισχύς διπλασιάζεται κάθε 18 μήνες περίπου. γιατί η nvidia ξεπέρασε τώρα την intel; ένας πολύ σημαντικός λόγος είναι ότι ο ρυθμός ανάπτυξής του είναι διαφορετικός. αν διπλασιαστεί σε 18 μήνες, πιθανότατα θα αυξηθεί κατά 100 φορές σε 10 χρόνια, το οποίο είναι επίσης πολύ αξιοσημείωτο εάν αυξάνεται κατά 4 φορές κάθε χρόνο, θα είναι 1 εκατομμύριο φορές σε 10 χρόνια. αν το σκεφτείτε με αυτόν τον τρόπο, είναι κατανοητό ότι η αγοραία αξία της nvidia έχει αυξηθεί τόσο γρήγορα τα τελευταία 10 χρόνια.
η δεύτερη σκέψη αφορά τα δεδομένα.
η υπολογιστική ισχύς, οι αλγόριθμοι και τα δεδομένα είναι τρεις σημαντικοί παράγοντες για την τεχνητή νοημοσύνη. ανέφερα νωρίτερα ότι χρειαζόμαστε πολλά δεδομένα για να εκπαιδεύσουμε τη γενική τεχνητή νοημοσύνη. όταν κυκλοφόρησε το chatgpt3, ήταν ακόμα στο στάδιο της δημοσίευσης των εγγράφων, και ειπώθηκε ότι χρειαζόταν 2 τρισεκατομμύρια δεδομένα token μέχρι να βγει το gpt-4, θα ήταν περίπου 12t σήμερα υπολογίζεται ότι έχει ποσότητα που ξεπερνά τους 20τ. όποιος ενδιαφέρεται για την τεχνητή νοημοσύνη ξέρει ότι όλοι περίμεναν να βγει το gpt5 τόσο καιρό, αλλά δεν έχει βγει το gpt-5, η προσωπική μου κρίση μπορεί να είναι ότι ο όγκος των δεδομένων θα φτάσει τους 200 τ . κοιτάζοντας πίσω, δεν υπάρχουν και τόσο καλά δεδομένα στο διαδίκτυο περισσότερα πολυτροπικά δεδομένα, ακόμη και δεδομένα που έχουν συντεθεί τεχνητά.
ένα πολύ ενδιαφέρον πράγμα είναι ότι τα τελευταία τριάντα ή σαράντα χρόνια, όλοι μοιράζονταν τις πληροφορίες τους στο διαδίκτυο. στο παρελθόν, πιστεύαμε ότι εργαζόμασταν για μηχανές αναζήτησης χρόνια είναι για μια στιγμή όπως το chatgpt, ενσωμάτωσε τα πάντα και έμαθε ένα τέτοιο μοντέλο τεχνητής νοημοσύνης μέσω ισχυρής υπολογιστικής ισχύος.
τρίτη σκέψη, το επόμενο κεφάλαιο του μεγάλου μοντέλου.
έχετε δουλέψει μέχρι σήμερα, τι πρέπει να κάνετε μετά; το πρώτο είναι το γλωσσικό μοντέλο. αντιπροσωπευόμενη από το chatgpt, η υποκείμενη τεχνολογία του είναι η επεξεργασία φυσικής γλώσσας. αυτό πάνω στο οποίο εργάζονται όλοι σήμερα είναι ένα πολυτροπικό μοντέλο, που αντιπροσωπεύεται από το gpt-4, και πολλές από τις τεχνολογίες σε αυτό είναι η όραση υπολογιστή. προχωρώντας προς τα εμπρός, πρέπει να αναπτύξουμε ενσωματωμένη νοημοσύνη. ποιος είναι ο σκοπός της ενσωματωμένης νοημοσύνης; στην πραγματικότητα, πρέπει να φτιάξουμε ένα παγκόσμιο μοντέλο, ακόμα κι αν είναι πολυτροπικό, δεν υπάρχει υποκείμενο φυσικό μοντέλο, επομένως πρέπει να οικοδομήσουμε ένα τέτοιο παγκόσμιο μοντέλο. το παγκόσμιο μοντέλο σημαίνει ότι όχι μόνο πρέπει να διαβάσετε χιλιάδες βιβλία, αλλά και να ταξιδέψετε χιλιάδες μίλια για να τροφοδοτήσετε περισσότερες γνώσεις στον κόσμο πίσω στον εγκέφαλό σας. πρέπει λοιπόν να φτιάξουμε ρομπότ. νομίζω ότι η shenzhen θα πρέπει να αποφασίσει να κατασκευάσει ρομπότ και ενσωματωμένη νοημοσύνη. υπάρχει μια ειδική διαδρομή στα ρομπότ που ονομάζεται αυτόνομη οδήγηση είναι ένα ειδικό ρομπότ, αλλά οδηγεί σε μια δεδομένη διαδρομή.
τι να κάνουμε; πρέπει να γίνει πολλή πολυτροπική επιστημονική έρευνα και πιστεύω ότι μια πολύ σημαντική κατεύθυνση είναι η ενοποίηση της πολυτροπικής κατανόησης και παραγωγής. ακόμα κι αν κατασκευαστεί το sora, θα είναι ξεχωριστό. υπάρχει πολλή επιστημονική έρευνα που μπορούμε να κάνουμε σε αυτόν τον τομέα.
για να δώσω ένα παράδειγμα, αρκετοί από τους μαθητές μου έφτιαξαν μια μεγάλη εταιρεία μοντέλων, τη step stars, και η κατανόησή τους για την πολυτροπική συμπεριφορά ήταν πολύ καλή. εάν δείξετε μια εικόνα σε μια τεχνητή νοημοσύνη, γιατί η συμπεριφορά στην εικόνα ονομάζεται "άκυρη ικανότητα", η τεχνητή νοημοσύνη θα σας εξηγήσει ότι η εικόνα μοιάζει με ένα παιδί που κυλάει στο έδαφος, αλλά η μητέρα του είναι αδιάφορη και αυτή είναι κοιτάξτε τα κινητά τηλέφωνα και πιείτε ποτά, έτσι αυτή η δεξιότητα των παιδιών ονομάζεται άκυρη δεξιότητα. το ai γίνεται τώρα όλο και καλύτερο στην κατανόηση των γραφημάτων.
η τέταρτη σκέψη είναι η αλλαγή παραδείγματος της τεχνητής νοημοσύνης.
πριν από δύο εβδομάδες, το openai κυκλοφόρησε το τελευταίο του μοντέλο, o1. ανέφερα προηγουμένως ότι το gpt έχει αναπτυχθεί μετά το gpt4, το gpt5 δεν έχει κυκλοφορήσει όλοι σκέφτονται, αν είναι απλώς μια αύξηση στις παραμέτρους των μεγάλων μοντέλων. κανείς δεν ξέρει, δεν έχει κυκλοφορήσει ακόμα, και δεν έχουμε φτιάξει μεγαλύτερο μοντέλο στην κίνα.
τώρα όμως έχει προκύψει μια νέα διάσταση, η οποία δεν είναι να κάνουμε την προηγούμενη προ-εκπαίδευση (επέκταση), αλλά να κάνουμε την επέκταση όταν κάνουμε συμπέρασμα. έχει αλλάξει από την αρχική ιδέα του gpt στη σημερινή ανεξάρτητη μαθησιακή διαδρομή, η οποία είναι μια διαδικασία ενίσχυσης της μάθησης στο στάδιο της λογικής και της συνεχούς αυτομάθησης.
στο παρελθόν, κάναμε προ-εκπαίδευση, βασικά προβλέποντας ποια θα είναι η επόμενη λέξη και ποια θα είναι η επόμενη ένδειξη τώρα η νέα ιδέα είναι να φτιάξουμε ένα προσχέδιο και να προσπαθήσουμε να δούμε αν αυτός ο δρόμος είναι σωστός. ακριβώς όπως ο ανθρώπινος εγκέφαλος, υπάρχει ένα γρήγορο σύστημα και ένα αργό σύστημα στις ευκαιρίες στη διαδικασία βελτιστοποίησης της αλυσίδας σκέψης. μέχρι στιγμής, μόνο το openai έχει κυκλοφορήσει ένα τέτοιο σύστημα και ενθαρρύνω όλους να ρίξουν μια ματιά σε μερικά παραδείγματα εδώ.
το πιο σημαντικό είναι ότι η όλη διαδικασία μοιάζει πολύ με το πώς οι άνθρωποι σκέφτονται και αναλύουν τα προβλήματα, σχεδιάζουν, επαληθεύουν, διορθώνουν τα λάθη και ξεκινούν από την αρχή. για να γίνει αυτό απαιτεί επίσης μεγάλη υπολογιστική ισχύ.
η πέμπτη σκέψη είναι ότι τα μεγάλα μοντέλα σαρώνουν χιλιάδες βιομηχανίες.
όλες οι εταιρείες πρέπει να αντιμετωπίσουν τις ευκαιρίες που προσφέρουν τα μεγάλα μοντέλα, αλλά κάθε εταιρεία δεν χρειάζεται να φτιάξει ένα μεγάλο μοντέλο γενικής χρήσης μεγάλο μοντέλο το μοντέλο πρέπει να έχει τουλάχιστον 10.000 κάρτες.
για παράδειγμα, όταν κυκλοφόρησε το gpt4, ο συνολικός όγκος προπόνησής του ήταν 2×10^25 flops. με τόσο μεγάλο όγκο εκπαίδευσης, θα χρειαστεί ένας χρόνος για να τρέξετε 10.000 κάρτες a100 για να φτάσετε αυτό το ποσό, δεν θα υπάρχει πραγματικό μεγάλο μοντέλο. με το γενικό μεγάλο μοντέλο, μπορούμε να δημιουργήσουμε τα δικά μας μεγάλα μοντέλα του κλάδου σε αυτή τη βάση, όπως τα χρηματοοικονομικά και οι ασφάλειες ίσως οι χιλιοθερμίδες μπορούν να κάνουν πολύ καλά, και μπορούμε να κάνουμε κάποιες προσαρμογές σε αυτό. για μια επιχείρηση, έχετε τα δικά σας δεδομένα, συμπεριλαμβανομένων των εσωτερικών δεδομένων και των δεδομένων πελατών εάν αφαιρέσετε αυτά τα δεδομένα και χρησιμοποιήσετε δεκάδες ή εκατοντάδες κάρτες, μπορείτε να δημιουργήσετε ένα πολύ καλό μοντέλο για την επιχείρησή σας. έτσι δομείται στρώμα-στρώμα.
υπάρχει βέβαια και μια άλλη πολύ σημαντική διάσταση που μου αρέσει πολύ, που είναι το προσωπικό πρότυπο του μέλλοντος. σήμερα, χρησιμοποιήσαμε σταδιακά υπολογιστές και κινητά τηλέφωνα (τα δεδομένα έχουν συσσωρευτεί σε κάποιο βαθμό) και μας καταλαβαίνουμε όλο και περισσότερο δεδομένα, μπορεί να δημιουργήσει ένα δικό σας προσωπικό μοντέλο. αυτό είναι στο (προσωπικό) τμήμα του τερματικού και τα κινητά τηλέφωνα είναι ένα φυσικό πράγμα. όσον αφορά τον υπολογιστή, εταιρείες υπολογιστών όπως η microsoft και η lenovo προωθούν επίσης την έννοια του ai pc, επομένως υπάρχουν και τέτοιες ευκαιρίες.
στο κύμα κατασκευής μεγάλων μοντέλων στην κίνα, περιλαμβάνονται όλο και περισσότερα μεγάλα μοντέλα της βιομηχανίας. ακολουθεί ένα παράδειγμα, επειδή τα μεγάλα μοντέλα της κίνας πρέπει να εγκριθούν από τη διοίκηση κυβερνοχώρου της κίνας προτού τεθούν στο διαδίκτυο, μέχρι τα τέλη ιουλίου αυτού του έτους, συνολικά 197 μοντέλα στην κίνα είχαν εγκριθεί από τη διοίκηση κυβερνοχώρου της κίνας. τα οποία το 70% ήταν μεγάλα μοντέλα της βιομηχανίας και το 30% ήταν γενικά μεγάλα μοντέλα. αυτή η τάση είναι σίγουρα έτσι, και το ποσοστό των γενικών μεγάλων μοντέλων θα γίνεται όλο και μικρότερο στο μέλλον. για παράδειγμα, μπορούμε να φτιάξουμε ένα οικονομικό μοντέλο σε ένα γενικό μεγάλο μοντέλο αυτό είναι ένα μεγάλο μοντέλο που κατασκευάστηκε από μια εταιρεία στη σαγκάη για τους οικονομικούς πελάτες της. για παράδειγμα, όταν βγαίνει η οικονομική έκθεση της nvidia, μπορείτε να συνοψίσετε αμέσως τα κυριότερα σημεία και τα προβλήματά της.
η έκτη σκέψη είναι το ai agent, από το όραμα στην υλοποίηση.
σήμερα βλέπουμε ποιες είναι οι μεγαλύτερες σούπερ εφαρμογές μεγάλων μοντέλων και πού οι μεγαλύτερες ευκαιρίες. πολλοί άνθρωποι εξακολουθούν να προσπαθούν να βρουν μια σούπερ εφαρμογή. στην πραγματικότητα, η σούπερ εφαρμογή ήταν εκεί από την αρχή αυτή η σούπερ εφαρμογή είναι ένας σούπερ βοηθός, ένας σούπερ πράκτορας.
ο γκέιτς και εγώ δουλέψαμε μαζί στη microsoft για πολλά χρόνια και σκεφτόμασταν και οι δύο αυτό το θέμα. τι είναι τόσο δύσκολο σε αυτό; η δυσκολία έγκειται στην κατανόηση μιας ροής εργασίας όταν πραγματικά θέλετε να κάνετε μια χρήσιμη εργασία. αυτό που μπορώ να κάνω σήμερα είναι κάτι που έχει κάποιο βαθμό επιρροής, όπως το να είμαι υπηρεσία εξυπηρέτησης πελατών ή προσωπικός βοηθός. αλλά πολλές δουλειές δεν μπορούν να γίνουν; πρέπει να είσαι ψηφιακός εγκέφαλος. το μεγάλο μοντέλο παρακάτω είναι μόνο το πρώτο βήμα η ικανότητα του μεγάλου μοντέλου δεν είναι αρκετά ισχυρή για να σας βοηθήσει να κάνετε όλες τις παραπάνω εργασίες βήμα προς βήμα. επειδή θέλετε πραγματικά να φτιάξετε έναν τέτοιο πράκτορα, ώστε να μπορεί να κάνει πράγματα, πρέπει να κατανοήσει ποια είναι τα παρακάτω προβλήματα και κάθε τμήμα έχει τις αντίστοιχες δεξιότητες.
έχουμε ήδη κάνει πολλά καλά παραδείγματα χρησιμοποιώντας το σημερινό μοντέλο. για παράδειγμα, μπορείτε να είστε σύμβουλος υγείας, να μιλήσετε για την κατανόησή σας για τα καλλυντικά. στη συνέχεια, θα δείτε πολλές εφαρμογές σε αυτόν τον τομέα.
η έβδομη σκέψη είναι ανοιχτού κώδικα και κλειστού κώδικα.
στην ανάπτυξη της παγκόσμιας επιστήμης και τεχνολογίας τις τελευταίες δεκαετίες, ειδικά στην ανάπτυξη της επιστήμης και της τεχνολογίας της κίνας, δύο πράγματα είναι πολύ σημαντικά.
το πρώτο είναι η εμφάνιση του διαδικτύου με το διαδίκτυο, μπορείτε να βρείτε όλα τα έγγραφα και το υλικό στο διαδίκτυο.
το δεύτερο είναι το open source σας επιτρέπει να μειώσετε απότομα το χάσμα με τους ηγέτες όταν κάνετε εφαρμογές. αλλά ο ανοιχτός κώδικας δεν είναι το ίδιο με τον ανοιχτό κώδικα για μεγάλα μοντέλα και βάσεις δεδομένων, αν και οι δυνατότητες του ανοιχτού κώδικα είναι πλέον κοντά σε εκείνες του κλειστού κώδικα. υπάρχουν επίσης πολλές εταιρείες στην κίνα που κάνουν πράγματα ανοιχτού κώδικα το καλύτερο εργαλείο ανοιχτού κώδικα σήμερα είναι το llama 3.1 της meta, το οποίο ισχυρίζεται ότι είναι κοντά στο openai. δεν νομίζω ότι είναι παραδοσιακό ανοιχτό κώδικα. ανοίγει απλώς ένα μοντέλο και δεν σας δίνει τον αρχικό κώδικα και τα δεδομένα κατανοούν πραγματικά το κλείσιμο του συστήματος των μεγάλων μοντέλων.
η όγδοη σκέψη είναι να δοθεί προσοχή στη διακυβέρνηση της τεχνητής νοημοσύνης.
επειδή η τεχνητή νοημοσύνη αναπτύσσεται τόσο γρήγορα, ο κόσμος αποδίδει μεγάλη σημασία στην ασφάλεια της τεχνητής νοημοσύνης. επειδή ο αντίκτυπος αυτού του θέματος είναι τόσο μεγάλος η τεχνητή νοημοσύνη έχει τεράστιο αντίκτυπο σε χιλιάδες βιομηχανίες και σε ολόκληρη την κοινωνία.
η ένατη σκέψη είναι να ξανασκεφτούμε τη σχέση ανθρώπου-μηχανής.
μόλις παρουσίασα το κείμενο του vincent, τις φωτογραφίες του vincent και το βίντεο του vincent - πόσο από αυτά είναι η ευφυΐα του μηχανήματος και πόσο είναι το σοκ που μας προκαλεί η αλληλεπίδραση ανθρώπου-υπολογιστή;
πριν από περίπου 10 χρόνια, ο αρθρογράφος των "new york times" john markoff έγραψε ένα βιβλίο που μου αρέσει πολύ, το "machine of loving grace", το οποίο συνόψιζε τις δύο γραμμές της προηγούμενης ανάπτυξης της τεχνολογίας: η μία είναι η τεχνητή νοημοσύνη. intelligent augmentation), είναι η ενίσχυση της νοημοσύνης, που είναι η αλληλεπίδραση ανθρώπου-υπολογιστή. αφού οι υπολογιστές έγιναν διαθέσιμοι, βοήθησαν τους ανθρώπους να κάνουν πολλά πράγματα, και το παιχνίδι σκάκι είναι ένα παράδειγμα.
στην πραγματικότητα, μόνο με την αληθινή κατανόηση της αλληλεπίδρασης ανθρώπου-υπολογιστή μπορούμε να γίνουμε ηγέτες με πραγματική εμπορική αξία για κάθε γενιά επιχειρήσεων υψηλής τεχνολογίας. η σημερινή διεπαφή τεχνητής νοημοσύνης έχει γίνει πολύ ξεκάθαρη, η οποία είναι η διαδικασία του διαλόγου που εκπροσωπεί σήμερα το chatgpt. αλλά το να μιλάμε για το openai συν τη microsoft σημαίνει ότι αυτή η εποχή είναι ακόμα πολύ νωρίς, αλλά υπάρχει ακόμα πολύς χώρος για φαντασία στο μέλλον.
η δέκατη σκέψη είναι η φύση της νοημοσύνης.
αν και τα μεγάλα μοντέλα έχουν συγκλονίσει τους πάντες σήμερα, δεν έχουμε καμία θεωρία για τα μεγάλα μοντέλα και τη βαθιά μάθηση. σήμερα, θα θέλαμε να έχουμε οποιαδήποτε θεωρία που μας κάνει να νιώθουμε καλά. σε αντίθεση με τη φυσική, από φυσική άποψη, τα πάντα, από τον απέραντο έναστρο ουρανό μέχρι το μικρότερο κβάντο περιγράφονται από μερικούς όμορφους φυσικούς νόμους. σήμερα δεν υπάρχει τέτοια θεωρία για την τεχνητή νοημοσύνη, η οποία να μην έχει εξηγησιμότητα ή ευρωστία. το σημερινό πλαίσιο βαθιάς μάθησης δεν μπορεί να φτάσει στην πραγματική γενική τεχνητή νοημοσύνη.
όσον αφορά την εμφάνιση της τεχνητής νοημοσύνης, όλοι μίλησαν μόνο για αυτήν αλλά δεν το εξήγησαν ξεκάθαρα. γιατί εμφανίζεται η νοημοσύνη όταν το μοντέλο είναι αρκετά μεγάλο; γιατί το μοντέλο 70β μπορεί να αναδυθεί με ευφυΐα; δεν υπάρχει τέτοια αλήθεια. εργαζόμαστε λοιπόν πολύ σκληρά για αυτό το θέμα. το περασμένο καλοκαίρι οργάνωσα επίσης ένα σεμινάριο στο πανεπιστήμιο επιστήμης και τεχνολογίας του χονγκ κονγκ με θέμα "μαθηματική θεωρία για την αναδυόμενη νοημοσύνη", όταν συζητάμε για την αναδυόμενη νοημοσύνη, ορισμένες επιστημονικές και μαθηματικές αρχές πρέπει να εξηγηθούν με σαφήνεια και περισσότεροι άνθρωποι που είναι πρόθυμοι να το κάνουν. εξερευνήστε την ανάγκη συμμετοχής ελάτε, ειδικά με την εμφάνιση των έργων «science exploration award» και «new cornerstone researcher» της tencent, περισσότεροι νέοι επιστήμονες έχουν συμμετάσχει και έχουν περισσότερη αυτοπεποίθηση και πεποίθηση να μπουν βαθιά στο δύσκολο έργο. καινοτομίες για τη μελλοντική ανάπτυξη της τεχνητής νοημοσύνης.
συγχαρητήρια και πάλι σε όλους τους νικητές και τους νέους επιστήμονες. η ανάπτυξη της επιστήμης και της τεχνολογίας πρέπει να γίνεται από τους νέους από γενιά σε γενιά, ιδίως η τεχνητή νοημοσύνη. σας ευχαριστώ όλους και πάλι.