ερμηνεία｜xiao yanghua: τι αντίκτυπο θα έχει το μοντέλο o1 με διδακτορική μαθηματική ικανότητα;

2024-09-13

·η συλλογιστική ικανότητα σε επίπεδο ειδικού δεν είναι τακτική ερωτήσεων και απαντήσεων, απαιτεί ισχυρή ικανότητα σκέψης. η δυσκολία στην εκπαίδευση μεγάλων δυνατοτήτων συλλογιστικής μοντέλων είναι ότι ένας μεγάλος αριθμός διαδικασιών ανθρώπινης σκέψης δεν εκφράζεται ποτέ, επομένως τα δεδομένα για τη διαδικασία σκέψης είναι εξαιρετικά σπάνια.

·είναι όλο και πιο δύσκολο για τους ανθρώπους να βελτιώσουν την κατανόησή τους για την τεχνητή νοημοσύνη για να φτάσουν την ταχύτητα ανάπτυξης της τεχνητής νοημοσύνης ικανότητες, είναι πιθανό ότι θα υπάρξουν στιγμές που οι άνθρωποι δεν θα είναι σε θέση να ενεργοποιήσουν τις υπερδυνάμεις του επειδή είναι πέρα από το επίπεδο της ανθρώπινης γνώσης.

το νέο μοντέλο o1 που λανσαρίστηκε από την openai έχει ισχυρές δυνατότητες συλλογιστικής. οπτικός χάρτης της κίνας

στις 12 σεπτεμβρίου, τοπική ώρα, το openai κυκλοφόρησε μια νέα γενιά μοντέλων o1 σε σύγκριση με τα προηγούμενα μοντέλα, αυτό το μοντέλο έχει επιδείξει ισχυρές συλλογιστικές ικανότητες και αποδίδει εξίσου καλά με τους διδακτορικούς φοιτητές όταν χειρίζεται εργασίες αναφοράς στη φυσική, τη χημεία και τη βιολογία αυτή η δυνατότητα είναι κάτι που δεν είχαν τα προηγούμενα μοντέλα.

στις 13 σεπτεμβρίου, ο xiao yanghua, καθηγητής και διδακτορικός επόπτης στη σχολή επιστήμης και τεχνολογίας υπολογιστών στο πανεπιστήμιο fudan, και διευθυντής του βασικού εργαστηρίου της σαγκάης για την επιστήμη των δεδομένων, δήλωσε σε μια συνέντευξη στο the paper ότι η εμφάνιση του μοντέλου o1 σημαίνει ότι οι συλλογιστικές δυνατότητες των μεγάλων μοντέλων μπορούν να φτάσουν πλήρως σε επίπεδο ειδικών. μπορεί να θεωρηθεί ως μια πρόοδος ορόσημο στην τεχνητή νοημοσύνη, η οποία θα βελτιώσει σημαντικά την εφαρμογή των μοντέλων από την πλευρά της επιχείρησης.

ωστόσο, παραδέχτηκε ότι καθώς οι διανοητικές, αντιληπτικές και ορθολογικές ικανότητες του μοντέλου συνεχίζουν να βελτιώνονται, θα ξεπεράσει τις ανθρώπινες δυνατότητες η ανάπτυξη υπερβαίνει πλέον την ταχύτητα της ανθρώπινης κατανόησης και η διακυβέρνηση της τεχνητής νοημοσύνης θα είναι μια τεράστια πρόκληση», δήλωσε ο xiao yanghua.

καλός στο συλλογισμό σχετικά με σύνθετες εργασίες, απόδοση παρόμοια με αυτή ενός διδακτορικού.

ως πρώιμο μοντέλο, το νέο μοντέλο συμπερασμάτων o1 δεν διαθέτει ακόμη πλήρως τις λειτουργίες που χρησιμοποιούνται από το chatgpt, όπως η περιήγηση σε πληροφορίες δικτύου, η μεταφόρτωση αρχείων και εικόνων κ.λπ. ωστόσο, το openai είπε ότι αυτή είναι μια σημαντική βελτίωση για σύνθετες συλλογιστικές εργασίες και αντιπροσωπεύει ένα νέο επίπεδο δυνατοτήτων τεχνητής νοημοσύνης.

«μέσω της εκπαίδευσης, μαθαίνουν να βελτιώνουν τις διαδικασίες σκέψης τους, να δοκιμάζουν διαφορετικές στρατηγικές και να αναγνωρίζουν τα λάθη τους οι αλγόριθμοι μάθησης ενίσχυσης μεγάλης κλίμακας διδάσκουν στα μοντέλα πώς να σκέφτονται αποτελεσματικά χρησιμοποιώντας τις αλυσίδες σκέψης τους κατά τη διάρκεια της εκπαιδευτικής διαδικασίας και το μοντέλο o1 μπορεί να σκέφτεται πριν». ανταπόκριση στον χρήστη δημιουργήστε μια μακρά εσωτερική αλυσίδα σκέψεων. με περισσότερη ενισχυτική μάθηση και περισσότερο χρόνο για σκέψη, η απόδοση του o1 συνεχίζει να βελτιώνεται. μαθαίνει να αναλύει τα δύσκολα βήματα σε πιο απλά. όταν η τρέχουσα μέθοδος δεν λειτουργεί, δοκιμάζει μια διαφορετική προσέγγιση.

το νέο μοντέλο συμπερασμάτων o1 διαπρέπει στα μαθηματικά και τον προγραμματισμό, υπερέχοντας στην ακριβή παραγωγή και εντοπισμό σφαλμάτων σύνθετου κώδικα. το openai αξιολόγησε τη μαθηματική απόδοση του μοντέλου στο aime (american mathematics invitational competition). % (11,1/15). στις κατατακτήριες εξετάσεις της διεθνούς μαθηματικής ολυμπιάδας (imo), το gpt-4o μπόρεσε να λύσει σωστά μόνο το 13% των προβλημάτων, ενώ το νέο συλλογιστικό μοντέλο σημείωσε 83%.

το νέο μοντέλο μπορεί να κάνει λόγο για πολύπλοκες εργασίες, αποδίδοντας όπως ένας διδακτορικός φοιτητής σε εργασίες αναφοράς στη φυσική, τη χημεία και τη βιολογία. το openai έκανε δείκτες αναφοράς διαμαντιών gpqa στη χημεία, τη φυσική και τη βιολογία. για να συγκριθεί το μοντέλο με τους ανθρώπους, επιστρατεύτηκαν ειδικοί με διδακτορικό για να απαντήσουν σε ερωτήσεις από κοινού.

"διαπιστώσαμε ότι το o1 ξεπέρασε τις επιδόσεις των ειδικών στον άνθρωπο, και έγινε το πρώτο μοντέλο που το έκανε σε αυτό το σημείο αναφοράς. αυτά τα αποτελέσματα δεν σημαίνουν ότι το o1 είναι πιο ικανό από τα διδακτορικά σε όλες τις πτυχές, απλώς ότι το μοντέλο είναι καλύτερο στην επίλυση διδακτορικών αναγκών, λέει η openai οι ερευνητές της υγειονομικής περίθαλψης μπορούν να χρησιμοποιήσουν το o1 για να σχολιάσουν δεδομένα αλληλουχίας κελιών, οι φυσικοί μπορούν να χρησιμοποιήσουν το o1 για να δημιουργήσουν τους πολύπλοκους μαθηματικούς τύπους που απαιτούνται για την κβαντική οπτική και μπορεί να χρησιμοποιηθεί από προγραμματιστές σε όλα τα πεδία για τη δημιουργία και εκτέλεση ροών εργασίας πολλαπλών βημάτων.

οι δυνατότητες συλλογιστικής ορόσημο θα βελτιώσουν σημαντικά τα εφέ εφαρμογής

"το προηγούμενο μοντέλο μεγάλης γλώσσας έμοιαζε περισσότερο με φιλελεύθερο φοιτητή τεχνών και απέχει ακόμα από το επίπεδο ενός φοιτητή επιστήμης. αλλά η βασική ικανότητα της ανθρώπινης νοημοσύνης είναι η σκέψη και η σκέψη. η νέα σειρά συλλογιστικού μοντέλου openai o1 δείχνει τη διαδικασία της ανθρώπινης σκέψης. ο xiao yanghua είπε, η ουσία του νέου μοντέλου συμπερασμάτων o1 εξακολουθεί να είναι ένα μεγάλο γλωσσικό μοντέλο, αλλά αξιοποιεί πλήρως τις δυνατότητες του μεγάλου μοντέλου. στο παρελθόν, η ικανότητα παραγωγής μεγάλων μοντέλων καθοριζόταν από το corpus, το οποίο ήταν σαν "εξοικειωμένο με τριακόσια ποιήματα tang, και μπορείς να τα απαγγείλεις ακόμα κι αν δεν ξέρεις πώς να τα συνθέσεις." ωστόσο, η ικανότητα συλλογιστικής σε επίπεδο ειδικού δεν είναι μια τακτική ερωτήσεων και απαντήσεων, απαιτεί ισχυρή ικανότητα σκέψης. η δυσκολία στην εκπαίδευση μεγάλων δυνατοτήτων συλλογιστικής μοντέλων είναι ότι ένας μεγάλος αριθμός διαδικασιών ανθρώπινης σκέψης δεν εκφράζεται ποτέ, επομένως τα δεδομένα για τη διαδικασία σκέψης είναι εξαιρετικά σπάνια.

"το openai έχει ένα σαφές πλεονέκτημα πρώτης κίνησης. το βασικό μοντέλο του είναι ισχυρότερο, συλλέγει πολλά δεδομένα διαδικασίας σκέψης, προβάλλει και συνθέτει μεγάλο αριθμό δεδομένων σκέψης υψηλής ποιότητας και έχει ισχυρές δυνατότητες αξιολόγησης. ποιες διαδικασίες συλλογισμού είναι σωστές και ποιες συλλογιστικές διαδικασίες είναι λάθος, το οποίο απαιτεί τη χρήση της ενισχυτικής μάθησης είναι ουσιαστικά μια διαδικασία εξερεύνησης και δοκιμής και λάθους, απλώς δοκιμάστε μια άλλη μέθοδο.» είπε ο xiao yanghua αυτές οι τεχνολογίες και τα δεδομένα, το openai έχει καταστήσει το μεγάλο μοντέλο αληθινό με την έννοια και το επίπεδο των ειδικών.

ο chen yunwen, πρόεδρος της daguan data, είπε ότι τα προηγούμενα μοντέλα δεν μπορούσαν να υπολογίσουν πολύπλοκα προηγμένα μαθηματικά προβλήματα και το o1 έχει βελτιωμένες μαθηματικές και συλλογιστικές ικανότητες, κάτι που αποτελεί μεγάλη βελτίωση. ωστόσο, η βελτίωση των μαθηματικών ικανοτήτων δεν σημαίνει ότι το παράδειγμα ε&α των μεγάλων μοντέλων έχει υποστεί ουσιαστικές αλλαγές, αλλά κατευθύνει μόνο βελτιώσεις σε προηγούμενες ελλείψεις.

κατά την άποψη του xiao yanghua, η εμφάνιση του o1 δεν ήταν απροσδόκητη είναι εδώ και το αποτέλεσμα είναι τόσο καταπληκτικό.

για παράδειγμα, οι προηγούμενες εκδόσεις του gpt-4 ήταν εξοικειωμένες με όλες τις γνώσεις και τα γεγονότα και έδιναν έμφαση στις διανοητικές ικανότητες και έδιναν έμφαση στις αντιληπτικές ικανότητες. η βελτίωση του ορθολογισμού του μοντέλου θα επιτρέψει στη βιομηχανία to b να ξεκινήσει τεράστια ανάπτυξη. "ο μεγαλύτερος πόνος και το σημείο συμφόρησης του to b έγκειται στις συλλογιστικές δυνατότητες των μεγάλων μοντέλων. η εμφάνιση της νέας σειράς μοντέλων συμπερασμάτων o1 σημαίνει ότι πολλά προβλήματα στη βιομηχανία to b μπορούν να αμβλυνθούν σημαντικά στο μέλλον."

προκλήσεις που φέρνει η ραγδαία ανάπτυξη της τεχνητής νοημοσύνης

«το openai είναι πραγματικά ισχυρό, αν και ο τεχνικός οδικός χάρτης του openai μέχρι στιγμής δεν έχει ξεπεράσει το εύρος της γνώσης, όλοι γνωρίζουμε την κατεύθυνση ανάπτυξης μεγάλων μοντέλων, συμπεριλαμβανομένης της πολυτροπικότητας και των βελτιωμένων δυνατοτήτων λογικής, αλλά μόνο το openai το έχει μετατρέψει γρήγορα σε πραγματικότητα. εκπαιδεύουν τα μεγάλα μοντέλα ακριβώς με τον ίδιο τρόπο που έχουν τα ανθρώπινα όντα τυχόν λάθος βήματα." xiao yanghua. εξήγησε.

το openai έχει ένα σαφές πλεονέκτημα πρώτης κίνησης όσον αφορά την ανάπτυξη εγχώριων μοντέλων μεγάλης κλίμακας, "τα πλεονεκτήματα του openai είναι όλα μειονεκτήματα για εμάς. πρέπει να ηρεμήσουμε και να προλάβουμε σιγά σιγά. υπάρχει μόνο το πρώτο στη γενική πίστα τεχνητής νοημοσύνης, όχι. δεύτερο." ωστόσο, μακροπρόθεσμα, ο xiao yanghua είπε ότι υπάρχει ένα ανώτατο όριο για τη βελτίωση των ατομικών δυνατοτήτων μεγάλων μοντέλων. επειδή τα πραγματικά πρωτότυπα δεδομένα των ανθρώπων είναι περιορισμένα και η ταχύτητα παραγωγής είναι αργή. "προς το παρόν, το openai χρησιμοποιεί ανθρώπινα δεδομένα για να συνθέσει νέα δεδομένα για να βελτιώσει τις ικανότητες συλλογισμού. ωστόσο, τα συνθετικά δεδομένα περιορίζονται από τα αρχικά δεδομένα. δεν μπορεί να συνθέσει άπειρα δεδομένα, ούτε μπορεί να αποκτήσει ουσιαστικά νέα δεδομένα. δεν μπορεί να εφεύρει νέα θέματα εξαιτίας αυτού. προτείνετε νέες θεωρίες όπως ο αϊνστάιν «όσον αφορά το υλικό, ο συλλογισμός απαιτεί λιγότερη υπολογιστική ισχύ από την εκπαίδευση, αλλά λόγω της επέκτασης της αλυσίδας σκέψης, οι απαιτήσεις για αποτελεσματικότητα συλλογισμού γίνονται υψηλότερες, γεγονός που θέτει υψηλότερες απαιτήσεις για την επιτάχυνση και τη βελτιστοποίηση του συλλογισμού. διαδικασία.

ωστόσο, καθώς τα μεγάλα μοντέλα έχουν βελτιωθεί σε πολλές πτυχές, έχουν φέρει προκλήσεις στη διακυβέρνηση η πρόκληση είναι ότι η ανθρώπινη κατανόησή τους δεν έχει βελτιωθεί τόσο γρήγορα όσο έχει αναπτυχθεί.

ο φιλόσοφος καντ χώρισε την ανθρώπινη γνωστική διαδικασία σε τρία στάδια: αντιληπτικό, διανοητικό και ορθολογικό. σήμερα, η ευαισθησία, η ευφυΐα και ο ορθολογισμός των μεγάλων μοντέλων βελτιώνονται και είναι πιθανό να ξεπεράσουν τους ανθρώπους πολύ λίγοι άνθρωποι μπορούν να είναι δυνατοί σε αυτές τις τρεις γνώσεις.

"αυτή τη στιγμή το o1 έχει φτάσει στο επίπεδο των διδακτορικών φοιτητών. στο μέλλον, η επίτευξη του επιπέδου των επιστημόνων θα είναι μόνο μια διαδικασία επίτευξης ποσοτικών αλλαγών. τα ανθρώπινα όντα θα πέφτουν σταδιακά στο γνωστικό τυφλό σημείο της ανάπτυξης της τεχνητής νοημοσύνης. για παράδειγμα, τι σημαίνει η συλλογιστική ικανότητα του τρέχοντος μεγάλου μοντέλου. μπορεί πραγματικά να χρησιμοποιηθεί στην τεχνητή νοημοσύνη στα μαθηματικά, τη φυσική, τη χημεία ή τα μαθηματικά πόσοι από εμάς μπορούμε να κατανοήσουμε, να αναγνωρίσουμε και να ελέγξουμε την τεχνητή νοημοσύνη, είπε ο xiao yanghua, οι άνθρωποι βρίσκονται επί του παρόντος σε διδακτορικό επίπεδο. το βασικό γνωστικό πλαίσιο της τεχνητής νοημοσύνης λείπει. θέματα όπως η απασχόληση, η οικονομία, η ηθική και οι κοινωνικές σχέσεις θα προκαλέσουν ευρεία συζήτηση πέρα από το επίπεδο της ανθρώπινης γνώσης».

ο δημοσιογράφος της εφημερίδας ζανγκ τζινγκ

(αυτό το άρθρο προέρχεται από το the paper. για περισσότερες πρωτότυπες πληροφορίες, κάντε λήψη της εφαρμογής "the paper")

αναφορά/σχόλια

νέα

ερμηνεία｜xiao yanghua: τι αντίκτυπο θα έχει το μοντέλο o1 με διδακτορική μαθηματική ικανότητα;

εισαγωγή

τα στοιχεία επικοινωνίας μου