επιδρομές μοντέλου openai strawberry αργά το βράδυ! η φυσική και η χημεία φτάνει στο επίπεδο των διδακτορικών φοιτητών, πολύ καλύτερα από το gpt-4o, το chatgpt είναι διαθέσιμο

2024-09-13

συγγραφέας |

συντάκτης |. li shuiqing

ο zhidongxi ανέφερε στις 13 σεπτεμβρίου ότι νωρίς σήμερα το πρωί, το openai κυκλοφόρησε ξαφνικά το θρυλικόμοντέλο «φράουλα».μερική προεπισκόπηση του -έκδοση προεπισκόπησης openai o1. πρόκειται για μια σειρά νέων μοντέλων τεχνητής νοημοσύνης που μπορούν να αιτιολογήσουν περίπλοκες εργασίες και να λύσουν προβλήματα που είναι πιο δύσκολα από προηγούμενα επιστημονικά, προγραμματιστικά και μαθηματικά μοντέλα.

▲το openai κυκλοφορεί το μοντέλο o1

το openai o1 είναι το πρώτο σε μια νέα σειρά μοντέλων ai。σε αντίθεση με τα προηγούμενα μοντέλα, έχειεξελιγμένες συλλογιστικές ικανότητες, θα είναι μέσασκεφτείτε καλά πριν απαντήσετε, δημιουργούν ένα μακρύεσωτερική αλυσίδα σκέψης, κατάταξη σε ανταγωνιστικές ερωτήσεις προγραμματισμούνο. 89, κατατάχθηκε στο προκριματικό τουρνουά μαθηματικής ολυμπιάδας των ηπατα πρώτα 500, ακρίβεια σε δοκιμές αναφοράς σε προβλήματα φυσικής, βιολογίας και χημείαςυπέρβαση ανθρώπινου διδακτορικού επιπέδου！

άλλο ένα νέο που κυκλοφόρησεo1 μίνιείναι ένα πιο γρήγορο, μικρότερο μοντέλο, εκπαιδευμένο χρησιμοποιώντας ένα παρόμοιο πλαίσιο με το o1. το o1 mini είναι καλό στις επιστήμες και τη μηχανική, ειδικά στα μαθηματικά και στον προγραμματισμό.το κόστος είναι 80% φθηνότερο από την έκδοση προεπισκόπησης o1。

αυτά τα δύο μοντέλα θεωρούνται από το openai ως μια σημαντική πρόοδος σε σύνθετες συλλογιστικές εργασίες, επομένως ονομάζονται o1 για επαναφορά του μετρητή και όχι ως συνέχεια της σειράς gpt.

ωστόσο, η βελτιωμένη έκδοση συμπερασμάτων του μοντέλου o1 εξακολουθεί να απέτυχε παταγωδώς στο «πρόβλημα υψηλής τάξης» της σύγκρισης των μεγεθών 9.9 και 9.11.

▲το μοντέλο o1 απαντά στην ερώτηση "αναλογία μεγέθους"

ο andrej karpathy, ιδρυτικό μέλος του openai και πρώην ανώτερος διευθυντής της tesla ai, ο οποίος έφυγε από το openai για να ξεκινήσει μια επιχείρηση, παραπονέθηκε σήμερα το πρωί: "η o1-mini πάντα αρνιόταν να λύσει την υπόθεση riemann για μένα. η τεμπελιά του μοντέλου εξακολουθεί να είναι σημαντική πρόβλημα 😞"

▲ ο andrej karpathy παραπονέθηκε ότι ο o1 mini είναι «τεμπέλης»

το openai έχει δοκιμάσει και αξιολογήσει αυστηρά την έκδοση προεπισκόπησης o1 για να διασφαλίσει ότι το μοντέλο μπορεί να κυκλοφορήσει με ασφάλεια. οι χρήστες του chatgpt plus και του team μπορούν να επιλέξουν δύο νέα μοντέλα σήμερα και οι προγραμματιστές tier 5 θα είναι επίσης οι πρώτοι που θα αποκτήσουν πρόσβαση api στα νέα μοντέλα.

το openai ανακοίνωσε επίσης τα βασικά μέλη της ομάδας πίσω από το μοντέλο o1, συμπεριλαμβανομένων 21 βασικών συντελεστών, συμπεριλαμβανομένου του πρώην επικεφαλής επιστήμονα του openai ilya sutskever, ο οποίος έφυγε για να ξεκινήσει μια επιχείρηση, και 7 ηγέτες ομάδων.

1. το mmlu είναι συγκρίσιμο με ανθρώπους ειδικούς στην ικανότητα προγραμματισμού8διπλή θανάτωσηgpt-4o

όπως αποκαλύφθηκε προηγουμένως, το openai o1 έχει εκπαιδευτεί ώστε να είναι ένα μοντέλο που αφιερώνει περισσότερο χρόνο στο να σκέφτεται προβλήματα πριν αντιδράσει. σκέφτεται πριν απαντήσει, παράγοντας απολύ μεγάλη εσωτερική αλυσίδα ιδεών, και μπορεί να είναι σαν τους ανθρώπουςβελτιώστε τη διαδικασία σκέψης σας，συνεχίστε να δοκιμάζετε νέες στρατηγικέςκαι συνειδητοποιήστε τα λάθη σας.

ως πρώιμο μοντέλο προεπισκόπησης, το openai o1 επί του παρόντοςυποστηρίζει μόνο συνομιλίες κειμένου, δεν διαθέτει πολλαπλές δυνατότητες, όπως περιήγηση στον ιστό για λήψη πληροφοριών, αποστολή αρχείων και εικόνων κ.λπ.

όσον αφορά την απόδοση, το openai o1 είναιφυσική, χημεία και βιολογίααπόδοση σε εργασίες αναφοράς καιδιδάκτωραρκετά και μέσαμαθηματικά και προγραμματισμόςεξαιρετική απόδοση.

▲ openai o1 σημεία αναφοράς αξιολόγησης στα μαθηματικά και τον προγραμματισμό

στις κατατακτήριες εξετάσεις της διεθνούς μαθηματικής ολυμπιάδας (imo), το μοντέλο προηγούμενης γενιάς του openai gpt-4o είχε ποσοστό ακρίβειας 13%, ενώ το openai o1 ήτανφτάστε το 83%. στον διαγωνισμό κωδικοποίησης codeforces, openai o1η βαθμολογία είναι 89, ενώ το gpt-4o έχει μόνο 11. ακόμη και η έκδοση προεπισκόπησης του μοντέλου προεπισκόπησης o1 αποδίδει αρκετές φορές καλύτερα από το gpt-4o.

το o1 αποδίδει σημαντικά καλύτερα από το gpt-4o στα περισσότερα σημεία αναφοράς, καλύπτοντας 54 από τις 57 υποκατηγορίες mmlu. μετά την ενεργοποίηση της λειτουργίας οπτικής αντίληψης, το o1 σημείωσε 78,2% στο mmlu, γίνονταςτο πρώτο μοντέλο που ανταγωνίζεται τους ειδικούς στον άνθρωπο。

▲σύγκριση απόδοσης μεταξύ έκδοσης προεπισκόπησης o1 και gpt-4o

ακολουθούν μερικά παραδείγματα της έκδοσης προεπισκόπησης openai o1:

1. λύστε ένα σύνθετο λογικό παζλ

εισαγάγετε απαζλ περίπλοκης ηλικίας: μια πριγκίπισσα είναι τόσο μεγάλη όσο ο πρίγκιπας όταν είναι διπλάσια από τον πρίγκιπα και όταν η ηλικία της είναι η μισή από το άθροισμα των τρεχουσών ηλικιών τους. πόσο χρονών είναι ο πρίγκιπας και η πριγκίπισσα; δώστε όλες τις λύσεις σε αυτό το πρόβλημα.

το μοντέλο άρχισε να απαντά μετά από σκέψη για περισσότερα από 20 δευτερόλεπτα. η λογική της απάντησής του είναι πολύ συνεκτική. το πρώτο βήμα είναι να προσδιορίσετε την εξίσωση ηλικίας, να μετατρέψετε τις δεδομένες προτάσεις σε μαθηματικές εξισώσεις και να βρείτε όλες τις πιθανές λύσεις που ικανοποιούν αυτές τις εξισώσεις. στη συνέχεια, ξεκινήστε να αναλύετε το πρόβλημα βήμα προς βήμα:

το πρώτο βήμα είναι να ορίσουμε τις μεταβλητές, χρησιμοποιώντας το p για να αναπαραστήσουμε την πριγκίπισσα, το δεύτερο βήμα είναι να κατανοήσουμε τις δύο συνθήκες στο πρόβλημα το πέμπτο βήμα βήμα 1 χρησιμοποιεί αυτές τις τιμές για να επαληθεύσει όλες τις συνθήκες.

τελικά κατέληξε στο συμπέρασμα:

2. μεταφράστε προτάσεις με λάθη

η προσθήκη επιπλέον περιττών συμφώνων επηρεάζει την κορεατική ανάγνωση. δεν θα διαβάζεται φυσικά στους φυσικούς ομιλητές, οι οποίοι θα αλλάζουν αυτόματα και θα κατανοούν το κείμενο όταν βλέπουν τέτοιες προτάσεις. αλλά αυτή είναι μια δύσκολη πρόκληση για το μοντέλο.

εισαγάγετε ασοβαρά κατεστραμμένα κορεάτικα προτρεπτικά λόγιατέλος, το openai o1 συνειδητοποίησε αρχικά ότι το κείμενο εισαγωγής περιείχε αλλοιωμένους ή κακώς ευθυγραμμισμένους κορεατικούς χαρακτήρες και ρώτησε τον χρήστη εάν ήθελε να ελέγξει για σφάλματα εισαγωγής.

το μοντέλο o1 θα κατανοήσει πρώτα την υποκείμενη δομή και μετά από περίπου 10 δευτερόλεπτα σκέψης, θα αποκωδικοποιήσει το μπερδεμένο κείμενο, θα αποκρυπτογραφήσει το κείμενο, θα βελτιώσει τη μετάφραση, θα κατανοήσει την έννοια και θα το μετατρέψει ξανά σε μια συνεκτική γλώσσα.

σε αντίθεση με το gpt-4o, το μοντέλο o1 σκέφτεται την ερώτηση πριν δώσει την απάντηση, ελέγχει το κείμενο και στη συνέχεια το τροποποιεί στη σωστή πρόταση σαν να έσπασε την απάντηση. μετά από περίπου 15 δευτερόλεπτα σκέψης, ο o1 έδωσε την τελική βελτιστοποιημένη έκδοση της μετάφρασης.

αυτό δείχνει ότι οι συλλογιστικές δεξιότητες γίνονται ένα ισχυρό εργαλείο για την επίλυση προβλημάτων.

3. απαντήστε στο γνωστό δύσκολο πρόβλημα στα μεγάλα γλωσσικά μοντέλα: μέτρηση γραμμάτων σε λέξεις

αυτό το παράδειγμα είναι πολύ απλό, πληκτρολογήστε τη λέξη strawberry και αφήστε το μοντέλο να απαντήσει σε αυτόπόσα r υπάρχουν στη λέξη;。

ως αποτέλεσμα, το gpt-4o έδωσε τη λάθος απάντηση: "2."

γιατί ένα τόσο εξελιγμένο μοντέλο να κάνει ένα τόσο απλό λάθος; αυτό συμβαίνει επειδή ένα μοντέλο όπως το gpt-4o έχει κατασκευαστεί για να επεξεργάζεται κείμενο, όχι χαρακτήρες ή λέξεις, επομένως μπορεί να κάνει λάθη όταν αντιμετωπίζει προβλήματα που περιλαμβάνουν την κατανόηση της έννοιας των χαρακτήρων και των λέξεων.

το νέο μοντέλο o1 που βασίζεται στη λογική μπορεί να δώσει τη σωστή απάντηση αφού σκεφτεί για λίγα δευτερόλεπτα:

4. προγραμματισμός βιντεοπαιχνιδιών

αφήστε το μοντέλο να χρησιμοποιήσει το pygameφτιάξτε ένα βιντεοπαιχνίδι που ονομάζεται squirrel finder, και εισαγάγετε τις ακόλουθες απαιτήσεις: ο χρήστης πρέπει να καθοδηγήσει το εικονίδιο "κοάλα" στην οθόνη πατώντας τα πλήκτρα βέλους, να αποφύγει τις αιωρούμενες φράουλες και να βρει έναν σκίουρο εντός του χρονικού ορίου των 3 δευτερολέπτων για να κερδίσει.

αυτό ήταν πιο δύσκολο με τα προηγούμενα μοντέλα, αλλά η έκδοση προεπισκόπησης o1 μπόρεσε να το κάνει. ο o1 πέρασε 21 δευτερόλεπτα σκεπτόμενος και χρησιμοποίησε τη διαδικασία σκέψης για να σχεδιάσει τη δομή του κώδικα, συμπεριλαμβανομένης της συλλογής λεπτομερειών της διάταξης του παιχνιδιού, σχεδίασης οδηγιών, ρύθμισης της οθόνης κ.λπ., και στη συνέχεια εξαγωγής του τελικού κώδικα προγραμματισμού του παιχνιδιού.

αντιγράψτε και επικολλήστε τον κώδικα στο πρόγραμμα επεξεργασίας κειμένου sublime μετά την εκτέλεση, θα υπάρξουν μερικές γραμμές σύντομων προτροπών.

στη συνέχεια, μπορείτε να ξεκινήσετε να παίζετε το παιχνίδι "ψάχνοντας για σκίουρο".

το μοντέλο o1 παρουσιάζει σημαντικά βελτιωμένες δυνατότητες σχεδιασμού σε σύγκριση με προηγούμενα μοντέλα.

2. βελτίωση ταχύτητας μίνι έκδοσης3~5φορές, το κόστος είναι μόνο η τυπική έκδοση1/5

το openai κυκλοφόρησε επίσηςμοντέλο "small cup version" openai o1-mini,οτιπιο γρήγορα και φθηνότερα, και έχει την ίδια εξαιρετική απόδοση στα μαθηματικά και τον προγραμματισμό με την τυπική έκδοση.

το openai o1-mini είναι βελτιστοποιημένο για συλλογισμό stem (επιστήμη, τεχνολογία, μηχανική και μαθηματικά) κατά τη διάρκεια της προεκπαίδευσης. αφού εκπαιδευτεί χρησιμοποιώντας τον ίδιο υπολογιστικά εντατικό αγωγό ενίσχυσης εκμάθησης (rl) με το o1, το o1-mini επιτυγχάνει ανώτερη απόδοση σε πολλές εργασίες εξαγωγής συμπερασμάτων ενώ είναι σημαντικά πιο αποδοτικό από άποψη κόστους.

openai o1-mini80% φθηνότερα από την έκδοση προεπισκόπησης του openai o1, κατάλληλο για εφαρμογές που απαιτούν συλλογισμό αλλά δεν απαιτούν εκτενή παγκόσμια γνώση. σε ορισμένες δοκιμές αναφοράς που απαιτούν ευφυΐα και λογική, το o1-mini αποδίδει ακόμη καλύτερα από το o1-preview.

▲μαθηματική απόδοση και συλλογιστική καμπύλη κόστους

στο διαγωνισμό μαθηματικών γυμνασίου aime, το ποσοστό ακρίβειας του o1-mini ήταν 70%, που ισοδυναμεί περίπου μεοι κορυφαίοι 500 μαθητές γυμνασίου στις ηνωμένες πολιτείες. ταυτόχρονα, τα ποσοστά ακρίβειας των o1 και o1-preview είναι 74,4% και 44,6% αντίστοιχα, αλλά η τιμή του o1-mini είναι πολύ φθηνότερη από αυτά.

όσον αφορά την αξιολόγηση των ανθρώπινων προτιμήσεων, το openai έλαβε τα ακόλουθα αποτελέσματα δοκιμών ζητώντας από τους ανθρώπινους βαθμολογητές να δοκιμάσουν το o1-mini και το o1-preview σε προκλητικές ανοιχτές λέξεις προτροπής σε διαφορετικά πεδία και τις συνέκρινε με το gpt-4o. παρόμοια με το o1-preview, το o1-mini είναι πιο δημοφιλές από το gpt-4o σε περιοχές με βαριές εργασίες εξαγωγής συμπερασμάτων, αλλά δεν ευνοείται σε περιοχές με επίκεντρο τη γλώσσα.

▲αποτελέσματα αξιολόγησης ανθρώπινων προτιμήσεων

όσον αφορά την ταχύτητα, τα gpt-4o, o1-mini και o1-preview αντίστοιχα χρειάζονται χρόνο για να απαντήσουν στην ίδια ερώτηση συλλογιστικής λέξης.3 δευτερόλεπτα, 9 δευτερόλεπτα, 32 δευτερόλεπτα, αλλά η απάντηση του gpt-4o είναι λάθος και οι δύο τελευταίες απαντήσεις είναι σωστές. μπορεί να φανεί ότι η ταχύτητα του o1-mini για να πάρει την απάντησηπερίπου 3~5 φορές πιο γρήγορα από το o1。

▲ταχύτητα απόκρισης gpt-4o, o1-mini και o1-προεπισκόπησης

φυσικά, είναι τελικά μια «ευνουχισμένη έκδοση» και το openai o1-mini έχει επίσης ορισμένους περιορισμούς. όσον αφορά τις πραγματικές γνώσεις για θέματα που δεν είναι stem, όπως ημερομηνίες, βιογραφίες και καθημερινά στοιχεία, το o1-mini είναι κάπως περιορισμένο, αποδίδοντας στο ίδιο επίπεδο με μικρότερα μοντέλα όπως το gpt-4o mini. η openai είπε ότι θα βελτιώσει αυτούς τους περιορισμούς σε μελλοντικές εκδόσεις και θα επεκτείνει το μοντέλο σε άλλες μεγάλες εταιρείες και τρόπους πέρα από το stem.

3. εισάγετε δείκτες συλλογισμού και χρησιμοποιήστε αλυσίδες σκέψης για να λύσετε προβλήματα

παρόμοια με τους ανθρώπους, ο o1 σκέφτεται για πολύ καιρό πριν απαντήσει σε δύσκολες ερωτήσεις και χρήσειςαλυσίδα σκέψης。

μέσω της ενισχυτικής μάθησης, ο o1 έμαθε να βελτιώνει την αλυσίδα σκέψης και να χρησιμοποιεί στρατηγικές. είναι η ικανότητα να αναγνωρίζετε και να διορθώνετε λάθη, να αναλύετε τα δύσκολα βήματα σε πιο απλά και να δοκιμάζετε διαφορετικές προσεγγίσεις όταν η τρέχουσα δεν λειτουργεί. αυτή η διαδικασία βελτιώνει σημαντικά τις συλλογιστικές δυνατότητες του μοντέλου.

συγκεκριμένα, το μοντέλο o1 εισάγεισυμπεράσματα(reasoning tokens). αυτοί οι δείκτες συμπερασμάτων χρησιμοποιούνται για να «σκέφτονται», να αναλύουν την κατανόηση της λέξης της προτροπής και να εξετάζουν πολλούς τρόπους για να δημιουργήσουν μια απάντηση. αφού δημιουργηθούν τα διακριτικά συμπερασμάτων, το μοντέλο δημιουργεί απαντήσεις ως ορατά διακριτικά ολοκλήρωσης και απορρίπτει τα διακριτικά συμπερασμάτων από το περιβάλλον τους.

παρακάτω είναι ένα παράδειγμα μιας συνομιλίας πολλαπλών βημάτων μεταξύ ενός χρήστη και ενός μοντέλου. τα διακριτικά εισόδου και εξόδου για κάθε βήμα διατηρούνται, ενώ τα διακριτικά συμπερασμάτων απορρίπτονται.

▲o1 διαδικασία συμπερασμάτων μοντέλου

αξίζει να σημειωθεί ότι όταν το openai διεξήγαγε μεγάλης κλίμακας εκπαίδευση αλγορίθμων ενισχυτικής μάθησης, διαπιστώθηκε ότιμε την αύξηση του χρόνου εντατικής μάθησης και σκέψης,, ή μάλλονκαθώς ο χρόνος εκπαίδευσης και ο χρόνος δοκιμής αυξάνονται,，η απόδοση του o1 θα συνεχίσει να βελτιώνεται. αυτό είναι πολύ διαφορετικό από τον νόμο κλιμάκωσης στην προεκπαίδευση μεγάλων μοντέλων.

▲o1 η απόδοση βελτιώνεται σταθερά με τον υπολογισμό του χρόνου προπόνησης και του χρόνου δοκιμής

για να δείξει το άλμα που επιτεύχθηκε από το o1, το openai αποκάλυψε την αλυσίδα σκέψης που δημιουργείται από την έκδοση προεπισκόπησης του o1 κατά την επίλυση προβλημάτων όπως προγραμματισμός, μαθηματικά, αποκωδικοποίηση και αγγλικά.

για παράδειγμα, όταν λαμβάνετε έναερωτήσεις αποκωδικοποίησης, το gpt-4o πρώτα αποσυναρμολόγησε την είσοδο, την έξοδο και τα παραδείγματα και στη συνέχεια άρχισε να αναλύει πιθανές μεθόδους αποκωδικοποίησης.

▲είσοδος, έξοδος και παραδείγματα αποσυναρμολόγησης gpt-4o

υπέθεσε ότι η πρώτη φράση μπορεί να ακολουθεί την ίδια δομή με το παράδειγμα, συνειδητοποιώντας ότι το κείμενο εισαγωγής φαινόταν να χωρίζεται σε ομάδες με βάση φυσικούς διαχωρισμούς ή μοτίβα, αλλά στη συνέχεια σταμάτησε να λειτουργεί, λέγοντας ότι χρειαζόταν περισσότερες πληροφορίες σχετικά με τις μετατροπές ή τις αλλαγές γραμμάτων που μπορεί να εμπλέκονται λίγο πλαίσιο.

το ▲gpt-4o είπε ότι χρειάζονται περισσότερες πληροφορίες

από την άλλη πλευρά, το openai o1-preview πέρασε από κάποια σκέψηέδωσε την απάντηση με ακρίβεια。

το ▲o1-preview απαντά σωστά στο πρόβλημα αποκωδικοποίησης

αν και η τελική απάντηση που παρουσιάστηκε ήταν πολύ σύντομη, η διαδικασία σκέψης του ο1 ήταν πολύ μεγάλη και η σκέψη και η διατύπωσή του ήταν πολύ ανθρώπινες. ξεκινά ρωτώντας τον εαυτό του «τι συμβαίνει εδώ» και μετάεπαναλάβετε το αίτημα, μετά ξεκινήστεαναλύστε τις εργασίες και ξεκαθαρίστε τους στόχους。

▲o1 διαδικασία σκέψης

στη συνέχεια, ξεκινά το o1παρατηρήστε τις πληροφορίες που λαμβάνετε,καιανάλυση βήμα προς βήμα。

▲o1 διαδικασία σκέψης

μετά από κάποιο σκεπτικό, ξεκινάει το o1βρείτε διαφορετικές λύσεις. κατά τη διάρκεια αυτής της διαδικασίας, όπως οι άνθρωποι, ξαφνικά θα πουν «περίμενε ένα λεπτό, νομίζω...» και μετά θα αρχίσουν να σκέφτονται ξανά.δοκιμάστε νέες μεθόδους。

▲o1 διαδικασία σκέψης

όχι μόνο αυτό, υπάρχουν ακόμη και λέξεις όπως "χμ" και "ενδιαφέρον" που εμφανίζονται στη διαδικασία σκέψης του o1.καθομιλουμένη, συναισθηματικήέκφραση.

▲o1 διαδικασία σκέψης

η πλήρης αλυσίδα σκέψης είναι πολύ μεγάλη, επομένως δεν θα υπεισέλθω σε λεπτομέρειες εδώ. γενικά, όπως είπε το openai, το o1 μπορεί να βελτιώνει συνεχώς τη διαδικασία σκέψης του όπως οι άνθρωποι, να δοκιμάζει νέες στρατηγικές, να αναγνωρίζει τα δικά του λάθη και να τα λύνει. και το «σαν άνθρωποι» εδώ δεν περιορίζεται στον τρόπο σκέψης, αλλά αντικατοπτρίζεται και στον τόνο.

τέσσερα,διαθέσιμο για συνομιλία κάθε εβδομάδα30~50φορές, ο ilya συμμετείχε σε βασικές συνεισφορές

διαφορετικά από το παρελθόν, αυτή τη φορά το openai δεν απαριθμούσε τα συμβόλαια μελλοντικής εκπλήρωσης, αλλάσυνδεθείτε απευθείας στο διαδίκτυοδύο μοντέλα.

από τώρα και στο εξής, οι χρήστες του chatgpt plus και της ομάδας μπορούν να έχουν πρόσβαση στο μοντέλο o1 στο chatgpt και να επιλέγουν χειροκίνητα το o1-preview ή το o1-mini μέσω του επιλογέα μοντέλου, οι χρήστες για επιχειρήσεις και εκπαίδευση μπορούν να το χρησιμοποιούν από την επόμενη εβδομάδα και οι δωρεάν χρήστες θα μπορούν επίσης αποκτήσουν πρόσβαση στο μέλλον.

▲οι χρήστες μπορούν να έχουν πρόσβαση στο μοντέλο o1 στο chatgpt

αλλά ίσως λόγω ασφάλειας ή κόστους, και τα δύο μοντέλα περιορίζουν επί του παρόντος τον αριθμό των μηνυμάτων, την έκδοση προεπισκόπησης και την έκδοση μίνι.ο αριθμός των μηνυμάτων που αποστέλλονται την εβδομάδα είναι 30 και 50 αντίστοιχα.. η openai είπε ότι εργάζεται σκληρά για να αυξήσει το όριο και να επιτρέψει στο chatgpt να επιλέγει αυτόματα το κατάλληλο μοντέλο με βάση τις προτρεπτικές λέξεις.

το openai κυκλοφόρησε επίσης το api (διεπαφή προγραμματισμού εφαρμογών) του μοντέλου o1. οι πιστοποιημένοι προγραμματιστές μπορούν τώρα να ξεκινήσουν τη δημιουργία πρωτοτύπων χρησιμοποιώντας το api και για τα δύο μοντέλα με όριο ταχύτητας 20 rpm. αυτά τα api προς το παρόν δεν περιλαμβάνουν κλήσεις λειτουργιών, ροή, υποστήριξη για μηνύματα συστήματος και άλλες λειτουργίες.

▲o1, o1 mini model api

όπως φαίνεται από την τεκμηρίωση του api, αυτά τα δύο μοντέλατα παράθυρα περιβάλλοντος είναι όλα 128k, ενώ το παράθυρο εξόδου της μίνι έκδοσης είναι μεγαλύτερο,είναι διπλάσιο από το o1, επιπλέον, τα δεδομένα εκπαίδευσης των δύο μοντέλων είναι τον οκτώβριο του 2023.

η openai ανακοίνωσε επίσης την ομάδα πίσω από το μοντέλο o1μέλη της βασικής ομάδας：

▲τα βασικά μέλη της ομάδας πίσω από το μοντέλο o1

σευπάρχουν 21 βασικά συνεισφέροντα μέλη, συμπεριλαμβανομένου του πρώην επικεφαλής επιστήμονα του openai ilya sutskever, ο οποίος έφυγε για να ξεκινήσει μια επιχείρηση.

υπάρχουν 7 αρχηγοί ομάδων, αντίστοιχα jakub pachocki, jerry tworek (συνολικά), liam fedus, lukasz kaiser, mark chen, szymon sidor, wojciech zaremba. οι υπεύθυνοι του έργου είναι η lauren yang και η mianna chen.

σύμφωνα με τα μέλη της ομάδας του, η συλλογιστική είναι η ικανότητα μετατροπής του χρόνου σκέψης σε καλύτερα αποτελέσματα. επένδυσαν περισσότερους υπολογισμούς από πριν, εκπαιδεύοντας το μοντέλο να παράγει συνεκτικές ιδέες και παράγει μια εντελώς διαφορετική απόδοση από πριν.

χρησιμοποιούν ενισχυτική μάθηση για να εκπαιδεύσουν το μοντέλο ai ώστε να δημιουργεί και να ακονίζει τις δικές του αλυσίδες σκέψης ακόμα καλύτερα από τις αλυσίδες σκέψης που έχουν προγραμματιστεί για αυτό από τους ανθρώπους. αυτός ο τρόπος εκπαίδευσης ενός μοντέλου ai για τη δημιουργία της δικής του διαδικασίας σκέψης βελτιώνει σημαντικά την ικανότητά του να κατανοεί και να διορθώνει τα λάθη και τα πρώιμα μοντέλα o1 έχουν ήδη πετύχει υψηλότερες βαθμολογίες σε δοκιμές δεδομένων.

η λίστα των βασικών συντελεστών και άλλων συντελεστών είναι η εξής:

▲ λίστα με τους βασικούς συντελεστές o1 και άλλους συντελεστές

οι διοικητικοί ηγέτες περιλαμβάνουν 8 άτομα, συμπεριλαμβανομένου του διευθύνοντος συμβούλου του openai, sam altman, του προέδρου greg brockman, της ceo mira murati και 8 υποστηρικτικών ηγετών.

▲o1 διοικητική ηγεσία, ηγεσία υποστήριξης

το νέο μοντέλο o1 μπορεί να συναγάγει και να εκμεταλλεύεται τους κανόνες ασφαλείας πιο αποτελεσματικά. το openai διεξήγαγε αυστηρές δοκιμές και αξιολόγηση του o1-preview για να διασφαλίσει ότι το μοντέλο μπορεί να κυκλοφορήσει με ασφάλεια χωρίς να αυξήσει τους κινδύνους που μπορεί να προκύψουν από τους υπάρχοντες πόρους.

συμπέρασμα: το openai ανατρέπει τον πίνακα, το "strawberry" ανακατασκευάζει το μοτίβο του μεγάλου μοντέλου;

από το μυστηριώδες μοντέλο q* μέχρι το μοντέλο «φράουλα», το νέο μοντέλο του openai είναι επιτέλους διαθέσιμο. από την έναρξη του «πραξικοπήματος» του openai τον περασμένο νοέμβριο, αυτό το μοντέλο έχει εκτεθεί ως ένας από τους βασικούς παράγοντες που οδήγησαν στην απέλαση του άλτμαν. εκείνη την εποχή, φημολογήθηκε ότι μια επίδειξη του μοντέλου q* κυκλοφορούσε στο openai και η ταχύτητα ανάπτυξης σόκαρε ορισμένους ερευνητές ασφάλειας τεχνητής νοημοσύνης.

σε αντίθεση με το gpt-4o, το μοντέλο o1 επιλέγει να ανοίξει απευθείας μια νέα σειρά ονοματοδοσίας αριθμών αντί για μια συνέχεια του gpt, κάτι που δείχνει ότι το openai αποδίδει μεγάλη σημασία σε αυτό.

τώρα που πολλοί μεγάλοι κατασκευαστές μοντέλων αρχίζουν να διαθέτουν εφαρμογές πολλαπλών μέσων και τόμου, η κυκλοφορία του μοντέλου καθαρού κειμένου o1 από το openai μπορεί για άλλη μια φορά να επιστήσει την προσοχή του κοινού στη βελτίωση των υποκείμενων δυνατοτήτων του μοντέλου. το αν το μεγάλο μοντέλο τοπίου θα ανακατασκευαστεί υπό την επίδραση του o1 μένει να φανεί περαιτέρω.

νέα

επιδρομές μοντέλου openai strawberry αργά το βράδυ! η φυσική και η χημεία φτάνει στο επίπεδο των διδακτορικών φοιτητών, πολύ καλύτερα από το gpt-4o, το chatgpt είναι διαθέσιμο

εισαγωγή

τα στοιχεία επικοινωνίας μου