η o1 πλήρης αλυσίδα σκέψης γίνεται το νούμερο ένα ταμπού στο openai! εάν κάνετε πάρα πολλές ερωτήσεις, περιμένετε να γίνει banned

η o1 πλήρης αλυσίδα σκέψης γίνεται το νούμερο ένα ταμπού στο openai! εάν κάνετε πάρα πολλές ερωτήσεις, περιμένετε να αποκλειστεί ο λογαριασμός σας.

2024-09-14

προειδοποιώ! μην ρωτάτε στο chatgpt τι πιστεύει το πιο πρόσφατο μοντέλο o1——

απλά δοκιμάστε το μερικές φορές και το openai θα σας στείλει ένα emailαπειλή για ανάκληση των προσόντων σας。

σταματήστε αυτήν τη δραστηριότητα και βεβαιωθείτε ότι η χρήση του chatgpt συμμορφώνεται με τους όρους χρήσης μας. οι παραβιάσεις αυτής της διάταξης ενδέχεται να οδηγήσουν σε απώλεια της πρόσβασης openai o1.

λιγότερο από 24 ώρες μετά την κυκλοφορία του νέου μεγάλου μοντέλου o1, πολλοί χρήστες ανέφεραν ότι έλαβαν αυτό το προειδοποιητικό email, προκαλώντας δυσαρέσκεια.

μερικοί άνθρωποι ανέφεραν ότι εφόσον οι προτρεπτικές λέξεις περιέχουν λέξεις-κλειδιά όπως "ίχνος συλλογισμού" και "δείξε την αλυσίδα σκέψης σου", θα λάβουν μια προειδοποίηση.

ακόμα κι αν οι λέξεις-κλειδιά αποφευχθούν εντελώς και χρησιμοποιούνται άλλα μέσα για να παρακινηθεί το μοντέλο να παρακάμψει περιορισμούς, θα εντοπιστεί.

μερικοί άνθρωποι ισχυρίστηκαν ότι οι λογαριασμοί τους είχαν αποκλειστεί για μια εβδομάδα.

όλοι αυτοί οι χρήστες προσπαθούν να ξεγελάσουν τον o1 και να του ζητήσουν να επαναλάβει αυτό που είπεολοκληρωμένη εσωτερική διαδικασία σκέψης, δηλαδή όλα τα πρωτότυπα λογιστικά διακριτικά.

επί του παρόντος, μπορείτε να χρησιμοποιήσετε το κουμπί επέκτασης στη διεπαφή chatgptμπορεί να φανεί, είναι απλώς μια ανασκόπηση της αρχικής διαδικασίας σκέψηςπερίληψη。

στην πραγματικότητα, όταν κυκλοφόρησε το o1, το openai έδωσε λόγους για να κρύψει την πλήρη διαδικασία σκέψης του μοντέλου.

συνοψίζοντας: το openai πρέπει να παρακολουθεί τη διαδικασία σκέψης του μοντέλου εσωτερικά, επομένως δεν μπορούν να προστεθούν περιορισμοί ασφαλείας σε αυτά τα πρωτότυπα διακριτικά, γεγονός που καθιστά άβολο για τους χρήστες να το δουν.

ωστόσο, δεν συμφωνούν όλοι με αυτόν τον λόγο.

κάποιος το επεσήμανεo1η διαδικασία σκέψης είναι τα καλύτερα δεδομένα εκπαίδευσης για άλλα μοντέλα, επομένως η openai δεν θέλει αυτά τα πολύτιμα δεδομένα να κλαπούν από άλλες εταιρείες.

μερικοί άνθρωποι πιστεύουν επίσης ότι αυτό δείχνει ότι το o1 πραγματικά δεν έχει τάφρο, όταν αποκαλυφθεί η διαδικασία σκέψης, μπορεί εύκολα να αντιγραφεί από άλλους.

και "είναι αυτή η απάντηση που μας επιτρέπει να εμπιστευόμαστε τυφλά την τεχνητή νοημοσύνη χωρίς καμία εξήγηση;"

όσον αφορά τις τεχνικές αρχές πίσω από το μοντέλο o1, πολύ λίγα αποκαλύφθηκαν αυτή τη φορά και η μόνη αποτελεσματική πληροφορία ήταν «χρησιμοποιήθηκε ενισχυτική μάθηση».

εν ολίγοις, το openai γίνεται όλο και λιγότερο ανοικτό.

το o1 είναι φράουλα, αλλά όχι το gpt-5

είναι πλέον βέβαιο ότι το o1 είναι αυτό που το openai διαφημίζει εδώ και πολύ καιρό."φράουλα", ή με άλλα λόγια, χρησιμοποιώντας τη μέθοδο που αντιπροσωπεύεται από το "φράουλα".

μπορεί όμως να υπολογιστεί ως το μοντέλο επόμενης γενιάς gpt-5 ή είναι απλώς gpt-4.x;

όλο και περισσότεροι άνθρωποι αρχίζουν να υποψιάζονται ότι πρόκειται απλώς για μια μηχανική προσαρμογή που βασίζεται στο gpt-4o.

ο γνωστός λογαριασμός σπασίματος flowers (πρώην flowers from the future) είπε:οι υπάλληλοι του openai αναφέρονται εσωτερικά στο o1 ως "4o με συλλογισμό"。

καιυποστήριξε ότι σε πολλούς υπαλλήλους του openai άρεσαν σιωπηλά τα νέα, το παραπάνω στιγμιότυπο οθόνης είναι επίσης από έναν υπάλληλο του openai.

αλλά ο μασκ άλλαξε πρόσφατα το twitter, ώστε κανείς εκτός από την αρχική αφίσα να μην μπορεί να δει σε ποιον άρεσε τι, επομένως αυτή η είδηση δεν μπορεί να επιβεβαιωθεί ακόμα.

στην εκδήλωση "ask me anything" που μόλις πραγματοποιήθηκε από τον λογαριασμό προγραμματιστή openai, η flowers έκανε επίσης ερωτήσεις.

οι υπάλληλοι του openai απαντούν σε πολλές ερωτήσεις εδώ, αλλά αποφύγετε αυτήν που κατατάσσεται ψηλά στη λίστα των likes.

ακόμη και ο ultraman benman μόλις εμφανίστηκε ξανά ως ο riddler, υποδηλώνοντας ότι το "strawberry" έφτασε στο τέλος του και το επόμενο θα έχει την κωδική ονομασίαωρίωννέα μοντέλα είναι καθ' οδόν.

είχε αναφερθεί προηγουμένως ότι το "orion" είναι το νέο εμβληματικό μοντέλο επόμενης γενιάς του openai, που εκπαιδεύεται από συνθετικά δεδομένα που παράγονται από το "strawberry", το οποίο είναι o1.

ο ωρίωνας είναι ένας από τους εκπροσώπους των «χειμερινών αστερισμών» στο στόμα του ultraman.

επιστρέφοντας στο o1 που κυκλοφόρησε, μια άλλη κριτική γύρω από αυτό είναι«δεν πληροί τα πρότυπα επιστημονικής έρευνας»。

για παράδειγμαδεν αναφέρεται προηγούμενη σχετική εργασία για τον υπολογισμό του χρόνου συμπερασμάτων., και επίσηςέλλειψη σύγκρισης με μοντέλα τελευταίας τεχνολογίας άλλων εταιρειών。

όσον αφορά το προηγούμενο σημείο, κάποιοι επεσήμαναν ότι το openai δεν είναι πλέον ερευνητικό εργαστήριο και θα πρέπει να θεωρείται ως εμπορική εταιρεία.

μερικές φορές εξακολουθούν να προσποιούνται ότι είναι ένα ερευνητικό εργαστήριο για να στρατολογήσουν άτομα που θέλουν να κάνουν έρευνα.

ωστόσο, όσον αφορά το τελευταίο σημείο, τώρα που κυκλοφόρησε το api, δεν εξαρτάται από εσάς αν θα το συγκρίνετε με άλλα μοντέλα αιχμής πολλά σημεία αναφοράς τρίτων έχουν ήδη δώσει αποτελέσματα.

1 εκατομμύριο δολάρια που κατείχε ο πατέρας του κέραςβραβείο agiκατά τη διάρκεια του διαγωνισμού, και οι δύο εκδόσεις o1-preview και o1-mini δοκιμάστηκαν στο δημόσιο σετ δοκιμών.υπέρβαση του δικού του gpt-4o。

αλλά o1-προεπισκόπησηαπλά ισοπαλία με το claude 3.5-sonnet της διπλανής πόρτας。

επικεντρώθηκε στη δημοσιότητα στο o1δυνατότητα κωδικοποίησηςανώτερος,βοηθητικό εργαλείο προγραμματισμού ζευγών ανοιχτού κώδικαη ομάδα έκανε δοκιμές και τη σειρά o1 επίσηςκανένα προφανές πλεονέκτημα。

για ολόκληρη την εργασία επανεγγραφής κώδικα, το o1-preiview σημείωσε 79,7 πόντους, ο claude-3,5-sonnet σημείωσε 75,2 πόντους και το o1 προηγήθηκε με 4,5 βαθμούς.

αλλά για πιο πρακτικές εργασίες επεξεργασίας κώδικα, το o1-preview υστερεί σε σχέση με το claude-3.5-sonnet, με ένα κενό 2,2 πόντων.

επιπλέον, η ομάδα βοηθών υπενθυμίζει ότι εάν θέλετε να χρησιμοποιήσετε τη σειρά o1 για να αντικαταστήσετε τον προγραμματισμό claude, το κόστος θα είναι πολύ υψηλότερο.

συνεργάζεται με το openai"προγραμματιστής ai" devinη ομάδα έχει αποκτήσει εκ των προτέρων πιστοποιητικό πρόσβασης o1.

στις δοκιμές τους, η βασική έκδοση του devin που οδηγείται από τη σειρά o1 πέτυχε πολύ μεγάλη βελτίωση σε σύγκριση με το gpt-4o.

αλλάυπάρχει ακόμα ένα μεγάλο κενό σε σύγκριση με την έκδοση παραγωγής devin που κυκλοφόρησε., κυρίως λόγω του γεγονότος ότι η έκδοση παραγωγής devin εκπαιδεύεται σε ιδιόκτητα δεδομένα.

επιπλέον, η ομάδα του devin μοιράστηκε ότι ο o1 συχνά υποχωρεί και εξετάζει διαφορετικές επιλογές πριν καταλήξει στη σωστή λύση και είναι λιγότερο πιθανό να έχει παραισθήσεις ή να κάνει λάθος με αυτοπεποίθηση.

όταν χρησιμοποιείτε το o1-preview, devinείναι πιο πιθανό να διαγνώσει σωστά τη βασική αιτία ενός σφάλματος παρά να αντιμετωπίσει τα συμπτώματα του προβλήματος。

με μεγαλύτερη έμφαση στα μαθηματικά και στον λογικό συλλογισμόlivebenchστη λίστα, το o1-preview βρίσκεται στη λίσταπίσω στην κατηγορία ενός κωδικούστην περίπτωση, η συνολική βαθμολογία είναιπροσπερνώντας τον claude-3.5-sonnet και ανοίγοντας ένα σαφές κενό。

η ομάδα του livebench μοιράστηκε ότι αυτά είναι μόνο προκαταρκτικά αποτελέσματα, επειδή πολλές δοκιμές έχουν επίσης ενσωματωμένες λέξεις όπως "σκεφτείτε βήμα προς βήμα", που δεν είναι ο καλύτερος τρόπος για να χρησιμοποιήσετε το o1.

ολοκληρωμένο σημείο αναφοράς αξιολόγησης για μεγάλα μοντέλα στα κινέζικαη κινεζική σύνθετη δοκιμασία συλλογιστικής υψηλού επιπέδου του superclueμέσο,η συλλογιστική ικανότητα του o1-preview είναι επίσης σημαντικά μπροστά.。

τέλος, για να συνοψίσουμε, υπάρχουν μερικά πράγματα που πρέπει να προσέξεις όταν χρησιμοποιείτε το μοντέλο o1:

το κόστος είναι πολύ υψηλό, 1 εκατομμύριο μάρκες εξόδου κοστίζουν 60 δολάρια ηπα και η τιμή επιστρέφει στην εποχή του gpt-3 εν μία νυκτί.

τα κρυφά διακριτικά αντήχησης περιλαμβάνονται επίσης στα διακριτικά εξόδου και δεν είναι ορατά, αλλά πρέπει να πληρωθούν.

για τις περισσότερες εργασίες, είναι καλύτερο να χρησιμοποιήσετε πρώτα το gpt-4o και μετά να μεταβείτε στο o1 όταν δεν είναι αρκετό για εξοικονόμηση κόστους.

οι εργασίες κώδικα εξακολουθούν να προτιμούν το claude-3.5-sonnet

εν ολίγοις, η κοινότητα προγραμματιστών εξακολουθεί να έχει πολλές ερωτήσεις σχετικά με το νέο μοντέλο o1 του openai.

το o1 άνοιξε ένα νέο παράδειγμα για συλλογισμό τεχνητής νοημοσύνης υψηλού επιπέδου, αλλά δεν είναι ακόμα τέλειο και ο τρόπος μεγιστοποίησης της αξίας του μένει να διερευνηθεί.

σε αυτό το πλαίσιο, η εκδήλωση «ερώτηση και απάντηση» του openai έλαβε εκατοντάδες ερωτήσεις μέσα σε 4 ώρες.

επισυνάπτεται παρακάτω μια επιλογή και περίληψη ολόκληρης της εκδήλωσης.

οι υπάλληλοι του openai απαντούν σε όλες τις ερωτήσεις σας

πρώτα απ 'όλα, πολλοί άνθρωποι είναι περίεργοι για αυτό το νέο μοντέλο που κυκλοφόρησε ξαφνικά γιατί το openai του έδωσε ένα όνομα όπως το o1;

αυτό οφείλεται στο ότι όταν εξετάζουμε το openai, το o1 αντιπροσωπεύει ένα νέο επίπεδο δυνατοτήτων τεχνητής νοημοσύνης, επομένως ο "μετρητής" επαναφέρεται και το o αντιπροσωπεύει το openai.

ακριβώς όπως είπε ο ultraman όταν κυκλοφόρησε το o1, το o1, το οποίο μπορεί να εκτελέσει σύνθετη συλλογιστική, είναι η αρχή ενός νέου παραδείγματος.

όσον αφορά τους δύο αριθμούς έκδοσης, την προεπισκόπηση και τη μίνι, οι επιστήμονες του openai επιβεβαίωσαν επίσης ορισμένες από τις εικασίες των χρηστών του διαδικτύου——

η προεπισκόπηση είναι μια προσωρινή έκδοση,η επίσημη έκδοση θα κυκλοφορήσει στο μέλλον(στην πραγματικότητα, η έκδοση προεπισκόπησης είναι ένα πρώιμο σημείο ελέγχου του o1 και).δεν υπάρχει καμία εγγύηση ότι η έκδοση μίνι θα ενημερωθεί στο εγγύς μέλλον.。

κοιτάζοντας αυτήν την εικόνα που κυκλοφόρησε προηγουμένως από το μέλος του openai kevin lu, γίνεται ακόμα πιο ξεκάθαρο.

σε σύγκριση με την προεπισκόπηση, το mini αποδίδει καλά σε ορισμένες εργασίες, ειδικά σε εργασίες που σχετίζονται με κώδικα, και μπορεί να εξερευνήσει περισσότερες αλυσίδες σκέψης, αλλά έχει σχετικά λιγότερη παγκόσμια γνώση.

από την άποψη αυτή, ο επιστήμονας του openai zhao shengjia εξήγησε ότι,το mini είναι ένα εξαιρετικά εξειδικευμένο μοντέλο που εστιάζει μόνο σε ένα μικρό σύνολο δυνατοτήτων, για να μπορέσετε να πάτε πιο βαθιά.

μπορεί να θεωρηθεί ότι αποκαλύπτει έναν γρίφο που είχε λύσει ο ultraman σε αυτό το ζήτημα πριν.

όσον αφορά τη λειτουργία του o1, ο επιστήμονας του openai noam brown κατέστησε επίσης σαφές ότι δεν είναι ένα «σύστημα» που αποτελείται από μοντέλο + cot όπως πιστεύουν ορισμένοι χρήστες του διαδικτύου, αλλάμοντέλα που έχουν εκπαιδευτεί ώστε να έχουν την ικανότητα να δημιουργούν εγγενείς αλυσίδες σκέψης。

ωστόσο, η αλυσίδα σκέψης κατά τη διαδικασία συλλογιστικής θα είναι κρυφή και ο αξιωματούχος έχει ξεκαθαρίσει ότι δεν υπάρχουν σχέδια για την εμφάνιση του διακριτικού στους χρήστες.

τα λίγα νέα που αποκάλυψε το openai είναι ότι τα σχετικά tokens του cot είναι συνοπτικά και δεν είναι εγγυημένα ότι ταιριάζουν πλήρως με τη διαδικασία συλλογισμού.

εκτός από τη λειτουργία συλλογισμού, μπορείτε επίσης να μάθετε σε αυτήν τη δραστηριότητα ερωτήσεων και απαντήσεων,το o1 μπορεί να χειριστεί μεγαλύτερα κείμενα από το gpt-4o και θα συνεχίσει να το κάνει στο μέλλον。

όσον αφορά τις επιδόσεις, στις εσωτερικές δοκιμές του openai,ο1 δείχνει την ικανότητα του φιλοσοφικού συλλογισμού, μπορεί να συλλογιστεί φιλοσοφικά ερωτήματα όπως «τι είναι η ζωή;»

οι ερευνητές χρησιμοποίησαν επίσης το o1 για να δημιουργήσουν ένα bot github ικανό να κάνει ping κώδικα στους κατόχους για έλεγχο.

φυσικά, για κάποιες μη επαγωγικές εργασίες, όπως π.χστη δημιουργική γραφή, η απόδοση του o1 δεν είναι σημαντικά βελτιωμένη σε σύγκριση με το gpt-4o και μερικές φορές είναι ακόμη και ελαφρώς κατώτερη.。

επιπλέον, με βάση ορισμένες ερωτήσεις, το openai είπε ότι μελετά ή σχεδιάζει να μελετήσει ορισμένες ακυκλοφόρητες λειτουργίες για τις οποίες ανησυχούν οι χρήστες του διαδικτύου, αλλά δεν υπάρχει σαφής χρόνος εκκίνησης:

οι κλήσεις εργαλείων δεν υποστηρίζονται ακόμη, αλλά στο μέλλον προγραμματίζονται κλήσεις λειτουργιών και διερμηνείς κώδικα.

οι μελλοντικές ενημερώσεις api θα προσθέσουν δομημένη έξοδο, λέξεις προτροπής συστήματος και λειτουργίες προσωρινής αποθήκευσης λέξεων.

προβλέπεται επίσης βελτίωση της ρύθμισης

οι χρήστες api θα μπορούν να θέτουν τα δικά τους όρια για το χρόνο συμπερασμάτων και την κατανάλωση διακριτικών

το o1 έχει πολλαπλές δυνατότητες, στοχεύοντας το sota σε mmmu και άλλα σύνολα δεδομένων, και θα εφαρμοστεί αργότερα.

όσον αφορά την απόδοση, το openai εργάζεται επίσης για τη μείωση του λανθάνοντος χρόνου και του χρόνου που απαιτείται για την εξαγωγή συμπερασμάτων.

τέλος, υπάρχει το θέμα της τιμής για το οποίο οι άνθρωποι, ειδικά οι χρήστες api, ανησυχούν.

είπε το openai«θα ακολουθήσει την τάση μείωσης των τιμών κάθε 1-2 χρόνια», και η μαζική τιμολόγηση api θα ξεκινήσει επίσης όταν τα όρια χρήσης γίνουν πιο χαλαρά.

επιπλέον, οι χρήστες από την πλευρά του ιστού/εφαρμογής περιορίζονται αυτήν τη στιγμή στην προεπισκόπηση 30 + μίνι 50 μηνυμάτων την εβδομάδα.

αλλά τα καλά νέα είναι ότι μόλις νωρίς σήμερα το πρωί, επειδή οι άνθρωποι ήταν τόσο ενθουσιασμένοι με το o1, πολλοί άνθρωποι εξάντλησαν γρήγορα την ποσόστωσή τους.η ειδική περίπτωση openai επαναφέρει το όριο μία φορά。

— υπερ —

νέα

η o1 πλήρης αλυσίδα σκέψης γίνεται το νούμερο ένα ταμπού στο openai! εάν κάνετε πάρα πολλές ερωτήσεις, περιμένετε να αποκλειστεί ο λογαριασμός σας.

εισαγωγή

τα στοιχεία επικοινωνίας μου