"ο προγραμματισμός ως επάγγελμα τελειώνει σήμερα", το τρομακτικό με το νέο μοντέλο του openai o1

«ο προγραμματισμός ως επάγγελμα τελειώνει σήμερα», το τρομακτικό με το νέο μοντέλο o1 του openai

2024-09-15

συγγραφέας: fanfan, επιμελητής: odette, εικόνα τίτλου από: ai γενιά

θυμάστε ακόμα τον σεισμό των πολυώροφων του openai πριν;

αυτό που πυροδότησε την απόλυση του sam altman, την αποχώρηση του συνιδρυτή greg brockman και την εντατικοποίηση των εσωτερικών συγκρούσεων στο openai ήταν ένα έργο που ονομάζεται q* (προφέρεται q-star).

σύμφωνα με άτομα που γνωρίζουν το θέμα, το έργο q* είχε σημειώσει σημαντική πρόοδο εκείνη την εποχή και μπορούσε ήδη να λύσει βασικά μαθηματικά προβλήματα. σε αντίθεση με τις αριθμομηχανές, οι οποίες μπορούν να επιλύσουν μόνο περιορισμένο αριθμό πράξεων και το gpt-4, που δίνει διαφορετικές απαντήσεις στην ίδια ερώτηση κάθε φορά,το q* μπορεί να έχει ήδη την ικανότητα να γενικεύει, να μαθαίνει και να κατανοεί, κάτι που αποτελεί βασικό βήμα προς την agi.οι ερευνητές του openai έστειλαν επιστολή στο διοικητικό συμβούλιο προειδοποιώντας ότι η μεγάλη ανακάλυψη του q* θα μπορούσε να απειλήσει όλη την ανθρωπότητα, αλλά ο sam altman το έκρυψε αυτό.

το openai έχει υποστεί συγκλονιστικές εσωτερικές αλλαγές και το ίδιο το openai δεν ανταποκρίθηκε ποτέ άμεσα στην ύπαρξη του q*.

σήμερα, το openai κυκλοφόρησε ξαφνικά ένα νέο μοντέλο, το οποίο εξακολουθεί να είναι μια έκδοση προεπισκόπησης.

ένα νέο συλλογιστικό μοντέλο για την επίλυση σύνθετων προβλημάτων, που δεν είναι πλέον η ίδια σειρά με το chatgpt｜openai

o, εξακολουθεί να είναι "omini", το ολοκληρωμένο o, αλλά σύμφωνα με το openai, αυτό το μοντέλο "αντιπροσωπεύει ένα νέο ύψος τεχνητής νοημοσύνης" και είναι πολύ διαφορετικό από το προηγούμενο μεγάλο μοντέλο στις μεθόδους εργασίας, επομένως ένα νέο μοντέλο μπορεί να δημιουργηθεί ξεχωριστά σειρά, μετρώντας από το 1 (gpt5: είμαι μεγάλος!).

όσο για το αν αυτό το μοντέλο θα «απειλεί την ανθρωπότητα», όπως κρίθηκε από τον ilya sutskever και άλλους επαναστάτες πρώην βασικούς επιστήμονες του openai, ωθώντας την ανθρωπότητα στην εποχή agi (τεχνητής νοημοσύνης) χωρίς τέλειους ηθικούς περιορισμούς, μπορείτε να διαβάσετε το άρθρο τότε κρίνετε μόνοι σας.

o1, ξεπερνά τα πάντα

το πρώτο είναι ο γνωστός σύνδεσμος βαθμολογίας.

κάθε γενιά μεγάλων μοντέλων βγαίνει και φτάνει σε πρωτοφανή νέα ύψη, αλλά αυτή τη φορά το o1 είναι ριζικά διαφορετικό.

τα περισσότερα από τα επί του παρόντος δημοφιλή μεγάλα μοντέλα έχουν τη μορφή chatbot, των οποίων οι διαδρομές σκέψης είναι δύσκολο να εξηγηθούν και η κατεύθυνση ανάπτυξής τους είναι πολυτροπική (μπορεί να μιλήσει, να δει και να ακούσει) και μοιάζουν ολοένα και περισσότερο στον τόνο. και αντιδράσεις. το o1 είναι διαφορετικό από αυτά.

πρώτα απ 'όλα, ο στόχος του δεν είναι να γίνεται όλο και πιο γρήγορος ή ακόμα και να γίνεται όλο και πιο αργός.

ο επιστήμονας του openai, noam brown, είπε ότι επί του παρόντος το o1 μπορεί να δώσει απαντήσεις σε λίγα δευτερόλεπτα, αλλά στο μέλλον θα χρειαστεί να μπορεί να σκέφτεται για ώρες, ημέρες ή και εβδομάδες. στη συνέχεια επισυνάπτεται μια εικόνα, η ο1 διέγνωσε μια περίπτωση μετά από περισσότερα από δέκα δευτερόλεπτα σκέψης. τι εννοούσε ο νόαμ μπράουν,ο μεγάλος χρόνος συμπερασμάτων σημαίνει ότι το μοντέλο μπορεί να δημιουργήσει μεγαλύτερες αλυσίδες σκέψης και να διεξάγει βαθύτερη σκέψη.

δεύτερον, το o1 σπάει την αχίλλειο πτέρνα των προηγούμενων μεγάλων γλωσσικών μοντέλων, των μαθηματικών.

το aime, η αμερικανική πρόσκληση για τα μαθηματικά, είναι απλούστερη από την ολυμπιάδα και πολύ πιο δύσκολη από το sat χρησιμοποιείται γενικά για την επιλογή των καλύτερων μαθητών γυμνασίου στα μαθηματικά στις ηνωμένες πολιτείες. όταν ζητήθηκε από τον gpt4-o να γράψει τις ερωτήσεις για τον διαγωνισμό πρόσκλησης, σημείωσε μόνο 12 πόντους, αλλά ο o1 απάντησε στις ερωτήσεις με μία κίνηση και σημείωσε 74 πόντους. εάν κάνετε δειγματοληψία 1.000 φορές και στη συνέχεια παραγγείλετε ξανά τα 1.000 δείγματα με τη συνάρτηση βαθμολόγησης (αυτό θα αντικατοπτρίζει καλύτερα το αναμενόμενο επίπεδο του μοντέλου), το o1 σημείωσε 93 πόντους και μπορεί να είναι μεταξύ των κορυφαίων 500 των ηνωμένων πολιτειών και μπορεί να μπει στη λίστα για το αμερικανικό μαθηματική ολυμπιάδα.

συγκρίνοντας την απόδοση του o1 και του gpt-4o, η μαθηματική πρόοδος είναι πολύ μεγάλη｜openai

αφήστε το o1 να γράψει ερωτήσεις για τη διεθνή ολυμπιάδα πληροφορικής (ioi) του 2024 μέσα σε 10 ώρες, κάθε ερώτηση επιτρέπεται να υποβληθεί έως και 50 φορές και σημείωσε 213 βαθμούς, κατατάσσοντας στο κορυφαίο 49% των ανθρώπινων παικτών.εάν ο αριθμός των υποβολών αυξηθεί σε 10.000, ο o1 μπορεί να κερδίσει 362,14 βαθμούς και μπορεί να πάρει το χρυσό μετάλλιο ioi και να συσταθεί στο πανεπιστήμιο tsinghua.

στην πραγματική δοκιμή, χρησιμοποιήθηκε μια τελειοποιημένη έκδοση του o1, όχι η μελλοντική έκδοση που μπορούμε να χρησιμοποιήσουμε

επιπλέον, υπάρχουν πολλά τεστ που δεν είναι διαθέσιμα. για παράδειγμα, στο gpqa (ένα τεστ νοημοσύνης που συνδυάζει τη φυσική, τη χημεία και τη βιολογία), το o1 ξεπέρασε τα διδακτορικά σε συναφή πεδία σε ορισμένες ερωτήσεις.

εν συντομία,η εμπλοκή σε ένα ήδη ισχυρό πεδίο δεν είναι πλέον ο σκοπός του o1. είναι να επιτύχει καινοτομίες στη σύνθετη λογική στις οποίες τα μεγάλα γλωσσικά μοντέλα δεν είναι καλά.

ένα βήμα πίσω, δύο βήματα μπροστά

όπως αναφέρθηκε παραπάνω, η ταχύτητα αντίδρασης του o1 έχει επιβραδυνθεί.

χρειάζεται περισσότερος χρόνος για να σκεφτείς πριν αντιδράσεις, στη συνέχεια τελειοποιεί τη διαδικασία σκέψης, δοκιμάζει διαφορετικές στρατηγικές και μαθαίνει από τα λάθη της. αυτό είναι τρομακτικό.

επιπλέον, το o1 δεν είναι ένα πολυτροπικό μοντέλο τώρα που ξόδεψε δύο χρόνια κάνοντας το μεγάλο μοντέλο ικανό να βλέπει και να ακούει τώρα έχει επιστρέψει στην αρχική του φύση και το o1 μπορεί να δεχτεί μόνο την εισαγωγή χαρακτήρων.

πιο αργό και μονότονο, για το o1,είναι ένα βήμα πίσω και δύο βήματα μπροστά. οι άνθρωποι που έχουν χρησιμοποιήσει το o1 λένε ότι το o1 είναι το πιο έξυπνο μοντέλο που έχουν χρησιμοποιήσει ποτέ και οι συζητήσεις μαζί του έχουν ξεπεράσει τις προηγούμενες μικροκαβγάδες.

σε μια δοκιμή, ο χρήστης έθεσε στο o1 μια λογική παράδοξη ερώτηση: "πόσες λέξεις υπάρχουν στην απάντηση σε αυτήν την ερώτηση;"

ο 1 σκέφτηκε για δέκα δευτερόλεπτα και έδειξε τη διαδικασία σκέψης του. πρώτα απ 'όλα, σκέφτηκε ότι αυτό είναι ένα αυτοαναφορικό παράδοξο, ή μια επαναλαμβανόμενη ερώτηση, όταν η απάντηση δεν καθορίζεται, ο αριθμός των λέξεων στην απάντηση δεν μπορεί να προσδιοριστεί.«η αποφυγή περιττών εκφράσεων είναι σημαντική για σαφείς και συνοπτικές απαντήσεις». το επόμενο βήμα είναι να μετρήσετε τις λέξεις, όπου οι αριθμοί που εμφανίζονται στην πρόταση πρέπει να ταιριάζουν με τον αριθμό των λέξεων της πρότασης. στη συνέχεια, απαρίθμησε πολλές προτάσεις και βρήκε την πιο κατάλληλη επιλογή που ταιριάζει.

έτσι απάντησε: «υπάρχουν επτά λέξεις στην απάντηση».

αυτή η συλλογιστική διαδικασία δεν διαφέρει πολύ από τη συλλογιστική μου διαδικασία｜x

σε ένα άλλο παράδειγμα, το o1 χρειάστηκε 5,6 δευτερόλεπτα και 631 μάρκες για να απαντήσει στην απλή ερώτηση "πόσα r υπάρχουν στο straberry;"

από το παραπάνω παράδειγμα φαίνεται ότιη μέθοδος εργασίας του o1 είναι θεμελιωδώς διαφορετική από το chatgpt.τώρα το o1 έχει προσθέσει διακριτικά συλλογισμού, τα οποία θα χωρίσουν μια ερώτηση σε πολλά βήματα, θα τα σκεφτούν ξεχωριστά και στη συνέχεια θα αφαιρέσουν τα διακριτικά συλλογισμού για να δημιουργήσουν απαντήσεις.

το παρακάτω σχήμα δείχνει πώς λειτουργεί η αλυσίδα ιδεών, γεγονός που εξηγεί επίσης γιατί η ταχύτητα απόκρισης του o1 έχει γίνει πιο αργή.

όταν χρησιμοποιείτε το o1, μπορείτε επίσης να χρησιμοποιήσετε μερικά κλασικά λογικά προβλήματα και μαθηματικά προβλήματα για να ελέγξετε την ικανότητά του.

ίσως όταν απαντάτε σε απλές ερωτήσεις, η διαφορά μεταξύ του αν πρέπει να εκτελούνται πολλαπλοί κύκλοι συλλογιστικής δεν είναι προφανής, αλλά εάν χρησιμοποιείται για την επίλυση σύνθετων προβλημάτων στη σύνταξη κώδικα, την εκτέλεση μαθηματικών προβλημάτων και την επιστήμη, αυτό το είδος ικανότητας σκέψης είναι απαραίτητη.

το openai είπε στην εφημερίδα ότι τώρα, το ιατρικό προσωπικό μπορεί να χρησιμοποιήσει το o1 για να σχολιάσει δεδομένα αλληλουχίας κυττάρων, οι φυσικοί μπορούν να χρησιμοποιήσουν το o1 για να δημιουργήσουν τους πολύπλοκους μαθηματικούς τύπους που απαιτούνται για την κβαντική οπτική και οι προγραμματιστές σε διάφορους τομείς μπορούν να χρησιμοποιήσουν το o1 για να δημιουργήσουν και να εκτελέσουν εργασίες πολλαπλών βημάτων διαδικασία.

τι περισσότερο,αυτό είναι το πρωτότυπο ενός τρόπου σκέψης και η πρώιμη μορφή σοφίας.

νέα μοντέλα, νέες συνήθειες

δεδομένου ότι ο τρόπος που λειτουργεί το o1 είναι διαφορετικός από το chatgpt, τα σεμινάρια που είδα πριν σας διδάσκουν πώς να γράφετε προτροπές δεν ισχύουν πλέον - στην τρέχουσα κατάσταση, πάρα πολλές περιγραφές θα καταναλώσουν μόνο μεγάλο αριθμό διακριτικών, αλλά δεν θα τα αποκτήσουν απαραίτητα καλύτερα αποτελέσματα.

για να γίνει αυτό ξεκάθαρο σε όλους τους χρήστες, το openai έχει γράψει νέες οδηγίες για διακριτικά. στον οδηγό, το openai εξηγεί ότι οι καλύτερες προτροπές στο o1 είναι άμεσες και συνοπτικές. ακολουθούν μερικές επίσημες συστάσεις:

οι προτροπές πρέπει να είναι απλές και άμεσες. τα μοντέλα ανταποκρίνονται καλύτερα σε σύντομες, σαφείς οδηγίες που δεν απαιτούν υπερβολική καθοδήγηση.

αποφύγετε τις αλυσίδες σκέψης στις προτροπές. το o1 κάνει τον δικό του εσωτερικό συλλογισμό, επομένως είναι άχρηστο να το καθοδηγείς βήμα-βήμα και να εξηγείς την πορεία σκέψης σου.

είναι καλύτερα να χρησιμοποιείτε οριοθέτες για να βελτιώσετε τη σαφήνεια. χρησιμοποιήστε οριοθέτες όπως "", <> και § για να διακρίνετε με σαφήνεια τα διάφορα μέρη των μηνυμάτων για να βοηθήσετε το μοντέλο να επεξεργαστεί προβλήματα σε παρτίδες.

περιορίστε την ανάκτηση πρόσθετου περιβάλλοντος στη βελτιωμένη παραγωγή. παρέχετε μόνο τις πιο σχετικές πληροφορίες για να αποφύγετε την υπερβολική σκέψη του μοντέλου.

όταν είδα το τρίτο άρθρο, ένιωσα λίγο οικεία με αυτή τη μορφή. οι μελλοντικοί προγραμματιστές είναι πιθανό να χρησιμοποιούν προγραμματισμό φυσικής γλώσσας. ακολουθώντας τις πιο πρόσφατες οδηγίες, μια καλή προτροπή θα μοιάζει με αυτό:

ή κάτι σαν αυτό:

§ οικοδεσπότης § συγγραφέας § ιδιοκτήτης μπαρ § ελαιοχρωματιστής § δερματουργός § αργυροχόος § τραγουδιστής § ντέφι καλλιτέχνης § σακίδος § χρυσό αριστερό μάγουλο § γάλλος ιππότης § μαθητής ζεν §

αφήστε το μοντέλο να κάνει τα υπόλοιπα.

δώσε μου ένα λεπτό να φτιάξω ένα τρισδιάστατο φίδι

υπάρχει λόγος να χρησιμοποιούμε το φίδι ως παράδειγμα. λιγότερο από μία ημέρα μετά την κυκλοφορία του o1, οι άνθρωποι έχουν κάνει πολλές προσπάθειες με αυτό, συμπεριλαμβανομένου του 3d snake.

ο @ammaar reshi στο x χρησιμοποίησε εξαιρετικά απλές προτροπές για να γράψει ένα τρισδιάστατο φίδι σε μόλις ένα λεπτό και ο o1 του έμαθε επίσης πώς να χρησιμοποιεί τον κώδικα.

έχετε μάθει να γράφετε προτροπές; ｜@ammaar reshi

αν και το αποτέλεσμα είναι λίγο χοντροκομμένο, κανείς δεν μπορεί να πει ότι δεν είναι ένα άπληστο φίδι.

και είναι πολύ διασκεδαστικό @ammaar reshi

το netizen @james wade χρησιμοποίησε το o1 για να δημιουργήσει μια εφαρμογή ανάλυσης δεδομένων που μπορεί να εμφανίσει μια σύντομη περιγραφή και παράδειγμα για κάθε διανομή χρειάστηκαν μόνο 15 λεπτά, συμπεριλαμβανομένου του χρόνου ανάπτυξης. είπε: ποτέ δεν είχα σκεφτεί να κάνω κάτι τέτοιο πριν ήταν πολύ ενοχλητικό.

το εφέ είναι όπως φαίνεται στην εικόνα｜@james wade

ένας άλλος μηχανικός full-stack @dallas lones, ο οποίος έχει εργαστεί για 16 χρόνια, είπε με συγκίνηση αφού έφτιαξε μια εφαρμογή ανάπτυξης full-stack react native σε λίγα λεπτά,δεν ξεκίνησα μια επιχείρηση το συντομότερο δυνατό, αλλά τώρα αυτή η χειροτεχνία έχει γίνει τα δάκρυα των καιρών.είπε,«ο προγραμματισμός ως επάγγελμα τελειώνει επίσημα σήμερα».

υπάρχουν περισσότεροι άνθρωποι που αμφισβητούν τα όρια του o1, και κάποιοι το παίζουν ήδη«ας δούμε ποιανού η ερώτηση είναι πιο δύσκολη και μπορεί να κάνει την ο1 να σκεφτεί για μεγαλύτερο χρονικό διάστημα».παιχνίδι.

επί του παρόντος, το o1 είναι ανοιχτό πρώτα στους χρήστες chatgpt plus και team, ενώ η πρόσβαση api θα ανοίξει πρώτα σε χρήστες επιπέδου 5 που ξοδεύουν περισσότερα από 1.000 $ στο openai api. στο επόμενο βήμα, το openai θα ανοίξει σταδιακά την έκδοση χαμηλού προφίλ του o1-mini σε δωρεάν χρήστες.

θα είναι αυτό το ηλιοβασίλεμα της ανθρωπότητας;

νέα

«ο προγραμματισμός ως επάγγελμα τελειώνει σήμερα», το τρομακτικό με το νέο μοντέλο o1 του openai

εισαγωγή

τα στοιχεία επικοινωνίας μου