βαρύς! ένα μεγάλο συλλογιστικό μοντέλο openai που μπορεί να "σκέφτεται τη λογική επίλυσης προβλημάτων" είναι στην αγορά και η γνώση θα μεταβεί στο "επίπεδο ενός διδακτορικού φοιτητή στην επιστήμη"

βαρύς! το μεγάλης κλίμακας συλλογιστικό μοντέλο openai που μπορεί "να σκεφτεί τη λογική επίλυσης προβλημάτων" είναι στη σκηνή και η γνώση θα μεταβεί στο "επίπεδο ενός διδακτορικού φοιτητή στην επιστήμη"

2024-09-13

περίπου στη 1 π.μ. της παρασκευής, ώρα πεκίνου, η εποχή της τεχνητής νοημοσύνης εγκαινίασε ένα νέο σημείο εκκίνησης — μεγάλα μοντέλα ικανά για γενική και σύνθετη λογική ήρθαν τελικά στο προσκήνιο.

πηγή εικόνας: visual china-vcg31n2008743681

η openai ανακοίνωσε στην επίσημη ιστοσελίδα της ότι,ξεκίνησε να προωθεί το μοντέλο προεπισκόπησης openai o1 σε όλους τους συνδρομητές - το πολυαναμενόμενο μεγάλο μοντέλο "strawberry". το openai δήλωσε ότι για πολύπλοκες συλλογιστικές εργασίες,το νέο μοντέλο αντιπροσωπεύει ένα νέο επίπεδο δυνατοτήτων τεχνητής νοημοσύνης, οπότε αξίζει να επαναφέρετε το πλήθος στο 1 και να του δώσετε ένα νέο όνομα που είναι διαφορετικό από τη σειρά "gpt-4".

τα χαρακτηριστικά των μεγάλων μοντέλων συμπερασμάτων είναιη τεχνητή νοημοσύνη θα αφιερώσει περισσότερο χρόνο στη σκέψη πριν απαντήσει, όπως οι άνθρωποι σκέφτονται τη διαδικασία επίλυσης προβλημάτων. η λογική πίσω από τα προηγούμενα μεγάλα μοντέλα ήταν να προβλέψουν την αλληλουχία δημιουργίας λέξεων με την εκμάθηση μοτίβων σε μεγάλο αριθμό συνόλων δεδομένων αυστηρά μιλώντας, δεν καταλάβαιναν πραγματικά την ερώτηση.

ως η πρώτη έκδοση του μοντέλου της σειράς o1, το openai κυκλοφόρησε μόνο την έκδοση προεπισκόπησης o1 και την έκδοση μίνι o1-mini, και κυκλοφόρησε σταδιακά σε χρήστες που πληρώνουν, δωρεάν χρήστες και προγραμματιστές και η τιμή για τους προγραμματιστές είναι αρκετά ακριβή .

το κόστος χρήσης του μοντέλου o1 είναι τουλάχιστον 3 φορές μεγαλύτερο από αυτό του gpt-4o.

σύμφωνα με αναφορές, το νέο μοντέλο o1 μπορεί να απαντήσει σε πιο σύνθετα προβλήματα προγραμματισμού, μαθηματικών και επιστημονικών προβλημάτων μέσω της νέας μεθόδου εκπαίδευσης που κρύβεται πίσω από αυτό και είναι πιο γρήγορο από τους ανθρώπους. η μικρότερη, φθηνότερη έκδοση μίνι εστιάζει σε περιπτώσεις χρήσης προγραμματισμού.

οι χρήστες επί πληρωμή chatgpt plus και team θα έχουν άμεση πρόσβαση και στα δύο μοντέλα, επιλέγοντας χειροκίνητα από το αναπτυσσόμενο μενού του επιλογέα μοντέλων ai στη διεπαφή χρήστη. και οι δύο λειτουργίες θα είναι διαθέσιμες στους χρήστες chatgpt enterprise και edu την επόμενη εβδομάδα, ενώ η πρόσβαση στο o1-mini θα είναι διαθέσιμη σε όλους τους δωρεάν χρήστες σε άγνωστη στιγμή στο μέλλον. το openai ελπίζει να επιλέξει αυτόματα το σωστό μοντέλο βάσει προτροπών στο μέλλον.

ωστόσο, η πρόσβαση προγραμματιστών στο o1 είναι πολύ ακριβή στο api (application programming interface), το o1-preview χρεώνει 15 $ ανά 1 εκατομμύριο διακριτικά εισόδου, τρεις φορές το κόστος του gpt-4o και 60 $ ανά 1 εκατομμύριο μάρκες τέσσερις φορές το κόστος του gpt-4o. ένα εκατομμύριο διακριτικά είναι το μέγεθος του μπλοκ κειμένου που αναλύει το μοντέλο, το οποίο ισοδυναμεί με περίπου 750.000 λέξεις.

ο jerry tworek, επικεφαλής έρευνας στο openai, είπε στα μέσα ενημέρωσης,o1η μέθοδος εκπαίδευσης πίσω από αυτό είναι θεμελιωδώς διαφορετική από τα προηγούμενα μοντέλα.

πρώτον, το o1 "εκπαιδεύτηκε χρησιμοποιώντας έναν εντελώς νέο αλγόριθμο βελτιστοποίησης και ένα νέο σύνολο δεδομένων εκπαίδευσης ειδικά προσαρμοσμένο για αυτό", το οποίο περιείχε "δεδομένα συμπερασμάτων" και επιστημονική βιβλιογραφία ειδικά προσαρμοσμένη για αυτό.

δεύτερον, η προηγούμενη μέθοδος εκπαίδευσης μοντέλου gpt ήταν η μίμηση των κανόνων/παραδειγμάτων του συνόλου δεδομένων, ενώ το o1 χρησιμοποιεί την "ενισχυτική μάθηση" για να διδάξει στο μοντέλο να λύνει προβλήματα μόνο του μέσω ανταμοιβών και τιμωριών και στη συνέχεια μέσω της "αλυσίδας ιδεών". " (αλυσίδα ιδεών) σκέψεων) για την αντιμετώπιση προβλημάτων ερωτημάτων χρήστη και την παροχή μιας συνοπτικής εκδοχής της αλυσίδας σκέψης, παρόμοια με τον τρόπο που οι άνθρωποι αντιμετωπίζουν τα προβλήματα βήμα προς βήμα.

στην εικόνα στα δεξιά, μπορείτε να κάνετε κλικ στην αλυσίδα των ιδεών για να δείτε πώς "σκέφτεται" το μοντέλο o1

ένα διάγραμμα που δείχνει την αλυσίδα των ιδεών για ένα σύνθετο μαθηματικό πρόβλημα

το openai πιστεύει ότι αυτή η νέα μέθοδος εκπαίδευσης θα καταστήσει το μοντέλο o1 πιο ακριβές και θα μειώσει το πρόβλημα της "ψευδαίσθησης" της δημιουργίας απαντήσεων, αλλά δεν μπορεί να εξαλείψει εντελώς την εμφάνιση "ψευδαίσθησης". η κύρια διαφορά μεταξύ του νέου μοντέλου και του gpt-4o είναι ότι μπορεί να λύσει καλύτερα σύνθετα προβλήματα, όπως προγραμματισμό και μαθηματικά, βελτιώνοντας παράλληλα τη συλλογιστική του διαδικασία, δοκιμάζοντας διαφορετικές στρατηγικές και εντοπίζει και διορθώνει λάθη στις δικές του απαντήσεις.

η γνώση θα μεταβεί στο "επίπεδο ενός διδακτορικού φοιτητή στην επιστήμη"

το openai εξήγησε ότι το gpt-4, που κυκλοφόρησε το 2023, είναι παρόμοιο με το επίπεδο νοημοσύνης των μαθητών γυμνασίου, ενώ το gpt-5 ολοκληρώνει την ανάπτυξη της τεχνητής νοημοσύνης από «μαθητές γυμνασίου σε διδακτορικό». αυτό το μοντέλο o1 είναι ένα βασικό βήμα.

σε σύγκριση με τα υπάρχοντα μεγάλα μοντέλα όπως το gpt-4o, το openai o1 μπορεί να λύσει πιο δύσκολα προβλήματα συλλογιστικής βελτιώνοντας παράλληλα τα μηχανικά ελαττώματα που υπάρχουν σε προηγούμενα μοντέλα.

για παράδειγμα, το νέο μοντέλο μπορεί να μετρήσει πόσα «r» υπάρχουν στη φράουλα.

ταυτόχρονα, η τεχνητή νοημοσύνη θα είναι πιο οργανωμένη όταν απαντά σε ερωτήσεις προγραμματισμού.πριν ξεκινήσετε να γράφετε κώδικα, σκεφτείτε ολόκληρη τη διαδικασία απάντησης.και μετά εξάγετε τον κωδικό.

για παράδειγμα, στην εργασία γραφής ποίησης με προκαθορισμένες συνθήκες (για παράδειγμα, η τελευταία λέξη της δεύτερης πρότασης πρέπει να τελειώνει με i), το gpt-4o, το οποίο "σηκώνει το στυλό και γράφει", όντως δίνει μια απάντηση, αλλά συχνά πληρούνται μόνο μέρος των προϋποθέσεων επίσης δεν αυτοδιορθώνεται. αυτό σημαίνει ότι το ai πρέπει να συναντήσει τη σωστή απάντηση την πρώτη φορά που δημιουργείται, διαφορετικά θα κάνει λάθη. αλλά στο μοντέλο o1, η τεχνητή νοημοσύνη θα συνεχίσει να δοκιμάζει και να λάθη και να γυαλίζει τις απαντήσεις της, βελτιώνοντας έτσι σημαντικά την ακρίβεια και την ποιότητα των παραγόμενων αποτελεσμάτων.

αυτό που είναι ενδιαφέρον είναι ότι όταν κάνετε κλικ στη διαδικασία σκέψης του ai, θα εμφανιστεί επίσης το ai λέγοντας "σκέφτομαι για αυτό, είναι εντάξει να το κάνω αυτό;", "ω, δεν έχω αρκετό χρόνο, εγώ πρέπει να δώσουν την απάντηση το συντομότερο δυνατό» κ.λπ. το openai επιβεβαίωσε ότι αυτό που παρουσιάζεται εδώ δεν είναι η αρχική αλυσίδα σκέψης, αλλά μια "σύνοψη που δημιουργείται από το μοντέλο" και η εταιρεία παραδέχτηκε επίσης ειλικρινά ότι υπάρχουν παράγοντες για τη διατήρηση ενός "ανταγωνιστικού πλεονεκτήματος" εδώ.

ο jerry tworek, επικεφαλής έρευνας στο openai, αποκάλυψε ότι η εκπαίδευση πίσω από το μοντέλο o1 είναι θεμελιωδώς διαφορετική από τα προηγούμενα προϊόντα.ενώ τα προηγούμενα μοντέλα gpt σχεδιάστηκαν για να μιμούνται μοτίβα στα δεδομένα εκπαίδευσης τους, το o1 εκπαιδεύτηκε να λύνει προβλήματα από μόνο του. στη διαδικασία της ενισχυτικής μάθησης, χρησιμοποιούνται μηχανισμοί ανταμοιβής και τιμωρίας για την «εκπαίδευση» της τεχνητής νοημοσύνης στη χρήση «αλυσίδων σκέψης» για την αντιμετώπιση προβλημάτων, όπως ακριβώς ο τρόπος με τον οποίο οι άνθρωποι μαθαίνουν να αποσυναρμολογούν και να αναλύουν προβλήματα.

σύμφωνα με το τεστ,το μοντέλο o1 μπόρεσε να σημειώσει 83% στις κατατακτήριες εξετάσεις της διεθνούς μαθηματικής ολυμπιάδας, ενώ το gpt-4o μπορούσε να λύσει σωστά μόνο το 13% των προβλημάτων.στον διαγωνισμό ικανότητας προγραμματισμού codeforces, το μοντέλο o1 σημείωσε 89%, ενώ το gpt-4o μόλις 11%.

το openai είπε ότι βάσει δοκιμών, στην επόμενη ενημερωμένη έκδοση,η τεχνητή νοημοσύνη μπορεί να αποδώσει σε επίπεδο διδακτορικού σε προκλητικά σημεία αναφοράς στη φυσική, τη χημεία και τη βιολογία。

μειονεκτήματα: αδυναμία περιήγησης σε ιστοσελίδες σε πραγματικό χρόνο, αδυναμία μεταφόρτωσης αρχείων και εικόνων, έλλειψη εκτεταμένης παγκόσμιας γνώσης ή επιρρεπής σε παραισθήσεις

αλλά ως αρχική έκδοση του μοντέλου o1, η έκδοση o1-preview που κυκλοφόρησε σήμερα έχει επίσης εμφανείς ελλείψεις. για παράδειγμα, είναι απλώς μια "έκδοση μόνο κειμένου" που δεν μπορεί προσωρινά να περιηγηθεί σε πληροφορίες ιστού και να ανεβάσει αρχεία και εικόνες, πράγμα που σημαίνει ότι δεν έχει πολλές από τις λειτουργίες του chatgpt περιπτώσεις χρήσης και υπάρχουν περιορισμοί χρήσης , η έκδοση προεπισκόπησης o1 έχει εβδομαδιαίο όριο 30 μηνυμάτων και η μίνι έκδοση έχει εβδομαδιαίο όριο 50 μηνυμάτων.

άλλοι περιορισμοί που αναφέρθηκαν περιλαμβάνουν: το μοντέλο o1 δεν είναι τόσο ικανό όσο το gpt-4o σε πολλούς τομείς και έχει κακή απόδοση σε πραγματικές γνώσεις για τον κόσμο μόνο ένα μοντέλο καθαρού κειμένου, χωρίς την ικανότητα να αιτιολογεί συγκεκριμένα έγγραφα ή να συλλέγει πληροφορίες σε πραγματικό χρόνο από το δίκτυο.

επιπλέον, το να αφήνεις το μοντέλο ai να παίζει tic-tac-toe θεωρούνταν πάντα πρόβλημα στη βιομηχανία. .

το openai παραδέχτηκε επίσης σε ένα τεχνικό έγγραφο ότι είχε λάβει κάποια "ανέκδοτα σχόλια" ότι η προεπισκόπηση o1 και η mini έκδοση ήταν πιο πιθανό να παράγουν "ψευδαισθήσεις" από το gpt-4o και η μίνι έκδοσή του, δηλαδή η τεχνητή νοημοσύνη ήταν ακόμα πολύ απαντήσεις με αυτοπεποίθηση και το o1 σπάνια θα παραδεχτεί ότι δεν ξέρει την απάντηση σε μια ερώτηση.

το techcrunch, ένα γνωστό τεχνολογικό μέσο ενημέρωσης, επεσήμανε ότι το openai επεσήμανε σε μια ανάρτηση ιστολογίου που σχετίζεται με το μοντέλο o1 ότι αποφάσισε να μην δείξει στους χρήστες την αρχική "αλυσίδα σκέψης" αυτού του νέου μοντέλου, αλλά επέλεξε να δώσει μια περίληψη του η αλυσίδα σκέψης στην απάντηση ο σκοπός είναι να διατηρήσουμε ένα «ανταγωνιστικό πλεονέκτημα» και να αντισταθμίσουμε πιθανές ελλείψεις, «προσπαθούμε να διδάξουμε το μοντέλο να αναπαράγει στις απαντήσεις του τυχόν χρήσιμες ιδέες στην αλυσίδα της σκέψης».

καθημερινές οικονομικές ειδήσεις ολοκληρωμένη δημόσια ενημέρωση

καθημερινά οικονομικά νέα

αναφορά/σχόλια

νέα

το κόστος χρήσης του μοντέλου o1 είναι τουλάχιστον 3 φορές μεγαλύτερο από αυτό του gpt-4o.

η γνώση θα μεταβεί στο "επίπεδο ενός διδακτορικού φοιτητή στην επιστήμη"

εισαγωγή

τα στοιχεία επικοινωνίας μου