αργή και ακριβή; το μοντέλο συμπερασμάτων openai "strawberry" είναι εδώ, πόσο μακριά είναι το gpt-5;

2024-09-13

το «strawberry» του openai είναι επιτέλους εδώ.

στις 12 σεπτεμβρίου, τοπική ώρα, ο κολοσσός της τεχνητής νοημοσύνης (ai) openai κυκλοφόρησε τη σειρά μοντέλων συμπερασμάτων τεχνητής νοημοσύνης openai o1 με την κωδική ονομασία "strawberry", συμπεριλαμβανομένου του openai o1-preview και μιας μικρής έκδοσης του o1-mini.

σύμφωνα με το openai, ο o1 θα αφιερώσει περισσότερο χρόνο για να σκεφτεί προβλήματα πριν αντιδράσει, όπως και οι άνθρωποι. μέσω της εκπαίδευσης, έμαθα να τελειοποιώ τη διαδικασία σκέψης μου, να δοκιμάζω διαφορετικές στρατηγικές και να αναγνωρίζω τα λάθη μου. αφορμή για σύνθετες εργασίες και επίλυση πιο δύσκολων προβλημάτων από προηγούμενα επιστημονικά, κωδικοποιητικά και μαθηματικά μοντέλα.

το openai δήλωσε ότι αυτή η σειρά μοντέλων είναι μια σημαντική πρόοδος για πολύπλοκες εργασίες συλλογισμού, επομένως επαναφέρει επίσης τον μετρητή προϊόντος στο 1 και το ονόμασε openai o1. το "o" στο όνομα μπορεί να αναφέρεται στον ωρίωνα.

η ισχυρότερη συλλογιστική ικανότητα, η αλυσίδα σκέψης παρέχει νέες ευκαιρίες για την ασφάλεια του μοντέλου

το project «strawberry» ονομαζόταν παλαιότερα «q*», που ήταν και ο λόγος που πυροδότησε τη «δικαστική μάχη» του openai και οδήγησε στην ξαφνική απόλυση του διευθύνοντος συμβούλου της εταιρείας sam altman. εκείνη την εποχή, η επικεφαλής τεχνολογίας του openai, mira murati, είπε στους υπαλλήλους ότι μια επιστολή σχετικά με την ανακάλυψη τεχνητής νοημοσύνης q* (προφέρεται q-star) ώθησε το διοικητικό συμβούλιο να απολύσει, σύμφωνα με πηγές.

η πρόοδος του openai στο q* οδήγησε ορισμένους γνώστες των εταιρειών να πιστέψουν ότι αυτή μπορεί να είναι η σημαντική ανακάλυψη τους στην εύρεση «υπερνοημοσύνης (agi, τεχνητή γενική νοημοσύνη).»

σύμφωνα με επίσημες πληροφορίες, το o1 έχει πολλές δυνατότητες που ξεπερνούν κατά πολύ αυτές του gpt-4o. κατατάχθηκε στην 89η θέση στο codeforces, κατατάχθηκε μεταξύ των 500 κορυφαίων μαθητών στη χώρα στην αμερικανική μαθηματική ολυμπιάδα (aime) και ξεπέρασε το επίπεδο διδακτορικού διπλώματος ανθρώπου.

σύμφωνα με αναφορές, παρόμοιο με το πώς οι άνθρωποι μπορεί να σκέφτονται για μεγάλο χρονικό διάστημα πριν απαντήσουν σε ένα δύσκολο πρόβλημα, το o1 χρησιμοποιεί επίσης μια σειρά από σκέψεις όταν προσπαθεί να λύσει ένα πρόβλημα. μέσω της ενισχυτικής μάθησης, ο o1 μπορεί να μάθει να ακονίζει την αλυσίδα σκέψης του και να βελτιώνει τις στρατηγικές που χρησιμοποιεί. μαθαίνει να αναγνωρίζει και να διορθώνει λάθη, να αναλύει τα δύσκολα βήματα σε πιο απλά και να δοκιμάζει διαφορετικές προσεγγίσεις όταν η τρέχουσα δεν λειτουργεί.

το openai είπε ότι η χρήση αλυσίδων σκέψης μπορεί να βελτιώσει σημαντικά την ασφάλεια και τη συνέπεια, επειδή η σκέψη του μοντέλου μπορεί να παρατηρηθεί με σαφή τρόπο και η συλλογιστική του μοντέλου σχετικά με τους κανόνες ασφαλείας είναι πιο ισχυρή σε σενάρια εκτός διανομής.

ο xu li, εκτελεστικός πρόεδρος και διευθύνων σύμβουλος της sensetime, έχει πει στο παρελθόν ότι στο μέλλον, το εάν ένα μοντέλο είναι έξυπνο ή όχι εξαρτάται εξ ολοκλήρου από το εάν η μεθοδολογία για τη δημιουργία δεδομένων της αλυσίδας σκέψης μοντέλου είναι αρκετά ισχυρή και εάν αυτή η αρκετά ισχυρή μεθοδολογία μπορεί να είναι βιώσιμη. και επαναληπτικό.

μερικό στιγμιότυπο οθόνης της αρχικής ολοκληρωμένης αλυσίδας σκέψης του openai o1

ωστόσο, το openai επέλεξε τελικά να μην δείξει την αρχική αλυσίδα σκέψης στον χρήστη, αλλά να εμφανίσει μια περίληψη της αλυσίδας σκέψης. το openai εξήγησε περαιτέρω: "οι κρυφές αλυσίδες σκέψης παρέχουν μια μοναδική ευκαιρία παρακολούθησης μοντέλων. υποθέτοντας ότι το μοντέλο είναι πιστά αναγνώσιμο, τότε οι κρυφές αλυσίδες σκέψης μας επιτρέπουν να "διαβάζουμε" τις σκέψεις του μοντέλου και να κατανοούμε τη διαδικασία σκέψης του. για παράδειγμα, στο μέλλον μπορεί να θέλει να παρακολουθεί τις αλυσίδες σκέψης για ενδείξεις χειραγώγησης χρηστών «θέλω οι χρήστες να βλέπουν απευθείας ασυνεπείς αλυσίδες σκέψης».

επί του παρόντος, τα μοντέλα o1 είναι διαθέσιμα για χρήστες plus και team του chatgpt και οι χρήστες επιχειρήσεων και εκπαίδευσης θα μπορούν να τα χρησιμοποιούν από την επόμενη εβδομάδα.

πιο αργός αλλά πιο ακριβός, όχι ο «διάδοχος» του gpt-4o

επί του παρόντος, το εβδομαδιαίο όριο μηνυμάτων είναι 30 για το o1-preview και 50 για το o1-mini. το openai είπε ότι εργάζεται σκληρά για να αυξήσει το όριο μηνυμάτων και να επιτρέψει στο chatgpt να επιλέγει αυτόματα την κατάλληλη λειτουργία με βάση δεδομένες προτροπές.

από την πλευρά του api (διασύνδεση προγραμματισμού εφαρμογών), το o1-preview χρεώνει 15 $ ανά 1 εκατομμύριο διακριτικά εισόδου (τα μεγάλα μοντέλα διαχωρίζουν το κείμενο σε λέξεις, σύνολα χαρακτήρων ή συνδυασμούς λέξεων και σημείων στίξης) και 60 $ ανά 1 εκατομμύριο διακριτικά εξόδου . σε σύγκριση με το gpt-4o, το κόστος εισόδου είναι 3 φορές και το κόστος εξόδου είναι 4 φορές.

το o1-mini είναι πιο γρήγορο στην τοποθέτηση και πιο αποδοτικό από πλευράς κόστους. λέγεται επίσης ότι έχει εξαιρετική απόδοση στα μαθηματικά και στον προγραμματισμό σε o1-preview με υψηλότερα όρια ρυθμού και χαμηλότερο λανθάνοντα χρόνο, το o1-mini είναι 80% φθηνότερο από το o1-preview για χρήστες api.

άλλα μειονεκτήματα είναι επίσης προφανή το openai o1 είναι πιο αργό από άλλα μοντέλα. σύμφωνα με αναφορές ξένων μέσων, μπορεί να χρειαστούν περισσότερα από 10 δευτερόλεπτα για να απαντήσει το o1 σε ορισμένες ερωτήσεις και το μοντέλο επιλέγει να εμφανίζει την πρόοδο εμφανίζοντας ετικέτες για τις δευτερεύουσες εργασίες που εκτελούνται αυτήν τη στιγμή.

ταυτόχρονα, δεδομένης της μη προβλεψιμότητας των μοντέλων γενετικής τεχνητής νοημοσύνης, το o1 μπορεί να έχει άλλα ελαττώματα και περιορισμούς. για παράδειγμα, μερικές φορές μπορεί να γίνουν λάθη σε ένα παιχνίδι τικ-τακ. σε ένα τεχνικό έγγραφο, το openai είπε ότι ορισμένοι δοκιμαστές είχαν φήμη ότι το o1 ήταν πιο επιρρεπές σε παραισθήσεις από το gpt-4o και ήταν λιγότερο πρόθυμο να παραδεχτεί όταν δεν γνώριζε την απάντηση σε μια ερώτηση.

επιπλέον, το o1 δεν είναι επί του παρόντος σε θέση να περιηγηθεί στον ιστό ή να αναλύσει αρχεία.

ο altman παραδέχτηκε ειλικρινά ότι το o1 είναι η πιο ισχυρή και ευθυγραμμισμένη σειρά μοντέλων του openai αυτή τη στιγμή, αλλά εξακολουθεί να έχει ελαττώματα.

ο πρόεδρος του openai, γκρεγκ μπρόκμαν, δήλωσε επίσης ότι η τεχνολογία o1 βρίσκεται ακόμα στα αρχικά της στάδια και ότι το openai διερευνά ενεργά, συμπεριλαμβανομένης της αξιοπιστίας, των παραισθήσεων και της ευρωστίας (σταθερότητας) έναντι των επιτιθέμενων.

το openai είπε ότι ως πρώιμο μοντέλο, το openai o1 δεν διαθέτει ακόμη πολλές από τις δυνατότητες που κάνουν το chatgpt χρήσιμο, όπως η περιήγηση σε πληροφορίες δικτύου, η μεταφόρτωση αρχείων και εικόνων κ.λπ. για πολλές συνηθισμένες περιπτώσεις, το gpt-4o θα έχει μεγαλύτερες δυνατότητες βραχυπρόθεσμα. θα ακολουθήσουν τακτικές ενημερώσεις και βελτιώσεις και "οι εργασίες συνεχίζονται για να γίνει αυτό το νέο μοντέλο τόσο εύχρηστο όσο το τρέχον μοντέλο."

το openai τονίζει ότι το openai o1 δεν είναι ο "διάδοχος" του gpt-4o μπορεί να χρησιμοποιηθεί σε συνδυασμό με τις συναρτήσεις συμπερασμάτων του o1. σκοπεύει να συνεχίσει να αναπτύσσει και να κυκλοφορεί μοντέλα της σειράς gpt.

σύγκριση πολλαπλών σημείων αναφοράς μεταξύ openai o1 και gpt-4o

αξίζει να σημειωθεί ότι σύμφωνα με προηγούμενα ξένα μέσα ενημέρωσης, το openai μπορεί να σκέφτεται να θέσει υψηλότερα πρότυπα φόρτισης για το μεγάλο μοντέλο «strawberry» ή το ναυαρχίδα επόμενης γενιάς, που μπορεί να φτάσει το μέγιστο των 2.000 $ το μήνα. για σύγκριση, η τρέχουσα χρέωση για το chatgpt plus είναι 20 $ ανά μήνα.

turbulent openai, πότε θα φτάσει το gpt-5;

σύμφωνα με δημοσιεύματα ξένων μέσων ενημέρωσης, ο mulati είπε ότι αυτή τη στιγμή κατασκευάζεται το κύριο μοντέλο επόμενης γενιάς gpt-5, το οποίο θα είναι πολύ μεγαλύτερο από τον προκάτοχό του. ενώ η εταιρεία εξακολουθεί να πιστεύει ότι η κλίμακα θα βοηθήσει στο ξεκλείδωμα νέων δυνατοτήτων από την τεχνητή νοημοσύνη, το gpt-5 πιθανότατα θα περιλαμβάνει επίσης την τεχνολογία συμπερασμάτων που ξεκίνησε αυτή τη φορά.

"υπάρχουν δύο παραδείγματα", είπε ο μουράτι, "το πρότυπο κλιμάκωσης και αυτό το νέο παράδειγμα. θέλουμε να τα φέρουμε κοντά."

η πορεία ανάπτυξης του gpt-5 δεν είναι εύκολη.

στις 11 σεπτεμβρίου, τοπική ώρα, ο alexis conneau, ο επικεφαλής της έρευνας του gpt-4o/gpt-5 και ο τεχνικός επικεφαλής της έκδοσης openai του «her», ανακοίνωσε ξαφνικά την παραίτησή του. προηγουμένως, ο συνιδρυτής και επικεφαλής επιστήμονας του openai ilya sutskever, ο επικεφαλής της ομάδας "super alignment" jan leike και ο συνιδρυτής john schulman, ο επικεφαλής του chatgpt peter deng και άλλοι έχουν παραιτηθεί... επί του παρόντος, μόνο δύο από τους 11 ιδρυτές παραμένουν στο openai .

όχι μόνο υπάρχει αναταραχή στο προσωπικό, αλλά το openai αποκαλύπτεται επίσης ότι αντιμετωπίζει ένα κενό εσόδων και δαπανών ύψους 5 δισεκατομμυρίων δολαρίων ηπα φέτος.

αυτό όμως που φαίνεται είναι ότι το openai αναλαμβάνει ήδη δράση.

το τελευταίο σχέδιο του openai είναι να συγκεντρώσει περίπου 6,5 δισεκατομμύρια δολάρια ηπα, ανεβάζοντας την αποτίμηση αυτού του γύρου χρηματοδότησης στα 150 δισεκατομμύρια δολάρια. στα τέλη του περασμένου μήνα, αποκαλύφθηκε ότι η openai ετοίμαζε έναν νέο γύρο χρηματοδότησης ύψους 1 δισεκατομμυρίου δολαρίων με επικεφαλής την εταιρεία επιχειρηματικών κεφαλαίων thrive capital, με τη microsoft, την apple και τη nvidia να συμμετέχουν πιθανώς στην επένδυση πάνω από 100 δισεκατομμύρια δολάρια.

στις 29 αυγούστου, τοπική ώρα, το openai δήλωσε ότι το chatgpt έχει επί του παρόντος περισσότερους από 200 εκατομμύρια ενεργούς χρήστες την εβδομάδα, διπλάσιο από το περασμένο φθινόπωρο.

το openai λέει ότι το 92% των εταιρειών του fortune 500 χρησιμοποιούν τα προϊόντα του και η χρήση του api του έχει διπλασιαστεί από την κυκλοφορία του chatgpt-4o mini τον ιούλιο.

ο ρεπόρτερ της εφημερίδας qin sheng

(αυτό το άρθρο προέρχεται από το the paper. για περισσότερες πρωτότυπες πληροφορίες, κάντε λήψη της εφαρμογής "the paper")

αναφορά/σχόλια

νέα

αργή και ακριβή; το μοντέλο συμπερασμάτων openai "strawberry" είναι εδώ, πόσο μακριά είναι το gpt-5;

εισαγωγή

τα στοιχεία επικοινωνίας μου