αξίζει το openai "strawberry" ένα τρισεκατομμύριο;

2024-09-13

συγγραφέας |. bi andi, συντάκτης wang jing

τι κοινό έχουν ο ultraman και ο ma baoguo; απάντηση: σε όλους αρέσει να κάνουν κρυφές επιθέσεις.

η είδηση του «strawberry» κυκλοφορεί εδώ και αρκετούς μήνες λέγεται ότι πρόκειται για ένα μυστηριώδες έργο εντός του openai, το οποίο φαίνεται να είναι αρκετά διαφορετικό από το μοντέλο της προηγούμενης γενιάς. αλλά το openai το κρατούσε μυστικό η πιο κοντινή στιγμή που εκτέθηκε ήταν μια φωτογραφία με αληθινές φράουλες που δημοσιεύτηκε από τον ceo sam altman στα μέσα κοινωνικής δικτύωσης.

μόλις πριν από λίγες μέρες, το the information έκανε την είδηση ότι το «strawberry» θα κυκλοφορήσει τις επόμενες δύο εβδομάδες.

ακόμη και με τόσο μεγάλη προσοχή, το openai εξακολουθούσε να αιφνιδιάζει τον κόσμο: το απόγευμα της 12ης σεπτεμβρίου, τοπική ώρα, χωρίς καμία ειδοποίηση ή συνέντευξη τύπου, το openai κυκλοφόρησε ξαφνικά ένα νέο μοντέλο.

ωστόσο, το όνομα του νέου μοντέλου δεν είναι τόσο νόστιμο όσο το «φράουλα», αλλά πολύ σοβαρό και με νόημα: o1.

ξέρετε, το μοντέλο openai έχει επαναληφθεί στη σειρά "gpt" στο παρελθόν, από το gpt-1 το 2018 στο gpt-4o τον μάιο του τρέχοντος έτους. σήμερα, το openai ανοίγει μια νέα γραμμή.

στην επίσημη ανάρτηση ιστολογίου που ανακοινώνει το o1, το openai είπε το εξής: «ως πρώιμο μοντέλο, δεν έχει ακόμη πολλά από τα χαρακτηριστικά που κάνουν το chatgpt χρήσιμο...αλλά για πολύπλοκες εργασίες εξαγωγής συμπερασμάτων, αυτή είναι μια σημαντική βελτίωση και αντιπροσωπεύει τις δυνατότητες ai. με δεδομένο αυτό, επαναφέραμε τον μετρητή στο 1 και ονομάσαμε αυτή τη σειρά openai o1.

το νέο μοντέλο είναι ανοιχτό προς το παρόν μόνο σε συνδρομητές που πληρώνουν chatgpt και σε ορισμένους προγραμματιστές για να δείξουμε ότι το μοντέλο δεν είναι ακόμη ώριμο, ονομάζεται προσωρινά "o1-preview" και προεπισκόπηση σημαίνει προεπισκόπηση. επιπλέον, το openai κυκλοφόρησε επίσης μια έκδοση μικρού μοντέλου o1-mini. είτε πρόκειται για o1-preview είτε για o1-mini, υπάρχει επί του παρόντος ένα όριο στον αριθμό των απαντήσεων ανά εβδομάδα.

ο ίδιος ο ultraman εξήρε το νέο μοντέλο στα social media

ο gary marcus, ένας μελετητής τεχνητής νοημοσύνης που του αρέσει πάντα να ρίχνει κρύο νερό στο chatgpt, αστειεύτηκε ότι η κίνηση του openai είναι μια «οικεία συνταγή»: ανακοινώστε το demo, ανοίξτε το σε περιορισμένο αριθμό χρηστών, συγκεντρώστε χρήματα και κάντε το ξανά.

τη στιγμή που κυκλοφόρησε το o1, το openai βρισκόταν σε νέο γύρο χρηματοδότησης. σύμφωνα με τα τελευταία νέα από το bloomberg, αυτός ο γύρος χρηματοδότησης θα είναι ένα σημαντικό γεγονός με κλίμακα δεκάδων δισεκατομμυρίων δολαρίων ηπα και στόχος αποτίμησης 150 δισεκατομμυρίων δολαρίων ηπα.

ας ρίξουμε μια ματιά στο ίδιο το μοντέλο πρώτα.

όπως φημολογήθηκε προηγουμένως, μια σημαντική εστίαση του o1 είναι η "συλλογιστική". το κλειδί πίσω από τη «συλλογιστική» είναι η «σκέψη».

για τους χρήστες, η πιο διαισθητική αίσθηση είναι ότι η προεπισκόπηση o1 θα χρειαστεί περισσότερο χρόνο πριν απαντήσει στην ερώτηση.

κάτω από το μοντέλο προεπισκόπησης o1, η αλφαβητική λίστα ρωτά chatgpt "ποια ημέρα του μήνα και ποια ημέρα της εβδομάδας είναι σήμερα;" μετά την αποστολή της ερώτησης, το chatgpt εμφανίζει τα συνεχιζόμενα βήματα σκέψης του ένα προς ένα: απάντηση στην ερώτηση ημερομηνίας, ανασκόπηση των οδηγιών, κατανόηση της τρέχουσας ημερομηνίας και, στη συνέχεια, δίνοντας την απάντηση, με την ένδειξη "σκέψου για 8 δευτερόλεπτα".

αντίθετα, στο μοντέλο gpt-4o, το chatgpt δίνει μια άμεση απάντηση εντός 3 δευτερολέπτων χωρίς να εμφανίζει ενδιάμεσα βήματα.

"αυτό είναι ένα νέο μεγάλο μοντέλο μαντείου που εκπαιδεύεται μέσω ενισχυτικής μάθησης και έχει σχεδιαστεί για να εκτελεί σύνθετες συλλογιστικές εργασίες. ο 1 σκέφτεται πριν απαντήσει σε ερωτήσεις - μπορεί να δημιουργήσει μια εσωτερική μακρά "αλυσίδα σκέψης" πριν απαντήσει ο χρήστης σε μια ανάρτηση ιστολογίου."

αυτή τη φορά κυκλοφόρησε το μοντέλο o1, οι υπεύθυνοι του openai αποκάλυψαν πολύ λίγες τεχνικές λεπτομέρειες και αυτό που τόνισαν επανειλημμένα ήταν η «αλυσίδα σκέψης».

σύμφωνα με το openai, το o1 χρησιμοποιεί αλυσίδες σκέψης όταν προσπαθεί να λύσει προβλήματα, όπως οι άνθρωποι σκέφτονται πολύ και σκληρά πριν απαντήσουν σε μια δύσκολη ερώτηση. μέσω της ενισχυτικής μάθησης, η o1 έμαθε να βελτιώνει την αλυσίδα σκέψης της και να βελτιστοποιεί τις στρατηγικές χρήσης της. είναι σε θέση να αναγνωρίσει και να διορθώσει τα δικά του λάθη και να μάθει να σπάει τα πολύπλοκα βήματα σε πιο απλά. όταν η τρέχουσα μέθοδος δεν λειτουργεί, δοκιμάζει μια διαφορετική μέθοδο.

"αυτή η διαδικασία βελτιώνει σημαντικά τις δυνατότητες συμπερασμάτων του μοντέλου."

πόσο ισχυρή είναι λοιπόν η ικανότητα του o1; εκτός από τα πολλά βίντεο επίδειξης που κυκλοφόρησε το openai, το πιο πειστικό είναι τα αποτελέσματα των δοκιμών. το openai λέει ότι το o1 αποδίδει "συγκρίσιμα με τους ειδικούς στον άνθρωπο" σε μια σειρά σημείων αναφοράς με ένταση συμπερασμάτων και ξεπερνά τις προηγούμενες τεχνικές. για παράδειγμα, στη διεθνή μαθηματική ολυμπιάδα (imo), η προηγούμενη τεχνική βαθμολογία ήταν 13%, και η βαθμολογία του o1 ήταν έως και 83%.

στον διαγωνισμό προγραμματισμού codeforces, το o1 πέτυχε εξαιρετική βαθμολογία 89%. με βάση το o1, το openai ανέπτυξε επίσης το o1-ioi, το οποίο είναι καλύτερο στον προγραμματισμό, και τα αποτελέσματά του ξεπέρασαν το 93% των διαγωνιζομένων με μια πτώση.

ένα άλλο τεστ που «επιδεικνύει» συγκεκριμένα το openai είναι το gpqa-diamond, το οποίο είναι ένα τεστ αναφοράς για εξειδίκευση στη χημεία, τη φυσική και τη βιολογία. το openai κάλεσε ειδικούς με διδακτορικά να διαγωνιστούν και διαπίστωσε ότι «η απόδοση του o1 ξεπέρασε αυτούς τους ανθρώπινους ειδικούς».

το openai είπε επίσης ότι μετά την ενεργοποίηση των δυνατοτήτων οπτικής αντίληψης, το o1 σημείωσε 78,2% στη δοκιμή mmmu, «γίνοντας το πρώτο μοντέλο που μπορεί να ανταγωνιστεί τους ειδικούς του ανθρώπου». επιπλέον, το o1 υπερτερεί του gpt-4o σε 54 από τις 57 υποκατηγορίες mmlu.

εν ολίγοις, το o1 δίνει περισσότερη προσοχή στην ικανότητα συλλογισμού από τα προηγούμενα μοντέλα του openai, και οι ικανότητές του στα μαθηματικά και στον προγραμματισμό έχουν βελτιωθεί ιδιαίτερα, είναι σαν γιατρός στην πυγμαχία και ένας ειδικός στην "αλυσίδα σκέψης". , αναμένεται επίσης να μειώσει την ψευδαίσθηση του μοντέλου.

ωστόσο, το o1 βρίσκεται ακόμη σε σχετικά πρώιμο στάδιο, όπως τόνισε ο ultraman, «υπάρχουν ακόμη ελαττώματα και περιορισμοί».

μόνο στη ρηχή προσπάθεια της λίστας αλφαβήτου, παρουσιάστηκαν σφάλματα στην προεπισκόπηση o1. για παράδειγμα, όταν ρωτήθηκε "ποιο είναι μεγαλύτερο, 9,11 ή 9,9;", το gpt-4o απάντησε λάθος και το o1-preview απάντησε επίσης λάθος, λέγοντας σοβαρά ότι "το 9,11 είναι πράγματι μεγαλύτερο από 9,9. επειδή το 9,11 (δηλ. 9,11) είναι μεγαλύτερο από 9,9 (9,90)" υπάρχει μια νότα χιούμορ στον βερμπαλισμό, για να μην αναφέρουμε ότι χρειάστηκαν 15 δευτερόλεπτα για να το σκεφτείς.

οι πληροφορίες ανέφεραν επίσης ότι ορισμένοι χρήστες που δοκίμασαν το o1-preview είπαν ότι πολλές αλληλεπιδράσεις "δεν άξιζαν τα επιπλέον 10 έως 20 δευτερόλεπτα αναμονής" και ότι προτιμούσαν την ταχύτητα απόκρισης του gpt-4o.

επί του παρόντος, το o1-preview και το o1-mini είναι ανοιχτά σε χρήστες που πληρώνουν, αλλά ο αριθμός είναι περιορισμένος: το o1-preview έχει 30 μηνύματα την εβδομάδα και το o1-mini έχει 50 μηνύματα την εβδομάδα.

από την επόμενη εβδομάδα, και τα δύο μοντέλα θα είναι επίσης προσβάσιμα σε εταιρικούς και εκπαιδευτικούς χρήστες (edu) του chatgpt. η openai δήλωσε επίσης ότι θα ήθελε να παρέχει το o1-mini σε όλους τους χρήστες δωρεάν στο μέλλον, αλλά η συγκεκριμένη ώρα δεν έχει ανακοινωθεί.

αυτή είναι η πρώτη φορά που το openai έχει προσθέσει ένα επίθημα παρόμοιο με το "preview" κατά την κυκλοφορία ενός μοντέλου.

ένα χαρακτηριστικό του o1 που δεν μπορεί να αγνοηθεί είναι ότι είναι ακριβό.

το κόστος της πρόσβασης προγραμματιστών στο o1 είναι πολύ υψηλό: όσον αφορά το api, το o1-preview χρεώνει 15 $ ανά 1 εκατομμύριο διακριτικά εισόδου ή μπλοκ κειμένου που αναλύονται από το μοντέλο, τριπλάσιο από αυτό του gpt-4o και 60 $ ανά 1 εκατομμύριο διακριτικά εξόδου usd , τετραπλάσιο από αυτό του gpt-4o.

η atlantic ανέλυσε στην έκθεση ότι το o1 έχει σχεδιαστεί ειδικά για να απαιτεί περισσότερο χρόνο, ο οποίος αναπόφευκτα θα καταναλώσει περισσότερους πόρους και θα αυξήσει τη δυσκολία της κερδοφορίας της aigc.

ο gary marcus, που αναφέρθηκε στην αρχή αυτού του άρθρου, είναι μελετητής στο σημείο τομής της ανθρώπινης νευροεπιστήμης και της τεχνητής νοημοσύνης, επίτιμος καθηγητής στο πανεπιστήμιο της νέας υόρκης και ο ιδρυτής και διευθύνων σύμβουλος της startup geometric intelligence είναι "το αγκάθι στον κόσμο της τεχνητής νοημοσύνης" έχει επανειλημμένα επικρίνει το openai.

κατά την άποψή του, η ξαφνική κυκλοφορία του o1-preview από το openai είναι περισσότερο μια μέθοδος προπαγάνδας.

σε τελική ανάλυση, το openai υφίσταται έναν σημαντικό γύρο χρηματοδότησης σύμφωνα με την τελευταία έκθεση του bloomberg, το openai διαπραγματεύεται να συγκεντρώσει 6,5 δισεκατομμύρια δολάρια από τους επενδυτές σε αποτίμηση 150 δισεκατομμυρίων δολαρίων τραπεζών με τη μορφή ανακυκλούμενης πίστωσης.

"στείλτε ένα demo, ανοίξτε το σε περιορισμένους χρήστες, συγκεντρώστε χρήματα και επαναλάβετε αυτό είναι το πώς ο marcus συνοψίζει τα "μέσα" του openai.

τον ιούλιο του τρέχοντος έτους, το the information ανέφερε ότι το openai μπορεί να χάσει έως και 5 δισεκατομμύρια δολάρια φέτος. μεταξύ αυτών, το κόστος των εργαζομένων του openai φέτος είναι περίπου 1,5 δισεκατομμύρια δολάρια, το κόστος εκπαίδευσης και συμπερασμάτων τεχνητής νοημοσύνης μπορεί να φτάσει τα 7 δισεκατομμύρια δολάρια και τα ετήσια έσοδα αναμένεται να κυμαίνονται μεταξύ 3,5 και 4,5 δισεκατομμυρίων δολαρίων ηπα.

εκείνη την εποχή, το the information προέβλεψε ότι με αυτόν τον ρυθμό καύσης χρημάτων, το openai θα χρειαζόταν σύντομα να συγκεντρώσει κεφάλαια η τελευταία σημαντική χρηματοδότηση για το openai ήταν στις αρχές του 2023, όταν η microsoft επένδυσε δεκάδες δισεκατομμύρια δολάρια.

δεν είναι η πρώτη φορά που το openai κυκλοφορεί «ανώριμα προϊόντα» σε βασικούς κόμβους.

τον οκτώβριο του περασμένου έτους, υπήρχαν ειδήσεις ότι η openai επιδίωκε να πουλήσει μετοχές εκείνη την εποχή, φημολογήθηκε ότι η πιθανή αποτίμηση ήταν 86 δισεκατομμύρια δολάρια. όμως τον επόμενο μήνα, το openai γνώρισε μια συγκλονιστική αλλαγή στην ανώτατη διοίκηση του altman, αλλά σύντομα επέστρεψε στη θέση του ως ceo, κερδίζοντας τη «μάχη του παλατιού». ωστόσο, το πλάνο πώλησης μετοχών καθυστέρησε για λίγο και δεν υπήρχε είδηση ότι η συναλλαγή είχε «επιστρέφει σε τροχιά» μέχρι τα τέλη νοεμβρίου. εκείνη την εποχή, άνθρωποι που γνώριζαν το θέμα είπαν ότι οι εργαζόμενοι ανησυχούσαν ότι η έκτακτη ανάγκη θα επηρεάσει τις πωλήσεις των μετοχών και θα επηρεάσει την αποτίμηση της εταιρείας.

είναι ενδιαφέρον ότι στις 15 φεβρουαρίου του τρέχοντος έτους, το openai ανακοίνωσε ξαφνικά ένα μοντέλο νέας γενιάς βίντεο sora και το demo προκάλεσε σοκ στον έξω κόσμο. μέσα σε τρεις ημέρες, οι new york times ανέφεραν ότι η openai ολοκλήρωσε την πώληση των μετοχών των εργαζομένων και η αποτίμηση της εταιρείας ξεπέρασε τα 80 δισεκατομμύρια δολάρια ηπα «όπως αναμενόταν».

έχει περάσει πάνω από μισός χρόνος και ο sora δεν ήταν ανοιχτός στο κοινό, ούτε καν προωθήθηκε δοκιμές μεγάλης κλίμακας. ο έξω κόσμος άρχισε να υποψιάζεται ότι ο sora στην πραγματικότητα δεν είχε αρκετή υπολογιστική ισχύ για να υποστηρίξει τη λειτουργία του. μια έκθεση που δημοσιεύθηκε από τον οργανισμό έρευνας αγοράς factorial funds πιστεύει ότι θα χρειαστούν 720.000 τσιπ nvidia h100 για την ανάπτυξη του sora.

στις αρχές σεπτεμβρίου, η «taiwan economic daily» ανέφερε ότι το τσιπ σε επίπεδο angstrom a16 της tsmc είχε ήδη λάβει παραγγελίες από μεγάλους πελάτες, συμπεριλαμβανομένων των apple και openai. το openai θα χρησιμοποιήσει προσαρμοσμένα τσιπ για να βελτιώσει τις δυνατότητες παραγωγής βίντεο της sora. αυτό φαίνεται επίσης να επιβεβαιώνει ότι ο sora αντιμετώπισε εμπλοκή υπολογιστικής ισχύος στο παρελθόν.

τώρα που το chatgpt με γεύση φράουλα είναι εδώ, ίσως σύντομα θα δούμε τα νέα ότι το openai ολοκλήρωσε με επιτυχία έναν νέο γύρο χρηματοδότησης και η αξία του είναι πάνω από ένα τρισεκατομμύριο γιουάν.

νέα

αξίζει το openai "strawberry" ένα τρισεκατομμύριο;

εισαγωγή

τα στοιχεία επικοινωνίας μου