Νέα

«Η πιο ισχυρή λειτουργία και χαμηλό κόστος»! Το OpenAI κυκλοφορεί το GPT-4o mini για να συμμετάσχει στον διαγωνισμό μικρών μοντέλων

2024-07-19

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

Η OpenAI κυκλοφόρησε το "GPT-4o mini" την Πέμπτη Ανατολική ώρα, μπαίνοντας στον ανταγωνισμό των "μικρών αλλά εκλεπτυσμένων" μοντέλων τεχνητής νοημοσύνης. Ονόμασε αυτό το νέο μοντέλο "το πιο ισχυρό και φθηνό μοντέλο" και σχεδίαζε να ενσωματώσει εικόνες, βίντεο και ήχο. στο μέλλον σε αυτό το μοντέλο.

Περισσότερο από 60% φθηνότερο από το GPT-3.5 Turbo και η απόδοση συνομιλίας είναι καλύτερη από τα ανταγωνιστικά προϊόντα

Η εταιρεία είπε ότι το GPT-4o mini είναι διαθέσιμο στους χρήστες ChatGPT δωρεάν, στους συνδρομητές ChatGPT Plus και Teams από την Πέμπτη και θα είναι διαθέσιμο σε εταιρικούς χρήστες ChatGPT την επόμενη εβδομάδα. Το GPT-4o mini θα αντικαταστήσει το παλαιότερο μοντέλο GPT-3.5 Turbo στο ChatGPT. Η OpenAI είπε ότι το GPT-4o mini κοστίζει 15 σεντ ανά εκατομμύριο μάρκες εισόδου και 60 σεντ ανά εκατομμύριο μάρκες εξόδου, καθιστώντας το περισσότερο από 60% φθηνότερο από το GPT-3.5 Turbo.

Η εταιρεία είπε επίσης ότι το νέο μοντέλο ξεπερνά επί του παρόντος το μοντέλο GPT-4 στις προτιμήσεις συνομιλίας και πέτυχε βαθμολογία 82% στο τεράστιο τεστ κατανόησης γλώσσας πολλαπλών εργασιών (MMLU). Σύμφωνα με αναφορές των μέσων ενημέρωσης, το MMLU είναι ένα σημείο αναφοράς ευφυΐας κειμένου και λογικής που χρησιμοποιείται για την αξιολόγηση των δυνατοτήτων του γλωσσικού μοντέλου. Μια υψηλότερη βαθμολογία MMLU υποδηλώνει καλύτερη κατανόηση και χρήση της γλώσσας σε διάφορους τομείς, ενισχύοντας την εφαρμογή της στον πραγματικό κόσμο.

Σύμφωνα με τα δεδομένα του OpenAI, το μίνι μοντέλο GPT-4o σημείωσε 82%, το οποίο είναι υψηλότερο από τους άλλους δύο ανταγωνιστές χαμηλού κόστους, το Gemini Flash της Google σημείωσε 77,9% και ο Claude Haiku της Anthropic σημείωσε 73,8%.

Μεταξύ των μεγαλύτερων μοντέλων, το GPT-3.5 σημείωσε 70% σε αυτήν τη δοκιμή, το GPT-4o σημείωσε 88,7% και η Google ισχυρίζεται ότι η Gemini Ultra της πέτυχε την υψηλότερη βαθμολογία της ποτέ, 90%.

Η ανάλυση υποδηλώνει ότι τα μικρότερα μοντέλα γλώσσας απαιτούν λιγότερη υπολογιστική ισχύ για να λειτουργήσουν, καθιστώντας τα μια πιο προσιτή επιλογή για εταιρείες με περιορισμένους πόρους για την ανάπτυξη γενετικής τεχνητής νοημοσύνης.

Επιπλέον, αυτό το νέο ελαφρύ μοντέλο θα υποστηρίζει επίσης λειτουργίες κειμένου και οπτικής εικόνας στο API και η OpenAI λέει ότι σύντομα θα χειρίζεται όλες τις πολυτροπικές εισόδους και εξόδους, όπως βίντεο και ήχο. Με αυτές τις δυνατότητες, θα μπορούσε ενδεχομένως να λειτουργήσει σαν ένας πιο ισχυρός εικονικός βοηθός, ικανός να κατανοήσει το δρομολόγιο του ταξιδιού σας και να κάνει συστάσεις. Ωστόσο, αυτό το μοντέλο προς το παρόν μπορεί να χρησιμοποιηθεί μόνο για απλές εργασίες.

Ο ανταγωνισμός για «μικρά αλλά εκλεπτυσμένα» μοντέλα AI είναι σκληρός και το OpenAI μπαίνει επιτέλους στο παιχνίδι

Σύμφωνα με δημοσιεύματα των μέσων ενημέρωσης, η αποτίμηση του OpenAI, που υποστηρίζεται από τη Microsoft, έχει ξεπεράσει τα 80 δισεκατομμύρια δολάρια ΗΠΑ Παρόλο που εξακολουθεί να κατέχει ηγετική θέση στην αγορά παραγωγής τεχνητής νοημοσύνης, η εταιρεία αντιμετωπίζει αυξανόμενη ανταγωνιστική πίεση. Η OpenAI πρέπει επίσης να βρει τρόπους για να βγάλει χρήματα, καθώς η εταιρεία ξοδεύει πολλά χρήματα σε επεξεργαστές και υποδομές για να κατασκευάσει και να εκπαιδεύσει τα μοντέλα της.

Ωστόσο, πολλές εταιρείες δεν μπορούν να αντέξουν οικονομικά μεγαλύτερα, ακριβότερα μοντέλα, επομένως τα ελαφριά και φθηνότερα μοντέλα μπορεί να είναι πιο δημοφιλή. Μέχρι τότε, πολλοί προγραμματιστές θα επέλεγαν το Claude 3 Haiku ή το Gemini 1.5 Flash αντί να πληρώσουν το υψηλό υπολογιστικό κόστος που απαιτείται για την εκτέλεση των πιο ισχυρών μοντέλων. Για παράδειγμα, ένα μικρότερο μοντέλο μπορεί να είναι το καταλληλότερο για την αυτοματοποίηση βασικών εργασιών μεγάλου όγκου, ενώ ένα μεγαλύτερο μοντέλο μπορεί να χειριστεί πιο περίπλοκες εργασίες. Ορισμένοι προγραμματιστές μπορεί να επιθυμούν να χρησιμοποιήσουν και τα δύο μοντέλα σε μία μόνο εφαρμογή.

Ο Olivier Godement, επικεφαλής προϊόντων API του OpenAI, εξήγησε σε μια συνέντευξη στα μέσα ενημέρωσης γιατί η εταιρεία απέτυχε να λανσάρει «μικρά και εκλεπτυσμένα» μοντέλα τεχνητής νοημοσύνης νωρίτερα μοντέλα, όπως το GPT-4, απαιτούν σημαντικούς ανθρώπινους και υπολογιστικούς πόρους. Με την πάροδο του χρόνου, το OpenAI παρατήρησε ότι οι προγραμματιστές γίνονται όλο και πιο πρόθυμοι να χρησιμοποιήσουν μικρότερα μοντέλα, έτσι η εταιρεία αποφάσισε ότι τώρα ήταν η ώρα να επενδύσει πόρους για την ανάπτυξη του GPT-4o Mini.

«Αποστολή μας είναι να κατασκευάσουμε την πιο προηγμένη τεχνολογία και να κατασκευάσουμε τις πιο ισχυρές και χρήσιμες εφαρμογές, και σίγουρα ελπίζουμε να συνεχίσουμε να φτιάχνουμε μοντέλα αιχμής και να προωθήσουμε την τεχνολογική πρόοδο», δήλωσε ο επικεφαλής προϊόντων API του OpenAI, Olivier Godement σε συνέντευξή του στο τα μέσα μαζικής ενημέρωσης. «Αλλά θέλουμε επίσης να έχουμε το καλύτερο μικρό μοντέλο και νομίζω ότι θα είναι πολύ δημοφιλές».

"Πιστεύω ότι το GPT-4o Mini ενσωματώνει πραγματικά την αποστολή του OpenAI να κάνει την τεχνητή νοημοσύνη πιο προσιτή. Εάν θέλουμε η τεχνητή νοημοσύνη να ωφελήσει κάθε γωνιά του κόσμου, κάθε βιομηχανία και κάθε εφαρμογή, πρέπει να κάνουμε την τεχνητή νοημοσύνη πιο προσιτή για τα προϊόντα της πλατφόρμας API του OpenAI, Director Olivier." είπε ο Godement στα μέσα ενημέρωσης.

Το GPT-4o mini βοηθά τους υπαλλήλους να εστιάσουν

Ο Godement είπε ότι ορισμένοι προγραμματιστές δοκίμασαν το μοντέλο την περασμένη εβδομάδα.

Η OpenAI ζήτησε από τη startup fintech Ramp να δοκιμάσει το μοντέλο, χρησιμοποιώντας το GPT-4o Mini για να δημιουργήσει ένα εργαλείο που εξάγει δεδομένα δαπανών από αποδείξεις. Έτσι οι χρήστες μπορούν να ανεβάσουν φωτογραφίες των αποδείξεων τους και το μοντέλο θα οργανώσει τα δεδομένα για αυτούς. Το πρόγραμμα-πελάτης ηλεκτρονικού ταχυδρομείου Superhuman δοκίμασε επίσης το GPT-4o Mini και το χρησιμοποίησε για να δημιουργήσει μια δυνατότητα που προτείνει αυτόματα απαντήσεις μέσω email.

Αρχικά, το GPT-4o mini θα μπορεί να επεξεργάζεται και να δημιουργεί κείμενο και εικόνες. Μόλις ολοκληρωθεί η τελική έκδοση, το OpenAI λέει ότι θα είναι σε θέση να χειρίζεται άλλους τύπους περιεχομένου.

Το OpenAI είπε επίσης ότι το GPT-4o mini είναι το πρώτο μοντέλο τεχνητής νοημοσύνης της εταιρείας που χρησιμοποιεί τη νέα πολιτική ασφαλείας της "ιεραρχίας οδηγιών". Ο στόχος αυτής της προσέγγισης είναι να κάνει τα συστήματα τεχνητής νοημοσύνης να δίνουν προτεραιότητα σε ορισμένες οδηγίες - όπως αυτές από εταιρείες - για να δυσκολεύουν τους ανθρώπους να κάνουν το εργαλείο να κάνει κάτι που δεν πρέπει να κάνει.

Η ανάλυση πιστεύει ότι το μίνι μοντέλο GPT-4o αποτελεί μέρος της δέσμευσης του OpenAI για την «πολυτροπικότητα», δηλαδή την παροχή ενός ευρέος φάσματος μέσων που δημιουργούνται από την τεχνητή νοημοσύνη (όπως κείμενο, εικόνες, ήχος και βίντεο) σε ένα εργαλείο: το ChatGPT.

Πέρυσι, ο COO του OpenAI Brad Lightcap είπε στα μέσα ενημέρωσης:

"Ο κόσμος είναι πολυτροπικός. Εάν σκεφτείτε τον τρόπο με τον οποίο εμείς ως άνθρωποι επεξεργαζόμαστε και ασχολούμαστε με τον κόσμο, βλέπουμε πράγματα, ακούμε πράγματα, μιλάμε - ο κόσμος δεν είναι απλώς κείμενο. Έτσι, για εμάς, υπάρχει μόνο κείμενο και κώδικας ως Μια ενιαία μέθοδος, μια ενιαία διεπαφή, αισθάνεται πάντα ημιτελής, επειδή η δύναμη αυτών των μοντέλων και αυτό που μπορούν να κάνουν είναι πολύ περισσότερα."