νέα

Το OpenAI κυκλοφορεί νέες δυνατότητες που επιτρέπουν στις εταιρείες να προσαρμόζουν τα πιο ισχυρά μοντέλα τεχνητής νοημοσύνης με βάση τα δικά τους δεδομένα

2024-08-21

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

TencentScience and Technology News, 21 Αυγούστου, Τρίτη, τοπική ώρα στις Ηνωμένες Πολιτείες,OpenAIΚυκλοφόρησε μια νέα δυνατότητα που θα επιτρέπει στους εταιρικούς πελάτες να προσαρμόζουν αυτό το προϊόν χρησιμοποιώντας τα δικά τους εταιρικά δεδομέναΌλα συμπεριλαμβάνονται (Όλα συμπεριλαμβάνονται) Το πιο ισχυρό μοντέλο για startupsGPT-4o

Το OpenAI σχεδιάζει να λανσάρει δυνατότητες προσαρμογής, κοινώς γνωστές στον κλάδο της τεχνητής νοημοσύνης ως nudges, την Τρίτη. Η λεπτομέρεια επιτρέπει στα υπάρχοντα μοντέλα AI να εκπαιδεύονται με πρόσθετες πληροφορίες σχετικά με μια συγκεκριμένη εργασία ή θεματική περιοχή.

Για παράδειγμα, μια εταιρεία που κατασκευάζει skateboards μπορεί να ρυθμίσει με ακρίβεια ένα μοντέλο τεχνητής νοημοσύνης, ώστε να μπορεί να χρησιμοποιηθεί ως chatbot εξυπηρέτησης πελατών ικανό να απαντά σε ερωτήσεις σχετικά με τις λεπτομέρειες των τροχών και της φροντίδας του skateboard.

Στο τρέχον πλαίσιο έντονου ανταγωνισμού μεταξύ νεοφυών επιχειρήσεων στον τομέα των προϊόντων τεχνητής νοημοσύνης και οι εταιρείες πρέπει επειγόντως να επιδείξουν την απόδοση της επένδυσης στην τεχνητή νοημοσύνη, η βελτίωση των τελευταίων χαρακτηριστικών του εμβληματικού μοντέλου του OpenAI είναι ιδιαίτερα σημαντική.

Αξίζει να σημειωθεί ότι αυτή η δυνατότητα εισήχθη για πρώτη φορά στο GPT-4o και στους προκατόχους του, και το OpenAI παρείχε στο παρελθόν στους χρήστες άδειες μικρορύθμισης για πολλούς τύπους μοντέλων, συμπεριλαμβανομένου του GPT-4o mini, παρέχοντας στους χρήστες οικονομικά αποδοτικές επιλογές.

Αντιμέτωπος με τις υπηρεσίες προσαρμογής μοντέλων πολλών εταιρειών τεχνολογίας στην αγορά, ο διευθυντής προϊόντων OpenAI API, Olivier Godement, τόνισε ότι το OpenAI έχει δεσμευτεί να απλοποιήσει και να επιταχύνει τις προσαρμογές των πελατών στα κορυφαία μοντέλα τους, δημιουργώντας άμεσες συνεργασίες με επιχειρήσεις για να αποφευχθεί η στροφή των χρηστών σε εξωτερικές υπηρεσίες ή ασθενέστερες εναλλακτικές λύσεις.

Τόνισε επίσης: «Είμαστε πάντα δεσμευμένοι στη μείωση του τεχνικού ορίου και στη μείωση των επιχειρησιακών φραγμών, μειώνοντας έτσι τον φόρτο του χρήστη για την εκκίνηση και την προσαρμογή των μοντέλων».

Όταν οι πελάτες εκτελούν μικρορύθμιση μοντέλου, πρέπει να μεταδίδουν δεδομένα στον διακομιστή OpenAI. Σύμφωνα με τον μηχανικό λογισμικού προσαρμοσμένης εργασίας του OpenAI, John Allard, αυτή η διαδικασία διαρκεί περίπου μία ή δύο ώρες κατά μέσο όρο. Αρχικά, η λεπτομέρεια θα περιοριστεί σε δεδομένα κειμένου, χωρίς υποστήριξη για εικόνες ή άλλες μορφές πολυμέσων.

Καθώς το OpenAI εκδίδει δωρεάν μάρκες, αντιμετωπίζει προκλήσεις απόGoogleΑνθρωπικόκαι άλλοι προμηθευτές ιδιόκτητων μοντέλων και η Nous Research Hermes 3.Μετα Σφοδροί πόλεμοι τιμών για μοντέλα ανοιχτού κώδικα όπως το Llama 3.1.

Ωστόσο, το πλεονέκτημα της χρήσης OpenAI και παρόμοιων μοντέλων κλειστού κώδικα/ιδιόκτητου είναι ότι οι προγραμματιστές δεν χρειάζεται να αναλάβουν τις εργασίες φιλοξενίας διακομιστή για συμπερασματικά μοντέλα ή εκπαίδευση. Μπορούν είτε να χρησιμοποιήσουν πόρους διακομιστή OpenAI είτε να συνδέσουν απρόσκοπτα τους διακομιστές που προτιμούν.

Ωστόσο, η έρευνα δείχνει ότι η τελειοποίηση ενός μοντέλου μπορεί να επιφέρει κινδύνους, συμπεριλαμβανομένων των αποκλίσεων από τα αρχικά προστατευτικά κιγκλιδώματα και τις εγγυήσεις απόδοσης, κάτι που με τη σειρά του επηρεάζει τη συνολική του αποτελεσματικότητα. Το εάν οι εταιρείες είναι πρόθυμες να αναλάβουν αυτόν τον κίνδυνο πρέπει να σταθμιστεί από μόνες τους. Αλλά το OpenAI πιστεύει ξεκάθαρα ότι αξίζει τα χρήματα και ενθαρρύνει τους χρήστες να εξετάσουν τη λεπτομέρεια ως επιλογή βελτιστοποίησης.

Ξεχωριστά, το OpenAI δήλωσε την Τρίτη ότι θα περιλαμβάνει περιεχόμενο από επωνυμίες όπως οι Vogue, The New Yorker και Wired στα προϊόντα της. Η συμφωνία επιτρέπει επίσης στο OpenAI να χρησιμοποιεί περιεχόμενο Condé Nast για να βοηθήσει στην εκπαίδευση των μοντέλων τεχνητής νοημοσύνης του, τα οποία απαιτούν μεγάλο όγκο δεδομένων για εκμάθηση.

Η ανακοίνωση σηματοδοτεί την αυξημένη προσπάθεια του OpenAI να συνάψει συμφωνίες με εταιρείες πολυμέσων αντί να πολεμά μαζί τους για το πώς να χρησιμοποιεί ειδησεογραφικά άρθρα και άλλο περιεχόμενο στα εργαλεία τεχνητής νοημοσύνης του. Τα μέρη δεν αποκάλυψαν την αξία συναλλαγής της συμφωνίας.

Ακολουθεί το πλήρες κείμενο της επίσημης είδησης που δημοσίευσε το OpenAI:

Σήμερα, εγκαινιάζουμε τη λεπτομέρεια για το GPT-4o, μια από τις πιο απαιτούμενες λειτουργίες από προγραμματιστές. Από τις 23 Σεπτεμβρίου, θα παρέχουμε επίσης σε κάθε επιχείρηση 1 εκατομμύριο κουπόνια εκπαίδευσης δωρεάν κάθε μέρα.

Οι προγραμματιστές μπορούν τώρα να ρυθμίσουν το GPT-4o χρησιμοποιώντας τα μοναδικά σύνολα δεδομένων τους για να επιτύχουν υψηλότερη απόδοση με χαμηλότερο κόστος για συγκεκριμένες περιπτώσεις χρήσης. Η τεχνολογία λεπτομέρειας δίνει στο μοντέλο τη δυνατότητα να προσαρμόζει ευέλικτα τη δομή και τον τόνο των απαντήσεων, ακόμη και να ακολουθεί πολύπλοκες και εξαιρετικά εξειδικευμένες οδηγίες τομέα Απαιτεί μόνο έναν μικρό αριθμό δειγμάτων εκπαίδευσης (όπως δεκάδες παραδείγματα) για να φέρει σημαντικά αποτελέσματα την εφαρμογή.

Από την κωδικοποίηση έως τη δημιουργική γραφή, η λειτουργία μικρορύθμισης καλύπτει ένα ευρύ φάσμα πεδίων, επηρεάζοντας και βελτιώνοντας βαθιά τη συνολική απόδοση του μοντέλου. Αυτή είναι μόνο η αρχή και θα συνεχίσουμε να επενδύουμε στην επέκταση των επιλογών προσαρμογής μοντέλων για προγραμματιστές.

Από εδώ και στο εξής, η λειτουργία μικρορύθμισης GPT-4o είναι πλήρως ανοιχτή σε όλους τους προγραμματιστές που πληρώνουν. Επισκεφτείτε απευθείας τον πίνακα εργαλείων λεπτομέρειας, κάντε κλικ στο κουμπί "δημιουργία" και επιλέξτε "GPT-4o -2024-08-06" από την αναπτυσσόμενη λίστα του βασικού μοντέλου για να ξεκινήσετε τη διαδικασία μικρορύθμισης. Όσον αφορά το κόστος, το κόστος εκπαίδευσης λεπτομέρειας GPT-4o ορίζεται σε 25 $ ανά εκατομμύριο Tokens, ενώ το κόστος συμπερασμάτων είναι 3,75 $ ανά εκατομμύριο Tokens εισόδου και $15 ανά εκατομμύριο Tokens εξόδου.

Επιπλέον, η λειτουργία μικροβελτιστοποίησης GPT-4o είναι επίσης ανοιχτή σε όλους τους προγραμματιστές που πληρώνουν. Απλώς πρέπει να επιλέξετε το "GPT-4o-mini-2024-07-18" ως το βασικό μοντέλο στον πίνακα εργαλείων λεπτομέρειας. Ειδική προσφορά: Για να γιορτάσουμε την κυκλοφορία, παρέχουμε στους χρήστες του GPT-4o δωρεάν έως και 2 εκατομμύρια κουπόνια εκπαίδευσης κάθε μέρα. Αυτή η προσφορά ισχύει μέχρι τις 23 Σεπτεμβρίου.

Λεπτομερείς ιστορίες επιτυχίας

Τους τελευταίους μήνες, συνεργαστήκαμε με αρκετούς αξιόπιστους συνεργάτες για να τελειοποιήσουμε και να δοκιμάσουμε το GPT-4o και να κατανοήσουμε τις περιπτώσεις χρήσης τους. Ακολουθούν μερικά επιτυχημένα παραδείγματα:

1.Το συνημίτονο απέδωσε εκπληκτικά στη δοκιμή αναφοράς SWE-bench

Startup CosineΤζίνιΕίναι ένας βοηθός μηχανικής λογισμικού τεχνητής νοημοσύνης που μπορεί ανεξάρτητα να εντοπίσει και να επιδιορθώσει τρωτά σημεία, να δημιουργήσει λειτουργίες και να συνεργαστεί αποτελεσματικά με τους χρήστες για την αναπαράσταση κώδικα. Μπορεί επίσης να αιτιολογήσει περίπλοκα τεχνικά προβλήματα και να κάνει αλλαγές στον κώδικα με μεγαλύτερη ακρίβεια και λιγότερες απαιτήσεις διακριτικών.

Το Genie τροφοδοτείται από ένα βελτιστοποιημένο μοντέλο GPT-4o που ενσωματώνει την πραγματική εμπειρία πραγματικών μηχανικών λογισμικού, επιτρέποντας στο μοντέλο να μάθει να ανταποκρίνεται με συγκεκριμένους τρόπους. Επιπλέον, το μοντέλο κατακτά επίσης τη μορφοποίηση της εξόδου σε συγκεκριμένες μορφές, όπως ενημερώσεις κώδικα που μπορούν εύκολα να ενσωματωθούν στη βάση κώδικα, βελτιώνοντας περαιτέρω την απόδοση της εργασίας.

Τα αποτελέσματα των δοκιμών αναφοράς επαλήθευσης του SWE-bench που δημοσιεύθηκαν την περασμένη Τρίτη έδειξαν ότι η Genie πέτυχε απόδοση 43,8%.SOTAΗ βαθμολογία είναι εξαιρετική, ειδικά στο Full test Η βαθμολογία SOTA είναι τόσο υψηλή όσο 30,08%, που είναι ένα σημαντικό άλμα από την προηγούμενη καλύτερη βαθμολογία του 19,27%, σηματοδοτώντας μια σημαντική ανακάλυψη στην ιστορία αυτής της δοκιμής αναφοράς. Το SWE-Bench είναι ένα τεστ που αξιολογεί τις δυνατότητες μηχανικής λογισμικού τεχνητής νοημοσύνης.

2. Το Distyl κατέχει την πρώτη θέση στο σημείο αναφοράς BIRD-SQL

Η Distyl, ένας συνεργάτης λύσεων τεχνητής νοημοσύνης για εταιρείες του Fortune 500, κατέλαβε πρόσφατα την πρώτη θέση στο σημείο αναφοράς BIRD-SQL, το κορυφαίο σημείο αναφοράς κειμένου σε SQL. Το βελτιστοποιημένο GPT-4o της Distyl επιτυγχάνει ακρίβεια εκτέλεσης 71,83% στον πίνακα κατάταξης και αποδίδει καλά σε εργασίες όπως η αναδιατύπωση ερωτημάτων, η ταξινόμηση προθέσεων, η αλυσίδα σκέψης και η αυτοδιόρθωση, και είναι ιδιαίτερα εξαιρετικό στη δημιουργία SQL.

Απόρρητο και ασφάλεια δεδομένων

Το μοντέλο λεπτομέρειας είναι πλήρως υπό τον έλεγχο του χρήστη, ο οποίος έχει την απόλυτη ιδιοκτησία των επιχειρηματικών δεδομένων, καλύπτοντας όλες τις εισόδους και τις εκροές. Αυτό διασφαλίζει ότι τα δεδομένα ενός χρήστη δεν κοινοποιούνται ποτέ ή χρησιμοποιούνται για την εκπαίδευση άλλων μοντέλων.

Επιπλέον, έχουμε αναπτύξει πολυεπίπεδους μηχανισμούς προστασίας ασφαλείας για βελτιωμένα μοντέλα για να αποτρέψουμε την κατάχρηση. Για παράδειγμα, εκτελούμε συνεχώς αυτοματοποιημένες αξιολογήσεις ασφαλείας σε βελτιωμένα μοντέλα και παρακολουθούμε τη χρήση για να διασφαλίσουμε ότι οι εφαρμογές συμμορφώνονται με τις πολιτικές χρήσης μας.

Ανυπομονούμε να δούμε τι δημιουργείτε βελτιστοποιώντας το GPT-4o. Εάν επιθυμείτε να εξερευνήσετε περισσότερες δυνατότητες προσαρμογής μοντέλου, μη διστάσετε να επικοινωνήσετε με την ομάδα μας και θα χαρούμε να σας παρέχουμε υποστήριξη και βοήθεια! (Σύνταξη/Χρυσό Ελάφι)