νέα

το openai developer conference προσφέρει πακέτα δώρων: μειώνοντας σημαντικά το κόστος των μοντέλων, εφαρμογές με δυνατότητα φωνής ai και μικρά μοντέλα που «βελτιώνουν» την απόδοση μεγάλων μοντέλων

2024-10-02

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

συντάκτης αυτού του άρθρου: li dan

την τρίτη, 1η οκτωβρίου, eastern time, το openai διοργάνωσε το ετήσιο συνέδριο προγραμματιστών του devday. προγραμματιστές », κάνοντας βελτιώσεις στα υπάρχοντα εργαλεία τεχνητής νοημοσύνης (ai) και σε σουίτες api.

αυτό το openai devday λανσάρει μια σειρά από νέα εργαλεία, που περιλαμβάνουν κυρίως τέσσερις σημαντικές καινοτομίες: prompt caching, vision fine-tuning, realtime api και model distillation φέρνει καλά νέα στους προγραμματιστές όσον αφορά το κόστος, βελτιώνοντας το επίπεδο οπτικής κατανόησης των μοντέλων. βελτίωση των λειτουργιών φωνητικής τεχνητής νοημοσύνης και της απόδοσης μικρών μοντέλων.

κάποια σχόλια ανέφεραν ότι το επίκεντρο του φετινού devday είναι να βελτιώσει τις δυνατότητες των προγραμματιστών και να παρουσιάσει τις ιστορίες του κύκλου των προγραμματιστών, κάτι που δείχνει ότι καθώς ο ανταγωνισμός στον τομέα της τεχνητής νοημοσύνης γίνεται όλο και πιο έντονος, η στρατηγική του openai έχει αλλάξει. τα παραπάνω νέα εργαλεία υπογραμμίζουν τη στρατηγική εστίαση του openai στην ενίσχυση του οικοσυστήματος προγραμματιστών αντί να ανταγωνίζεται άμεσα σε εφαρμογές τελικών χρηστών.

ορισμένα μέσα ανέφεραν ότι στη συνέντευξη τύπου πριν από την εκδήλωση devday, ο επικεφαλής προϊόντων του openai, kevin weil μίλησε για τις πρόσφατες αποχωρήσεις της επικεφαλής τεχνολογίας του openai, mira murati και του επικεφαλής έρευνας bob mcgrew, λέγοντας ότι η αποχώρησή τους δεν θα επηρεάσει την ανάπτυξη της εταιρείας. δεν το κάνουμε θα επιβραδύνει."

το prompt caching μπορεί να μειώσει το κόστος του διακριτικού εισόδου έως και 50%

η προσωρινή προσωρινή αποθήκευση λέξεων θεωρείται ως η πιο σημαντική ενημέρωση που κυκλοφόρησε αυτήν την ημέρα του dev. αυτή η δυνατότητα έχει σχεδιαστεί για να μειώνει το κόστος προγραμματιστή και να μειώνει τον λανθάνοντα χρόνο.

το σύστημα άμεσης προσωρινής αποθήκευσης λέξεων που εισήχθη από το openai παρέχει αυτόματα έκπτωση 50% στα διακριτικά εισόδου που επεξεργάστηκε πρόσφατα το μοντέλο, γεγονός που μπορεί να οδηγήσει σε σημαντική εξοικονόμηση πόρων για εφαρμογές που επαναχρησιμοποιούν συχνά το περιβάλλον. τέτοιες δραστικές μειώσεις κόστους παρέχουν στις επιχειρήσεις και τις νεοφυείς επιχειρήσεις σημαντικές ευκαιρίες να εξερευνήσουν νέες εφαρμογές που προηγουμένως ήταν απρόσιτες λόγω του απαγορευτικού κόστους.

ο olivier godement, διευθυντής προϊόντων πλατφόρμας openai, είπε ότι το gpt-3 είχε μεγάλη επιτυχία πριν από δύο χρόνια και τώρα το openai μείωσε το σχετικό κόστος κατά σχεδόν 1.000 φορές. δεν μπορούσε να αναφέρει κανένα άλλο παράδειγμα όπου το κόστος είχε μειωθεί κατά το ίδιο ποσό σε δύο χρόνια.

το παρακάτω διάγραμμα openai δείχνει ότι η άμεση αποθήκευση λέξεων στην κρυφή μνήμη μπορεί να μειώσει σημαντικά το κόστος εφαρμογής μοντέλων τεχνητής νοημοσύνης σε σύγκριση με τα μη αποθηκευμένα διακριτικά διαφόρων μοντέλων αεπ, το κόστος της προσωρινής αποθήκευσης των διακριτικών εισόδου μπορεί να μειωθεί έως και 50%.

vision fine-tuning: το νέο σύνορο της οπτικής τεχνητής νοημοσύνης

το openai devday ανακοίνωσε ότι το πιο πρόσφατο μοντέλο μεγάλης γλώσσας (llm) gpt-4o του openai εισάγει την οπτική λεπτομέρεια. αυτή η δυνατότητα επιτρέπει στους προγραμματιστές να προσαρμόσουν την οπτική κατανόηση των μοντέλων με εικόνες και κείμενο.

αυτή είναι μια σημαντική ενημέρωση γνωστή ως το νέο σύνορο της οπτικής τεχνητής νοημοσύνης. θα μπορούσε να έχει εκτεταμένες επιπτώσεις σε τομείς όπως τα αυτο-οδηγούμενα αυτοκίνητα, η ιατρική απεικόνιση και οι δυνατότητες οπτικής αναζήτησης.

η openai είπε ότι η grab, η έκδοση meituan + didi στη νοτιοανατολική ασία, έχει χρησιμοποιήσει την τεχνολογία για να βελτιώσει τις υπηρεσίες χαρτών της. χρησιμοποιώντας μόνο 100 παραδείγματα, το grab βελτίωσε την ακρίβεια μέτρησης λωρίδας κατά 20% και τη θέση της πινακίδας ορίου ταχύτητας κατά 13%.

αυτή η εφαρμογή πραγματικού κόσμου δείχνει τις δυνατότητες οπτικής λεπτομέρειας, χρησιμοποιώντας μικρές παρτίδες δεδομένων οπτικής εκπαίδευσης, για να βελτιώσει σημαντικά τις υπηρεσίες ai σε διάφορους κλάδους.

το api σε πραγματικό χρόνο γεφυρώνει το κενό τεχνητής νοημοσύνης συνομιλίας

το openai devday κυκλοφόρησε το api σε πραγματικό χρόνο, το οποίο αυτή τη στιγμή βρίσκεται σε δημόσια φάση beta. το api σε πραγματικό χρόνο απλοποιεί εγγενώς τη διαδικασία δημιουργίας φωνητικών βοηθών και άλλων εργαλείων τεχνητής νοημοσύνης συνομιλίας, εξαλείφοντας την ανάγκη να συρράπτονται πολλά μοντέλα για μεταγραφή, συμπέρασμα και μετατροπή κειμένου σε ομιλία.

αυτό το νέο προϊόν δίνει τη δυνατότητα στους προγραμματιστές να δημιουργούν πολυτροπικές εμπειρίες χαμηλής καθυστέρησης, ειδικά σε εφαρμογές ομιλίας σε ομιλία. αυτό σημαίνει ότι οι προγραμματιστές μπορούν να αρχίσουν να προσθέτουν τα φωνητικά χειριστήρια του chatgpt σε εφαρμογές.

για να καταδείξει τις δυνατότητες του api, το openai παρουσίασε μια ενημερωμένη έκδοση της wanderlust, μιας εφαρμογής ταξιδιωτικού σχεδιασμού που παρουσίασε στο περσινό συνέδριο.

με τη βοήθεια του api σε πραγματικό χρόνο, οι χρήστες μπορούν να μιλήσουν απευθείας στη νέα έκδοση της εφαρμογής και να κάνουν φυσικές συνομιλίες για να προγραμματίσουν τη διαδρομή τους. το σύστημα επιτρέπει ακόμη και στους χρήστες να διακόπτουν στη μέση των προτάσεων, μιμούμενοι μια ανθρώπινη συνομιλία.

ο σχεδιασμός ταξιδιού είναι μόνο ένα παράδειγμα, τα api σε πραγματικό χρόνο ανοίγουν ένα ευρύ φάσμα δυνατοτήτων για εφαρμογές φωνής σε διάφορους κλάδους. είτε ειδικεύονται στην εξυπηρέτηση πελατών, την εκπαίδευση ή τα εργαλεία προσβασιμότητας για άτομα με αναπηρίες, οι προγραμματιστές μπορούν τώρα να επωφεληθούν από νέους πόρους για να δημιουργήσουν πιο έξυπνες και ανταποκρινόμενες εμπειρίες με γνώμονα την τεχνητή νοημοσύνη.

ορισμένες εφαρμογές, συμπεριλαμβανομένης της εφαρμογής καθοδήγησης διατροφής και φυσικής κατάστασης healthify και της πλατφόρμας εκμάθησης γλωσσών speak, έχουν ήδη πρωτοστατήσει στην ενσωμάτωση api σε πραγματικό χρόνο στα προϊόντα τους.

τα σχόλια αναφέρουν ότι το api σε πραγματικό χρόνο δεν είναι φθηνό, χρεώνει 0,06 $ ανά λεπτό εισόδου ήχου και 0,24 $ ανά λεπτό εξόδου ήχου, αλλά μπορεί να εξακολουθεί να αποτελεί μια σημαντική πρόταση αξίας για προγραμματιστές που θέλουν να δημιουργήσουν εφαρμογές που βασίζονται στη φωνή.

η απόσταξη μοντέλων επιτρέπει στα μικρά μοντέλα να έχουν λειτουργίες μοντέλου αιχμής

η απόσταξη μοντέλου θεωρείται ως το πιο μεταμορφωτικό νέο εργαλείο του openai αυτή τη φορά. αυτή η ενσωματωμένη ροή εργασίας επιτρέπει στους προγραμματιστές να προσαρμόζουν σχετικά μικρά και οικονομικά αποδοτικά πανεπιστημιακά μοντέλα χρησιμοποιώντας την έξοδο μοντέλων αιχμής όπως το gpt o1-preview και το gpt-4o, βελτιώνοντας έτσι πιο αποτελεσματικά μοντέλα όπως το gpt-4o mini εκτέλεση.

αυτή η προσέγγιση δίνει τη δυνατότητα στις μικρότερες εταιρείες να επωφεληθούν από παρόμοιες δυνατότητες με μοντέλα αιχμής χωρίς να επιβαρυνθούν με το υπολογιστικό κόστος της χρήσης τέτοιων μοντέλων. βοηθά να γεφυρώσει το χάσμα που είχε εδώ και καιρό η βιομηχανία της τεχνητής νοημοσύνης μεταξύ συστημάτων αιχμής, έντασης πόρων και πιο προσβάσιμων αλλά λιγότερο ισχυρών συστημάτων.

για παράδειγμα, μια μικρή startup που ασχολείται με την ιατρική τεχνολογία θέλει να αναπτύξει ένα διαγνωστικό εργαλείο βασισμένο σε τεχνητή νοημοσύνη για αγροτικές κλινικές. χρησιμοποιώντας την απόσταξη μοντέλων, η εταιρεία μπορεί να εκπαιδεύσει ένα συμπαγές μοντέλο που αποτυπώνει μεγάλο μέρος της διαγνωστικής ισχύος ενός μεγαλύτερου μοντέλου, ενώ χρειάζεται να εκτελείται μόνο σε τυπικό φορητό υπολογιστή ή tablet.

επομένως, η απόσταξη μοντέλων μπορεί να επιτρέψει σε περιβάλλοντα με περιορισμένους πόρους να απολαμβάνουν πολύπλοκες λειτουργίες τεχνητής νοημοσύνης, βελτιώνοντας ενδεχομένως το επίπεδο ιατρικής περίθαλψης σε υποεξυπηρετούμενες περιοχές.