νέα

πακέτο δώρου openai: η ομιλία σε πραγματικό χρόνο και η απόσταξη μοντέλων είναι όλα διαθέσιμα, πουλήστε τα καλύτερα προϊόντα και κερδίστε τα περισσότερα χρήματα

2024-10-02

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

συγγραφέας: τζέσικα

σήμερα, το πρώτο devday του openai το 2024 πραγματοποιήθηκε με χαμηλούς τόνους στο gateway pavilion στο pier 2 στο σαν φρανσίσκο.

διαφορετικά από την ταραχώδη επίσημη ανακοίνωση του περασμένου έτους, τα νέα για τη φετινή ημέρα προγραμματιστή εμφανίστηκαν μόνο μία φορά στον λογαριασμό x του openai developers πριν από δύο μήνες, οπότε πολλοί άνθρωποι δεν το γνώριζαν.

οι συμμετέχοντες είναι βασικά προσκεκλημένοι πελάτες και επιλεγμένοι προγραμματιστές πρώτης γραμμής. η τοποθεσία κρατήθηκε μυστική μέχρι την τελευταία στιγμή, το μυστηριώδες πρόγραμμα δεν αποκαλύφθηκε μέχρι την ημέρα και δεν υπήρχε ζωντανή μετάδοση.

πριν από τη συνάντηση, ο sam altman έγραψε γρήγορα στο twitter:

«μερικά νέα εργαλεία για προγραμματιστές κυκλοφορούν σήμερα!

από την τελευταία devday έως αυτή: το κόστος ανά διακριτικό από gpt-4 σε 4o mini μειώθηκε κατά 98%, ο αριθμός των κουπονιών στο σύστημά μας έχει αυξηθεί κατά 50 φορές, η ευφυΐα του μοντέλου έχει σημειώσει εξαιρετική πρόοδο και υπήρξε λίγη δράμα στη διαδικασία.

ανυπομονώ για την πρόοδο από αυτήν την devday στην επόμενη. ο δρόμος προς το agi δεν ήταν ποτέ πιο ξεκάθαρος. "

όπως είχε ενημερώσει προηγουμένως στην πλατφόρμα x ο romain huet, διευθυντής εμπειρίας προγραμματιστών της εταιρείας, το φετινό devday δεν κυκλοφόρησε κανένα νέο μοντέλο και επικεντρώθηκε μόνο στις βελτιώσεις api.

και το openai συσκεύασε όντως μια σειρά από api σε πραγματικό χρόνο, άμεση αποθήκευση στην κρυφή μνήμη, απόσταξη μοντέλων, οπτική βελτίωση, βελτιστοποίηση παιδικής χαράς, καθώς και επέκταση του πεδίου εφαρμογής του o1 api και αύξηση του ορίου ποσοστού για προγραμματιστές σε αυτήν την πραγματική "ημέρα προγραμματιστή". σημαντικές ενημερώσεις εργαλείων.

η τιμολόγηση αυτών των νέων api δεν είναι απολύτως φθηνή. πολλοί προγραμματιστές σχολιάζουν ότι ο συνδυασμός τιμολόγησης και δυνατοτήτων τα κάνει ελκυστικά. αυτό το ειλικρινές πακέτο δώρου προγραμματιστή παρουσιάζεται αμέσως και το openai εξακολουθεί να θέλει να βγάλει τα περισσότερα χρήματα πουλώντας τα καλύτερα προϊόντα.

πηγή εικόνας: @swyx |

1

api σε πραγματικό χρόνο: δημιουργήστε τη δική σας εφαρμογή "her" σε ένα βήμα

ως το πιο εντυπωσιακό χαρακτηριστικό σήμερα, το realtime api επιτρέπει στους προγραμματιστές να καλούν το gpt-4o-realtime-preview, το υποκείμενο μοντέλο της προηγμένης λειτουργίας φωνής του chatgpt, για να δημιουργήσουν μια γρήγορη και φυσική εμπειρία συνομιλίας φωνής σε εφαρμογές. υποστηρίζει 6 προκαθορισμένες φωνές για την επίτευξη φωνητικής αλληλεπίδρασης χαμηλής καθυστέρησης.

κατά τη δημιουργία βοηθών φωνής στο παρελθόν, οι προγραμματιστές έπρεπε να βασίζονται σε πολλά μοντέλα για να ολοκληρώσουν διαφορετικές εργασίες: πρώτα χρησιμοποιώντας ένα μοντέλο αναγνώρισης ομιλίας όπως το whisper για να μεταγράψουν τον ήχο σε κείμενο, μετά περνούσαν το κείμενο σε ένα μοντέλο γλώσσας για συμπέρασμα και, τέλος, δημιουργούσαν ομιλία μέσω ένα μοντέλο εξόδου κειμένου σε ομιλία. όχι μόνο είναι περίπλοκη η διαδικασία, αλλά το συναίσθημα και η προφορά μπορούν εύκολα να χαθούν και υπάρχουν σημαντικές καθυστερήσεις.

το api σε πραγματικό χρόνο απαιτεί μόνο μία κλήση για να ολοκληρωθεί ολόκληρη η διαδικασία συνομιλίας. βελτιώστε δραματικά τη φυσικότητα και την ανταπόκριση των συνομιλιών μέσω ροής εισόδου και εξόδου ήχου. χρησιμοποιεί μια μόνιμη σύνδεση websocket για την ανταλλαγή μηνυμάτων με το gpt-4o και υποστηρίζει κλήσεις λειτουργιών, οι οποίες μπορούν να ανταποκρίνονται γρήγορα σε αιτήματα, να εκτελούν λειτουργίες όπως η υποβολή παραγγελιών ή η παροχή εξατομικευμένων υπηρεσιών. μπορεί επίσης να χειριστεί αυτόματα διακοπές όπως η προηγμένη λειτουργία φωνής για να εξασφαλίσει μια πιο ομαλή εμπειρία χρήστη. είναι πολύ κατάλληλο για υποστήριξη πελατών, εκμάθηση γλώσσας και άλλα σενάρια που απαιτούν υψηλή διαδραστικότητα.

στη σκηνή, το προσωπικό παρουσίασε τον φωνητικό βοηθό που κατασκευάστηκε μέσω api σε πραγματικό χρόνο, βοηθώντας περισσότερους από 100 προγραμματιστές στο κοινό να "καλέσουν και να δώσουν μια παραγγελία για 400 φράουλες για παράδοση".