νέα

η προηγμένη λειτουργία φωνής chatgpt είναι πλήρως ανοιχτή, οι λεπτομέρειες που πρέπει να γνωρίζετε είναι εδώ

2024-09-25

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

δεν χρειάζεται να περιμένετε μέχρι το φθινόπωρο νωρίς σήμερα το πρωί, το openai ανακοίνωσε ότι η νέα έκδοση της προηγμένης λειτουργίας φωνής του chatgpt θα κυκλοφορήσει πλήρως σε όλους τους χρήστες plus και team αυτή την εβδομάδα.

ο διευθύνων σύμβουλος του openai, sam altman, δημοσίευσε στην πλατφόρμα x:

η προηγμένη λειτουργία φωνής κυκλοφορεί επίσημα σήμερα! (θα εκδοθεί πλήρως αυτή την εβδομάδα) ελπίζω να αισθάνεστε ότι αξίζει την αναμονή🥺🫶

ωστόσο, η νέα έκδοση της προηγμένης λειτουργίας φωνής έχει επίσης ημερήσιο χρονικό όριο χρήσης και αυτό το όριο θα αλλάξει επίσης όταν ο χρήστης έχει 15 λεπτά, το σύστημα θα εκδώσει μια υπενθύμιση.

αυτό σημαίνει ότι μπορεί να μην είναι ρεαλιστικό να το χρησιμοποιήσετε ως στενό φίλο με τεχνητή νοημοσύνη με τον οποίο μπορείτε να μιλήσετε για τα πάντα 24 ώρες την ημέρα.

υπάρχουν δύο απλοί τρόποι για να προσδιορίσετε εάν έχετε αποκτήσει προσόντα push.

αρχικά, εάν πληροίτε τις προϋποθέσεις για ώθηση, η ακόλουθη ειδοποίηση θα εμφανιστεί στην εφαρμογή όταν αποκτήσετε πρόσβαση στη λειτουργία φωνής για πρώτη φορά:

η δεύτερη μέθοδος είναι να ελέγξετε τον αριθμό των στυλ φωνής.

προηγουμένως, το chatgpt υποστήριζε πέντε προκαθορισμένα στυλ φωνής, αλλά στη συνέχεια αφαιρέθηκε από τα ράφια λόγω νομικής διαμάχης μεταξύ του στυλ φωνής "sky" και του "widow sister".

σήμερα, το openai λανσάρει πέντε νέα στυλ φωνής που ακούγονται πιο φυσικά—vale, spruce, arbor, maple και sol.

ο επίσημος ιστότοπος openai περιγράφει αυτούς τους εννέα ήχους ως εξής:

arbor - εύκολη και ευέλικτη

breeze - ζωντανό και σοβαρό

cove - ήρεμος και ευθύς

ember - βέβαιος και αισιόδοξος

juniper - ανοιχτό και αισιόδοξο

maple - χαρούμενος και ειλικρινής

sol - έξυπνο και χαλαρό

ερυθρελάτη - ήρεμη και σίγουρη

vale - έξυπνος και περίεργος

αφού ακούσουν το νέο στυλ φωνής, οι χρήστες του διαδικτύου έχουν όλοι τις δικές τους προτιμήσεις. κάποιοι νοσταλγούν το «sky», ενώ άλλοι έχουν ήδη βυθιστεί στο νέο στυλ φωνής. το sol είναι αυτή τη στιγμή ο πιο δημοφιλής τόνος. είστε ευπρόσδεκτοι να τον μοιραστείτε στην περιοχή σχολίων.

ποια είναι λοιπόν η επίδραση της προηγμένης λειτουργίας φωνής του chatgpt;

ο υπάλληλος παρέχει ένα παράδειγμα όταν θέλετε να ζητήσετε ειλικρινά συγγνώμη από τη γιαγιά σας που μιλάει μόνο μανδαρίνια για την καθυστέρηση, μπορείτε να χρησιμοποιήσετε το chatgpt, το οποίο μιλάει περισσότερες από 50 γλώσσες, για να το πετύχετε.

το ακούσατε σωστά, το chatgpt είπε τα εξής στα mandarin με σαφή και συνοπτικό τρόπο:

γιαγιά, συγγνώμη, δεν είχα σκοπό να σε αφήσω να περιμένεις τόσο καιρό.

επιπλέον, η προηγμένη λειτουργία φωνής του chatgpt υποστηρίζει πλέον τη ρύθμιση προσαρμοσμένων εντολών.

το προσωπικό του openai επισημαίνει ότι η φωνητική τροπικότητα (ο τρόπος με τον οποίο εκδίδεται μια φωνή) περιέχει πολλά στοιχεία που μπορεί να μην αντικατοπτρίζονται σε μια συνομιλία κειμένου, όπως προφορά, τονισμό, ρυθμό κ.λπ.

τώρα, οι χρήστες μπορούν να προσαρμόσουν τον τρόπο ομιλίας ενός μοντέλου ai μέσω ρυθμίσεων που περιγράφουν με μεγαλύτερη ακρίβεια πώς θέλει ο χρήστης να μιλάει το μοντέλο.

έδωσε παραδείγματα όπως το να βάλετε το μοντέλο να μιλάει με συγκεκριμένο ρυθμό, να εκφωνεί καθαρά, να μιλά αργά και να χρησιμοποιεί τακτικά το όνομα του χρήστη. συνιστά να ξεκινήσετε απλά, όπως να ενημερώσετε το μοντέλο το όνομα του χρήστη και ορισμένες βασικές πληροφορίες.

σε ένα συγκεκριμένο σενάριο, οι χρήστες ρωτούν τι διασκεδαστικά πράγματα μπορούν να κάνουν το σαββατοκύριακο. η προηγμένη λειτουργία φωνής του chatgpt παρέχει προτάσεις με βάση τον καιρό και την τοποθεσία του χρήστη (περιοχή του κόλπου), όπως πεζοπορία, πικνίκ ή οδήγηση κατά μήκος της διαδρομής 1.

ή όταν λέει ότι της αρέσει η ιδέα να οδηγεί γύρω από το τοπίο και ρωτά ποια διαδρομή πρέπει να ακολουθήσει, η chatgpt μπορεί να καταλήξει σε ένα λεπτομερές σχέδιο.

εν ολίγοις, προσαρμόζοντας τη φωνή και την αλληλεπίδραση του μοντέλου, η προηγμένη λειτουργία φωνής του chatgpt μπορεί να παρέχει συγκεκριμένες προτάσεις με βάση τις προτιμήσεις και τις ανάγκες του χρήστη, κάνοντας τις αλληλεπιδράσεις πιο φυσικές και χρήσιμες.

επιπλέον, η ταχύτητα συνομιλίας, η ευχέρεια και η προφορά της νέας έκδοσης της προηγμένης λειτουργίας φωνής chatgpt έχουν βελτιωθεί σημαντικά.

μιλώντας για την εμπειρία του χρήστη, ο σχεδιαστής μοντέλων openai drew είπε ότι όταν κάνει κάτι ή δεν χρειάζεται να μιλήσει στο chatgpt, το chatgpt θα παραμείνει ήσυχο.

όταν έχει μια ερώτηση, την κάνει και η ερώτηση μπορεί να εξελιχθεί σε μια μακρά συζήτηση.

κατά τη διάρκεια μιας συνομιλίας, η φωνή του chatgpt προσαρμόζεται στον τόνο της συνομιλίας. κατά την άποψή του, το chatgpt είναι σαν ένας φίλος που κάθεται δίπλα του, όχι μόνο παρέχει πληροφορίες αλλά και επικοινωνεί ιδέες.

στην πράξη, μπορείτε επίσης να δοκιμάσετε να το χρησιμοποιήσετε για να εξασκηθείτε σε συνεντεύξεις και άλλα σενάρια χωρίς να ανησυχείτε για καθυστερήσεις.

«εννοώ ότι η καθυστέρηση είναι τόσο χαμηλή, είναι σαν να μιλάς σε άλλον άνθρωπο», τόνισε ο ντρου.

για την πρώτη παρτίδα εμπειριών χρήστη, μπορείτε να διαβάσετε τα προηγούμενα άρθρα της appso👇

η πρώτη παρτίδα εμπειριών χρήστη της λειτουργίας φωνής gpt-4o είναι εδώ! η ταινία «her» τελικά έγινε πραγματικότητα, netizen: παραλίγο να την ερωτευτώ

αξίζει να σημειωθεί ότι η νέα έκδοση της προηγμένης λειτουργίας φωνής που λανσαρίστηκε από το openai δεν είναι προς το παρόν ανοιχτή στην εε, το ηνωμένο βασίλειο, την ελβετία, την ισλανδία, τη νορβηγία και το λιχτενστάιν.

μια πέτρα προκάλεσε χιλιάδες κύματα και οι επηρεασμένοι χρήστες του διαδικτύου ήταν και θυμωμένοι και αβοήθητοι.

δυστυχώς, η κοινή χρήση βίντεο και οθόνης του chatgpt εξακολουθεί να μην είναι ζωντανή.

πριν από τέσσερις μήνες, αυτό το χαρακτηριστικό αποκαλύφθηκε σε συνέντευξη τύπου. εκείνη την εποχή, το openai μας έδειξε επίσης πώς να ρωτάμε το chatgpt σε πραγματικό χρόνο το μαθηματικό πρόβλημα στο χαρτί που έχετε μπροστά σας ή τον κωδικό στην οθόνη του υπολογιστή.

προς το παρόν, το openai δεν έχει διευκρινίσει πότε θα ξεκινήσει αυτή η δυνατότητα.

σε μια βιομηχανία τεχνητής νοημοσύνης όπου η ανάπτυξη είναι πάντα απρόβλεπτη, η καθυστερημένη προηγμένη λειτουργία φωνής είναι ουσιαστικά ένα ευνουχισμένο προϊόν.

δεν υπάρχουν νέα χαρακτηριστικά που να είναι πολύ εντυπωσιακά και δεν έχει καν εκπληρώσει τις λειτουργικές δεσμεύσεις στο συνέδριο του μαΐου.

παραδόξως, το «προσεχώς» στο λεξικό openai φαίνεται να είναι διαφορετικό από το δικό μας.

ορισμένες από καιρό υποσχεμένες λειτουργίες μπορεί να σημαίνουν αύριο ή τον επόμενο χρόνο.

αν το σκεφτείς από άλλη οπτική γωνία, το openai, το οποίο έχει εξαιρετικές τεχνικές δυνατότητες, είναι επίσης μια εταιρεία που πουλάει τη φαντασία που περιμένουμε περισσότερο.

άλλωστε τους έχει γίνει παράδοση, σωστά;

κάτι ακόμα

ο επίσημος ιστότοπος openai ενημέρωσε σήμερα μια έκδοση των απαντήσεων qa σχετικά με τη λειτουργία φωνής chatgpt. συνοψίσαμε επίσης μερικές πρακτικές απαντήσεις, ελπίζοντας να σας βοηθήσουμε.

1. όταν χρησιμοποιείτε τη σύνθετη λειτουργία φωνής, μπορείτε ακόμα να κολλάτε στο φόντο του τηλεφώνου σας και να συνεχίσετε τη συνομιλία.

2. εάν μεταβείτε από τη λειτουργία κειμένου ή τυπικής φωνής σε προηγμένη λειτουργία φωνής, σημειώστε ότι δεν θα μπορείτε να επιστρέψετε στην προηγούμενη κατάσταση κειμένου ή τυπικής φωνητικής συνομιλίας.

3. όταν χρησιμοποιείτε λειτουργίες bluetooth στο αυτοκίνητο ή hands-free στο αυτοκίνητο, η εμπειρία του προηγμένου φωνητικού διαλόγου μπορεί να επηρεαστεί επειδή το openai επί του παρόντος δεν παρέχει ειδική βελτιστοποίηση για αυτές τις συσκευές.

3. ο προηγμένος φωνητικός διάλογος δεν είναι ακόμη ανοιχτός σε gpt. μπορείτε να έχετε μόνο τυπικές φωνητικές συνομιλίες με gpt. τα gpt έχουν τη δική τους μοναδική επιλογή φωνής που ονομάζεται shimmer.

4. προκειμένου να σεβαστεί τα πνευματικά δικαιώματα των δημιουργών μουσικής, το openai έχει υιοθετήσει μια σειρά από μέτρα ασφαλείας, συμπεριλαμβανομένων νέων συνθηκών φιλτραρίσματος για να αποτρέψει τις φωνητικές συνομιλίες από τη δημιουργία μουσικού περιεχομένου, συμπεριλαμβανομένου του τραγουδιού.

5. προηγμένη λειτουργία ομιλίας οι συνομιλίες είναι πολυτροπικού χαρακτήρα και το κείμενο που μεταγράφεται δεν ταιριάζει πάντα ακριβώς με την αρχική συνομιλία.

6. ο ήχος στη σύνθετη φωνητική συνομιλία θα διατηρηθεί μαζί με το ιστορικό συνομιλιών μέχρι να το διαγράψετε ενεργά. μετά τη διαγραφή, ο ήχος συνήθως διαγράφεται εντός 30 ημερών, αλλά μπορεί να διατηρηθεί περισσότερο σε ορισμένες περιπτώσεις.

7. το openai λέει ότι από προεπιλογή, το σύστημα δεν θα χρησιμοποιεί τον ήχο σας σε φωνητικές συνομιλίες για να εκπαιδεύσει το μοντέλο, εκτός εάν επιλέξετε να μοιραστείτε τον ήχο.

8. εάν η επιλογή "βελτίωση εμπειρίας φωνητικής συνομιλίας για όλους τους χρήστες" δεν είναι ενεργοποιημένη στις "ρυθμίσεις", σημαίνει ότι δεν έχετε μοιραστεί ήχο και το σύστημα δεν θα χρησιμοποιήσει τον ήχο σας για να εκπαιδεύσει το μοντέλο.