Nachricht

OpenAI führt den GPT-4-Sprachmodus ein, der im Herbst allen zahlenden Benutzern zur Verfügung stehen wird

2024-07-31

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

OpenAI, ein amerikanisches Forschungsunternehmen für künstliche Intelligenz, gab kürzlich bekannt, dass es ab heute den GPT-4-Sprachmodus für einige ChatGPT Plus-Benutzer einführen wird. Dieser erweiterte Sprachmodus ermöglicht natürlichere Gespräche in Echtzeit, bei denen Benutzer jederzeit unterbrechen können und GPT-4 in der Lage ist, die Emotionen der Benutzer zu erkennen und darauf zu reagieren. Die Einführung dieser Funktion bedeutet für OpenAI einen weiteren wichtigen Durchbruch in der Sprachassistententechnologie, insbesondere im Hinblick auf die beiden bekannten technischen Schwierigkeiten der Echtzeitreaktion und der Unterbrechung von Gesprächen.

OpenAI brachte im Mai dieses Jahres eine neue Version des großen Modells GPT-4 auf den Markt und demonstrierte auch dessen Sprachmodus. Ursprünglich war geplant, den Sprachmodus Ende Juni schrittweise für Benutzer zu öffnen, doch die endgültige Entscheidung bestand darin, die Veröffentlichung auf Juli zu verschieben. Den Plänen von OpenAI zufolge wird der Sprachmodus im Herbst für alle ChatGPT Plus-Benutzer verfügbar sein.

Derzeit bietet der Sprachmodus des GPT-4 vier voreingestellte Sounds, nämlich Juniper, Breeze, Cove und Ember. Die Stimmen werden von OpenAI in Zusammenarbeit mit bezahlten Synchronsprechern produziert.