2024-08-19
한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina
Neuigkeiten vom 19. August, HKUSTiFlytekAnmeldenFunkeGroßes Sprachmodell-Update, offiziell auf Spark gestartetExtreme GeschwindigkeitüberholenPersonifikationinteragieren und seine Fähigkeiten auf die Funktion „XiaoXing Chat“ der iFlytek Spark APP anwenden, die Ende August für die Öffentlichkeit zugänglich sein wird.
Den offiziellen Anzeigeergebnissen nach zu urteilen, hat Spark Extreme Super Anthropomorphic Interaction in vier Aspekten Durchbrüche erzielt: Reaktions- und Unterbrechungsgeschwindigkeit, Emotionswahrnehmung und emotionale Resonanz, sprachsteuerbarer Ausdruck und menschliches Rollenspiel.
In Bezug auf die Reaktionsgeschwindigkeit unterstützt Spark Extremely Fast Super Anthropomorphic Interaction mehrere Interaktionsrunden und die Reaktionsgeschwindigkeit ist so schnell wieGPT-4oGanz, fast im Einklang mit dem normalen Chat-Rhythmus von Menschen. Benutzer können das Gespräch jederzeit unterbrechen oder einwerfen, und das System kann schnell reagieren, wodurch ein wirklich nahtloses Gesprächserlebnis erreicht wird.
In Bezug auf die Wahrnehmung von Emotionen und die emotionale Resonanz kann Xinghuo Extreme Super Anthropomorphic Interaction die verschiedenen Emotionen des Benutzers wie Freude, Wut, Traurigkeit, Freude usw. nicht nur anhand des Klanginhalts erkennen, sondern auch mit entsprechenden Emotionen reagieren. Darüber hinaus kann das System auch nonverbale Geräusche wie Husten und Haustiergeräusche erkennen und entsprechende Antworten geben.
Was den sprachgesteuerten Ausdruck anbelangt, kann das Superanthropomorphe im Vergleich zur vorherigen Situation, in der die Maschinenstimme bei der Sprachinteraktion nicht angepasst werden konnte, nun, solange die Stimme Anweisungen gibt, gesteuert werden, um Änderungen in Ausdrücken wie Emotionen vorzunehmen. Stil, Dialekt, Intensität usw.
Im Sinne des „Rollenspiels“ unterstützt es eine Vielzahl von Rollensimulationen und kann die Rollen je nach Benutzerbedarf wechseln, wodurch die Konversation interessanter und interaktiver wird.
Es wird berichtet, dass iFlytek ein einheitliches neuronales Netzwerk verwendet, um eine durchgängige Speech-to-Speech-Modellierung zu implementieren, wodurch die traditionelle Sprachinteraktion Speech-to-Text, die Antwortgenerierung großer Modelle und die Sprachsyntheseprozesse vereinfacht werden, wodurch die Antwort erheblich verkürzt wird Zeit und Verbesserung der Interaktionspersonifizierung und -flüssigkeit. Darüber hinaus kann das System durch mehrdimensionales Sprachattribut-Entkopplungs-Darstellungstraining Inhalte, Klangfarbe, Emotionen und andere Elemente flexibler steuern, um unterschiedlichen Szenarien und Anforderungen gerecht zu werden.
iFlytek sagte, dass Spark Extreme Super Anthropomorphic Interaction bis Ende August vollständig zur Nutzung freigegeben sein wird und plant, die interaktiven Funktionen und Modi in Zukunft weiter zu erweitern, um Benutzern reichhaltigere und praktischere intelligente Sprachdienste zu bieten. Da die Technologie immer ausgereifter wird und sich die Anwendungsszenarien erweitern, wird erwartet, dass die intelligente Sprachtechnologie in vielen Bereichen wie Smartphones und Smart Cars ein explosionsartiges Wachstum einleiten wird. Laut IDC-Prognosen wird der globale Markt für intelligente Sprachdienste bis 2030 etwa 73,16 Milliarden US-Dollar erreichen, mit einer durchschnittlichen jährlichen Wachstumsrate von 27 %. (salzig)
Dieser Artikel stammt aus dem NetEase Technology Report. Für weitere Informationen und ausführliche Inhalte folgen Sie uns.