Моя контактная информация
Почта[email protected]
2024-08-19
한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina
Новости за 19 августа, HKUSTiFlytekобъявитьискраБольшое обновление модели голоса, официально выпущенное на SparkЭкстремальная скоростьдогонятьолицетворениевзаимодействовать и применять свои возможности к функции «XiaoXing Chat» приложения iFlytek Spark, которая будет открыта для публики в конце августа.
Судя по официальным результатам показа, Spark Extreme Super Anthropomorphic Interaction добилась прорыва в четырех аспектах: скорость реакции и прерывания, восприятие эмоций и эмоциональный резонанс, выражение, управляемое голосом, и человеческая ролевая игра.
Что касается скорости ответа, Xinghuo Extremely Fast Super Anthropomorphic Interaction поддерживает несколько раундов взаимодействия, а скорость ответа такая же быстрая, какГПТ-4oВполне, почти соответствует обычному ритму человеческого общения. Пользователи могут прерывать разговор или вставлять его в любой момент во время разговора, а система может быстро реагировать, обеспечивая по-настоящему беспрепятственный диалог.
Что касается восприятия эмоций и эмоционального резонанса, Xinghuo Extreme Super Anthropomorphic Interaction может распознавать различные эмоции пользователя, такие как счастье, гнев, печаль, радость и т. д., не только судя по содержанию звука, но и реагируя соответствующими эмоциями. Кроме того, система может распознавать невербальные звуки, такие как кашель и звуки домашних животных, и давать соответствующие ответы.
Что касается управляемого голосом выражения, по сравнению с предыдущей ситуацией, когда машинный голос нельзя было регулировать при голосовом взаимодействии, теперь, пока голос дает инструкции, суперантропоморфным можно управлять, чтобы вносить изменения в выражения, такие как эмоции, стиль, диалект, интенсивность и т. д.
Что касается «ролевых игр», то он поддерживает различные ролевые симуляции и может менять роли в соответствии с потребностями пользователя, делая общение более интересным и интерактивным.
Сообщается, что iFlytek использует унифицированную нейронную сеть для реализации сквозного моделирования речи в речь, упрощая традиционное голосовое взаимодействие «речь-текст», большую модель ответа и процессы синтеза речи, тем самым значительно сокращая время ответа. время и улучшение персонификации и беглости взаимодействия. Кроме того, благодаря обучению развязке многомерных голосовых атрибутов система может более гибко управлять контентом, тембром, эмоциями и другими элементами для удовлетворения различных сценариев и потребностей.
В iFlytek заявили, что Spark Extreme Super Human Interaction будет полностью открыт для использования к концу августа, и планируют продолжать расширять интерактивные функции и режимы в будущем, чтобы предоставлять пользователям более богатые и практичные интеллектуальные голосовые услуги. Поскольку технологии продолжают развиваться, а сценарии применения расширяются, ожидается, что интеллектуальные голосовые технологии ознаменуют взрывной рост во многих областях, таких как смартфоны и умные автомобили. По прогнозам IDC, к 2030 году мировой рынок интеллектуальных голосовых услуг достигнет примерно 73,16 млрд долларов США, а совокупный годовой темп роста составит 27%. (соленый)
Эта статья взята из отчета о технологиях NetEase. Для получения дополнительной информации и подробного содержания подписывайтесь на нас.