Новости

Крупные модели создают почву для глубоких подделок, и отрасль призывает к междисциплинарным совместным усилиям по борьбе с поддельными технологиями.

2024-07-24

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

·Развитие технологии идентификации подделок требует междисциплинарного сотрудничества. Текущая технология идентификации подделок в основном основана на программных алгоритмах, и в будущем она будет двигаться в сторону интеграции программного и аппаратного обеспечения.


Появление крупных моделей создало основу для глубокой подделки, и отрасль призвала к междисциплинарным совместным усилиям по борьбе с контрафактной технологией.

В эпоху больших моделей границы между речью, синтезированной искусственным интеллектом, и реальной речью становятся все более размытыми, и необходимо срочно совершенствовать технологию распознавания совпадений. 23 июля в Шанхае прошел финал 9-го глобального конкурса алгоритмов искусственного интеллекта Xinye Technology Cup, посвященный теме глубокого распознавания подделок речи. Участникам было предложено использовать методы глубокого обучения и противодействия искусственному интеллекту для разработки алгоритмов, способных точно идентифицировать. ложные голоса модели.

Deepfake — это метод, который использует технологии глубокого обучения и искусственного интеллекта для создания высокореалистичного фейкового контента. Появление крупных моделей создало почву для глубоких подделок. Достаточно ввести слово, и система искусственного интеллекта выдаст изображения, видео и аудио, что затруднит различение правды от лжи.

Если взять в качестве примера ложные голоса, то большие модели могут генерировать различные ложные голоса. Эти ложные голоса более реалистичны, антропоморфны и ведут плавный разговор, что усложняет распознавание ложного голоса. «В некоторых сценариях с высокой стоимостью часто происходит мошенничество с голосом, генерируемое ИИ. Однако нынешнее развитие технологии голосовой идентификации отстает от технологии синтеза речи», — сказал Чэнь Лэй, вице-президент Xinye Technology и руководитель отдела больших данных и искусственного интеллекта.

В финале участники использовали различные модели алгоритмов и идеи обучения для выявления ложной речи, включая технологию распознавания на основе крупных моделей и традиционную технологию сквозного распознавания. Технология сквозного распознавания имеет меньшее количество параметров и фокусируется на более вертикальных проблемах; большая модель имеет большее количество параметров, имеет более высокие требования к данным и обладает высокой способностью к обобщению генерируемых ложных речевых данных. Большая модель была значительно улучшена.

По словам Лу Цяна, специалиста по алгоритмам из компании Xinye Technology, набор речевых данных для предварительного конкурса в основном состоит из фальшивой речи, генерируемой традиционным сквозным TTS (преобразованием текста в речь), которую легче идентифицировать. впервые в набор данных полуфинала добавляется фальшивая речь, сгенерированная на основе последней большой модели, расшифровка фальшивых голосов и сэмплов, объединенных из реальных и фальшивых языков, охватывающих более пяти языков, таких как английский, французский и т. д. и испанский, и сложность соревнований возрастает. «Добавление в полуфиналах фальшивых голосов, генерируемых крупными моделями, усложнило соревнование, что также показывает, что способность последних крупных моделей «маскировать фейки под настоящие» стала сильнее, что требует соответствующей технологии распознавания дипфейков. поддерживать."

«Мы намеренно добавили в конкурс некоторые новые данные сцены, такие как копирование фальшивых голосов, которые представляют собой данные, сгенерированные после нескольких записей реальных голосов. Мы думаем, что это фальшивый голос, — сказал Лу Цян, — в этом сценарии конкурс использует настоящие и настоящие голоса». нарезка и смешивание фальшивой речи для создания состязательных данных, чтобы избежать искусственного прослушивания речи и маркировки, мешающей конкуренции. «Пока один фрагмент является фальшивой речью, тогда весь фрагмент является фальшивой речью. Это ближе к реальной сцене, но. Распознавание. Задача огромна. Если проблема копирования и противостояние между подлинностью и ложью будут решены, это будет иметь академическую ценность». Лев Цян также сказал, что мультимодальная информация, такая как текст и видео, поможет в обнаружении подделки речи. , а большие модели и мультимодальность станут ключом к обнаружению подделки речи.

Технология подделки и технология идентификации подделки "гонка", и развитие обоих идет по спирали. Чэнь Лэй сказал, что исследование больших речевых моделей должно абстрагировать и превращать прикладные проблемы в академические проблемы. После решения академических проблем их следует спроектировать для решения реальных потребностей конкретных бизнес-сценариев. Развитие технологии борьбы с контрафактной продукцией требует междисциплинарного сотрудничества. Нынешняя технология борьбы с контрафактной продукцией в основном основана на программных алгоритмах. В будущем она будет интегрировать программное и аппаратное обеспечение. С помощью аппаратного сбора звука можно будет предотвращать и контролировать подделки. голосовые риски на аппаратном уровне.

«Не существует конечной точки для обнаружения подделок. Пока генеративный путь не закончится, обнаружение подделок будет продолжать снижаться». Чэнь Лэй сказал, что после игры Xinye Technology откроет исходные данные и будет использовать их для своих целей. более широкие академические исследования для снижения чувствительности материалов участников. В то же время он внедряет передовые модельные идеи в бизнес-сценарии и создает платформу AIGC для борьбы с подделками. Он считает, что генеративный ИИ должен соответствовать правилам управления. Управление искусственным интеллектом требует разработки на высшем уровне со стороны регулирующих органов для его стандартизации и руководства. Он также призывает к экологическому совместному строительству и совместному созданию промышленности для предотвращения системных рисков.