новости

можно ли создать записывающий ии г-на лу из «трёх овец»? мой ответ: конечно

2024-09-27

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

рано утром n человек прислали мне фотографию, сообщив, что об этом уведомила полиция, и спросили, как определить, была ли запись «трех овец» искусственной.
некоторые друзья рассказали мне, что есть человек, который утверждает, что является человеком номер один в области ии в китае. ранее он поклялся, что эта запись не может быть сделана ии и что ии не может ее произвести. так может ли за этим отчетом стоять какая-то теория заговора?
я чуть не брызнул. кто первый ии в китае? моя первая реакция была, что академики тоже перестали участвовать в таких скучных вещах?
потом я поискал... ох... забудь об этом.
я думаю, мне необходимо популяризировать какую-то науку, то есть сможет ли ии достичь уровня записи саньянглу?
могу дать вам однозначный ответ: да.
для начала давайте кратко поговорим о предыстории.
у трех овец и симбы был неприятный роман. они просто дрались друг с другом, ходили туда-сюда, и это было так оживленно.
затем, когда беспорядки достигли своего пика, в интернете распространилась взрывная запись выступления лу вэньцина, председателя «трех овец».
вот и всё, я сделал кое-какие сокращения, а также заглушил некоторые неприличные места.
содержание взрывное и шокирующее, с большим доверием и шокирующим содержанием. оно включает в себя борьбу за власть, мошенничество и т. д. подводя итог, г-н лу рассказал, что у него были неправильные отношения со всеми ведущими женского пола «трех овец». он также назвал чжан имина и посмотрел на него свысока. . .
вероятно, так и произошло, и тогда об этом сообщили three sheep, заявив, что запись была синтезирована ии.
в интернете много споров. большинство людей понимают, что ии не может производить запись такого уровня. почему? потому что это сказал «первый человек в отечественном ии».
эта запись звучит очень реалистично, не так ли? есть эмоции, диалекты и шумы, поэтому возникает два вопроса. была ли эта запись сделана ии? и сможет ли ии достичь такого уровня записи?
на первый вопрос сегодня получен ответ. я всегда буду безоговорочно верить в нашу общественную безопасность. я также считаю, что публикуемые ими сообщения являются фактами. итак, ответ на первый вопрос довольно ясен: это то, что делает ии.
итак, второй вопрос, самый важный: сможет ли ии достичь такого уровня записи.
мой ответ: конечно.
прежде всего, мне нужно популяризировать здесь какую-то науку. ии — это широкая категория, и в ее подразделениях много направлений.
есть большие языковые модели (gpt, claude, doubao и др.), рисование ai (mj, sd, flux и др.), ai аудио (11labs, svc, gpt-sovtis, suno и др.), ai видео (runway , keling, doubao, pixverse и т. д.) и ai 3d (tripoai, meshy и т. д.).
в аудио ai оно разделено на музыку, создаваемую ai, звуковые эффекты, создаваемые ai, и клонирование звука.
данная запись относится к треку клонирование звука.
так что не говорите, что если ии и может это сделать, то он мощнее, чем openai или chatgpt. они не на одном пути, поэтому нет никакого сравнения. как вы и сказали, вау, эта стиральная машина действительно хороша в стирке. одежда, даже лучше, чем тот холодильник. . .
клонирование голоса делится на два типа: tts (текст в речь) и svc (изменение голоса ai).
tts — это предоставить голосу человека несколько секунд и десятков секунд материала для обучения модели ии, а затем напрямую использовать текст для генерации речевого синтеза звука голоса конкретного человека. лучшим проектом с открытым исходным кодом сейчас должен быть gpt-совит.
svc обычно можно понимать как изменение голоса ии, которое является устройством смены голоса в эпоху ии. в настоящее время в области ии-устройств смены голоса существует три ведущих подпроекта: so-vits-svc, rvc и ddsp.
хорошо, теперь ясно, что в области клонирования голоса ии существует два метода подделки голоса.
преимущество проекта tts в том, что требования к данным невелики, достаточно всего 5 секунд аудиоматериала, и ваш голос можно клонировать. после этого вам нужно только предоставить текст для создания звука. стоимость чрезвычайно низкая, а эффект. это очень быстро. но недостаток в том, что верхние пределы эмоциональности, пауз и реалистичности очень низки. послушав десятки секунд, можно легко сказать, что это привкус ии.
раньше все думали, что ии не сможет сделать аудиоподделку г-на лу. все они имели предвзятое мнение о tts и думали, что это должно быть сделано с помощью tts.
честно говоря, tts действительно немного сложно производить звук уровня господина лу, основываясь на общедоступных на рынке продуктах, о которых я знаю (исключая проекты во внутренних лабораториях крупных компаний).
однако, если вдуматься, tts этого сделать не может, а как насчет svc?
недостатком svc является его высокая стоимость. требуется 30-минутный набор аудиоданных, а затем несколько часов обучения алхимии для тренировки голосовой модели человека. наконец, вам нужно найти другого человека для записи звука, а затем использовать svc. изменить голос. звук заменен.
преимущество очень простое: эта штука может сохранять все эмоции говорящего, паузы, тон, диалект и т. д., а верхний предел качества примерно бесконечен. пока модель хороша, нельзя сказать, так ли это. ии или нет.
даже певческий голос можно легко изменить. изменение голоса — это всего лишь небольшой случай.
стефани сан, ии, ставший популярным в прошлом году, был создан на основе svc.
я также написал несколько руководств по svc.
позвольте мне также послушать вас. после того, как я использовал svc, чтобы изменить свой голос, я заменил его своим собственным голосом.ли жунхаоэффект модели.
это прямой ии, я лишь добавил фоновую музыку.
это свк.
итак, используя svc для подделки аудио с помощью искусственного интеллекта г-на лу, шаги очень просты.
1. соберите из интернета около 30 минут данных речи г-на лу. в конце концов, он знаменитость.
2. используйте svc или rvc, чтобы очистить голос г-на лу и обучить его модели искусственного интеллекта.
3. г-н лу родом из аньцина, и в хэфэе много людей из аньцина.найдите кого-нибудь с похожим на него акцентом и сначала прочитайте аудио, которое нужно синтезировать, самостоятельно.
4. наконец, используйте модель искусственного интеллекта svc, чтобы заменить готовый звук его голосом.
то же самое касается и женских голосов.
всё, всё закончилось.
если вы все еще хотите услышать это более реалистично, просто используйте обрезку или что-то еще, чтобы добавить окружающий звук шума ветра. их слишком много, просто найдите его. если вам нужен окружающий звук, с этим справится традиционное звуковое программное обеспечение. также используйте его с окружающим звуком. набор данных пойдет для обучения, хотя я не рекомендую этого делать. . .
в частности, метод оригинального видео заключается в том, чтобы отправить запись на мобильный телефон, затем воспроизвести ее на мобильном телефоне и использовать для ее записи другой мобильный телефон. самого окружающего звука много, и он также смешивается с фоном. смех моих друзей, это беспорядок. это все факторы вне поля. . .
итак, вернемся ко второму вопросу: может ли ии делать поддельные записи, как у г-на лу? конечно, можешь.
не думайте об ии как о слишком мифическом и не думайте об ии как о слишком чушь.искусственный интеллект часто представляет собой искусственный интеллект + интеллект.
нынешняя tts не может решить эмоциональные проблемы, так почему же ии должен иметь дело с эмоциями?
нельзя ли просто изменить тембр после того, как закончишь его читать вручную? это искусственный интеллект + интеллект.
откройте свой разум и не будьте слишком ограничены.
ии — это ваш помощник, вспомогательный инструмент, который вы можете использовать, а не оставлять все на его усмотрение, как лавочника, не прибегающего к помощи.
наконец, я хочу сделать заявление.
я пишу эту статью не для того, чтобы все узнали об этой технологии, а потом нарушили закон, совершили какие-то внелегальные поступки и стали внелегальным гангстером.
вместо этого я надеюсь сделать немного научно-популярной информации об ии-аудио, сгладить информационный пробел и дать всем понять, что такая технология существует, и верхний предел уже здесь. не думайте, что ии не может относиться к ней легкомысленно. . но нам нужно знать, где и какого уровня может достичь нынешний ии.
что можно сделать при поддержке искусственного интеллекта+интеллекта.
прогресс науки и техники необратим. каждый — капля воды в этом огромном потоке, и его можно будет продвигать только вперед. знать всегда лучше, чем не знать. только познав себя и врага, можно одержать победу в каждой битве.
мы многому учимся и изучаем ии, часто чтобы защитить себя.
также защитите наши семьи.
тогда лучшая жизнь.

теперь, когда вы это увидели, если вы считаете, что это хорошо, не стесняйтесь поставить лайк, посмотреть и трижды ретвитнуть. если вы хотите получать уведомления как можно скорее, вы также можете поставить мне звездочку ⭐ ~спасибо, что прочитали мою статью, увидимся в следующий раз.

>/ автор: казик