o “wealth recording” do three sheep é falso, mas a tecnologia por trás dele é realmente assustadora

o “wealth recording” de three sheep é falso, mas a tecnologia por trás dele é realmente assustadora

2024-09-29

se você quiser dizer qual empresa está em destaque nesse período, tem que ser a three sheep. eles estão no noticiário de vez em quando e estão na coluna jurídica.

apenas alguns dias atrás, o escândalo mooncake ainda não havia passado e outro escândalo de gravação estourou.

a coisa é assim. no dia 20 de setembro, circulou repentinamente na internet uma gravação que se suspeitava ser uma gravação de lu, executivo sênior da three sheep.

a gravação envolve muitas âncoras femininas do three sheeps. não discutiremos o conteúdo específico aqui.mas foi realmente explosivo. . .

após o lançamento da gravação, ela rapidamente causou uma onda de entusiasmo na internet. algumas pessoas disseram que esta gravação era puramente uma ostentação de um homem depois de beber demais, mas o tópico da discussão logo se voltou para se essa coisa foi gerada pela ia, e até atraiu muitos dos chamados especialistas em ia para iniciar uma análise.

em dois dias, o relatório policial foi divulgado:apenas disperse, foi a ia que fez isso.

o outro protagonista deste incidente, reecho, finalmente apareceu e deu um duro golpe em seus usuários.

curiosamente, embora as autoridades tenham se manifestado, alguns internautas ainda achavam que lu estava “dizendo a verdade enquanto estava bêbado” e que o relatório estava apenas transferindo a culpa para a ia, que não tinha como se autocertificar.

mas não importa o que você diga, o relatório oficial da investigação foi divulgado. quer você acredite ou não, o tom deste assunto foi definido.

no entanto, com base na minha compreensão da voz da ia, uma situação como o portão de gravação das três ovelhas é realmente possível. principalmentea atual tecnologia de voz de ia está realmente bastante madura.

porque só precisamos fazer upload de uma ou duas frases e deixar o resto diretamente para a ia, e podemos clonar a voz de uma pessoa em minutos.

vamos colocar desta forma: a síntese de voz por ia é mais comum agora e existem muitos projetos de código aberto. existem dois tipos principais de tecnologias: tts e svc&rvc.

o chamado tts, simplesmente, é text to speech, converta texto em fala. como muitos humanos digitais de ia, livros de áudio e dublagem de vídeo, todo mundo costuma ouvir "olhe o nome deste homem, xiaoshuai" ao usar douyin, bem como aquelas vozes femininas da tvb e primos de guangxi na biblioteca de materiais de clipes. . . basicamente, tudo é feito pelo tts.

por exemplo, reecho, que desta vez está envolvido no three sheep recording gate, também é um site de geração de modelo tts. na verdade, também clonamos a voz do seiyu dan dan em seu site, para que você possa ouvir e ver se parece.

deixe-me começar com os “trechos do famoso artigo” “espaguete misturado com concreto nº 42”, não diga, você realmente não diz. o nível de reprodução do som pode ser de 80% a 90%, e o tom de voz é tão semelhante que, se você não ouvir com atenção, pensará que está fazendo alguma popularização científica séria.

notícias

o “wealth recording” de three sheep é falso, mas a tecnologia por trás dele é realmente assustadora

introdução

minhas informações de contato