“wealth recording” de three sheep es falso, pero la tecnología detrás de él es realmente aterradora

“wealth recording” de three sheep es falso, pero la tecnología detrás de ella es realmente aterradora

2024-09-29

si quiere decir qué empresa está en el centro de atención durante este período, no es otra que three sheep. aparecen en las noticias de vez en cuando y están en la columna legal.

hace apenas unos días, el escándalo mooncake aún no había pasado y estalló otro escándalo discográfico.

la cosa es así el 20 de septiembre, de repente circuló en internet una grabación que se sospechaba que era una grabación de lu, un alto ejecutivo de three sheep.

la grabación involucra a muchas presentadoras de three sheeps. no discutiremos el contenido específico aquí.pero fue realmente explosivo. . .

después de que se publicó la grabación, rápidamente provocó una ola de entusiasmo en internet. algunas personas dijeron que esta grabación era puramente la fanfarronería de un hombre después de beber demasiado, pero el tema de discusión pronto se centró en si esto fue generado por ia, e incluso atrajo a muchos de los llamados expertos en ia.

al cabo de dos días salió el informe policial:dispersémonos todos, fue la ia la que lo hizo.

el otro protagonista de este incidente, reecho, finalmente salió a la luz y propinó un duro golpe a sus usuarios.

curiosamente, a pesar de que las autoridades se presentaron, algunos internautas todavía sintieron que lu estaba "diciendo la verdad mientras estaba borracho" y que el informe simplemente echaba la culpa a la ia, que no tenía forma de autocertificarse.

pero no importa lo que diga, el informe oficial de la investigación ha salido a la luz, lo crea o no, el tono de este asunto ya está establecido.

sin embargo, según mi comprensión de la voz de la ia, una situación como la puerta de grabación de las tres ovejas es realmente posible. principalmentela tecnología de voz ai actual es bastante madura.

porque solo necesitamos cargar una o dos frases y dejar el resto directamente a la ia, y podemos clonar el timbre de una persona en minutos.

digámoslo de esta manera, la síntesis de voz con ia es más común ahora y hay muchos proyectos de código abierto, solo unos pocos. hay dos tipos principales de tecnologías: tts y svc&rvc.

el llamado tts, en pocas palabras, es text to speech, convierte texto en voz. como muchos humanos digitales con ia, audiolibros y doblaje de videos, todos escuchan a menudo "mira el nombre de este hombre xiaoshuai" cuando usan douyin, así como las voces femeninas de tvb y los primos de guangxi en la biblioteca de material de clips. . . básicamente, todo lo hace tts.

por ejemplo, reecho, que esta vez participa en three sheep recording gate, también es un sitio web de generación de modelos tts. de hecho, también hemos clonado la voz del seiyu dan dan de bad review jun en su sitio web, para que todos puedan escuchar y ver si se parece.

empezaré con los "extractos del famoso artículo" "espaguetis mezclados con concreto no. 42", no lo digas, realmente no lo dices. el nivel de reproducción del sonido puede ser del 80% al 90%, y el tono de voz es tan similar que si no escuchas con atención, pensarías que estás haciendo una importante divulgación científica.

noticias

“wealth recording” de three sheep es falso, pero la tecnología detrás de ella es realmente aterradora

introducción

mi información de contacto