notícias

Suno está em crise, Udio atualiza v1.5, é porque ele leva a sério fazer música

2024-07-27

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

Suno está prestes a sentir uma sensação de crise. Udio lançou uma nova versão v1.5, que pode ser descrita como uma frente difícil.
Ontem à noite, o Udio lançou uma atualização importante, que inclui muitos novos recursos e melhorias de desempenho.
O Udio foi lançado em abril deste ano tendo a16z como investidor. Era conhecido como o maior concorrente da Suno desde o seu lançamento e foi reconhecido por músicos profissionais.
Existem muitas aplicações de música generativa e o Udio é particularmente bom para compreender e controlar diferentes estilos e gêneros musicais."Talento Musical"
Você pode obter dois produtos acabados com um comando. O prompt é escrito de forma econômica Considerando seus atributos únicos, quanto mais claramente você inserir o estilo musical desejado no prompt, mais incrível será o efeito.

Mas não fique muito estressado. Existem muitos trabalhos recomendados na página inicial. Quando você olha as instruções, é tão simples que dá medo. Por exemplo, para esta música em forma de sinfonia, a sugestão é apenas “Sinfonia de Beethoven”.

A duração padrão é de 30 segundos e você pode optar por estendê-la. A maneira de estender é que o usuário pode optar por adicionar um parágrafo inicial, um parágrafo final ou um parágrafo de conexão no meio. .

Vamos começar com um dos destaques desta atualização: suporte multilíngue. Na demonstração oficial, é fornecida uma demonstração em mandarim.
歌词内容是怪怪的😂 不少生成式音乐的 demo 都喜欢用「人机情感」的主题,一种奇奇怪怪的执念。
Porém, o arranjo é muito completo, e o canto do mandarim também é muito suave, sem a sensação de “estrangeiros cantando em chinês”.
O processamento de vozes humanas do Udio é notável Na comparação entre v1 e v1.5 fornecida pelo oficial, pode-se ouvir claramente que o “sabor de IA” foi reduzido a um nível sem precedentes (embora também se possa ouvir muito isso). da mistura foi feita). Anel para cobrir).
também,A melhoria na qualidade do som é a mais surpreendente entre todas as atualizações desta vez, trilha sonora estéreo de 48kHz, os graves são particularmente excelentes, muito sólidos e a qualidade do som pode suportar fones de ouvido de alta fidelidade.
Você sabe, a melhoria na qualidade do som traz a possibilidade de dar mais camadas à música.
Suno também pode obter um bom som estéreo. Por exemplo, música orquestral complexa também pode produzir um efeito estéreo.
Mas esta atualização do Udio possui camadas mais ricas e claras. As posições dos diferentes instrumentos podem ser distinguidas com mais clareza, mantendo a harmonia do conjunto sem entrar em conflito ou confusão.
A nova versão também introduz controle de teclas, o que melhora a controlabilidade para usuários com conhecimento musical profissional.Além disso, também suporta geração de áudio (pago), que é igual à geração de imagem.
Use uma peça musical como base e deixe o modelo gerar. Quer você seja um músico profissional (mas pobre) ou um usuário comum, você pode deixar o Udio ajudá-lo a arranjar músicas.
Vídeo do usuário Udio@maxbarzel
Se você é um usuário comum, a geração do Udio possui uma característica especial.
Quando ele não está tão familiarizado com o gênero musical e não consegue escrevê-lo claramente no prompt, Udio geralmente começa com um estilo bem “Disney”.
Por exemplo, contará com orquestração baseada em orquestra, canto musical e, mais importante, um método de modulação que é particularmente comum na música dos filmes da Disney.
Se esta música for usada como segmento solo da heroína em “Cinderela” ou “Branca de Neve”, não será inconsistente.
Só se pode dizer que afinal é a Disney, um gigante da cultura pop, e também é uma escolha segura. Pode ser considerada o “maior denominador comum” na estética musical dos usuários.
masOs assuntos jurídicos da Disney também são muito fortes, a Udio já foi processada conjuntamente por três grandes gravadoras juntamente com a Suno, acusando as obras musicais de seus artistas de serem coletadas e usadas como dados para modelos de treinamento, o que é uma infração.
Se Udio não quiser outro processo, é melhor ter mais cuidado.
A atuação do Udio no jazz é bastante satisfatória. O jazz é caracterizado por ritmos inteligentes e mutáveis. Se for uma apresentação ao vivo, há até muitas mudanças e performances no local.Portanto, é difícil para o modelo aprender Jazz com clareza, mas também pode ser compreendido.
Em outras músicas pop com ritmos mais distintos, basicamente não há grande problema.
O Udio realmente se considera um aplicativo de música. Comparado com a forma como a página inicial do site oficial da Suno apresenta músicas com base em palavras-chave e popularidade, o Udio usa principalmente gêneros e estilos musicais.

O quê, você realmente quer fazer música?
Os responsáveis ​​da Udio não divulgaram os detalhes técnicos, mas usar grandes modelos de linguagem para gerar música nunca foi tão simples.
A linguagem da música é difícil de descrever em palavras, contém uma grande quantidade de informações - talvez apenas um segundo, e contém a integração orgânica de cada batida, nota, vocal e harmonia.
Ao gerar longas sequências de sons, os modelos de IA têm dificuldade em manter a continuidade musical em frases, letras ou passagens extensas. Além disso, como a música inclui vocais e instrumentos, é muito mais difícil de gerar do que a fala.
Mas ao enviá-lo aos usuários, deve ser simples e direto. Os usuários só precisam usar uma linguagem natural, em vez de exigir que cada usuário domine o conhecimento profissional de teoria musical.
O CEO da Udio, David Ding, e o cofundador Charlie Nash trabalharam para a Deepmind e participaram do desenvolvimento do modelo musical Lyria, que foi lançado em novembro do ano passado e foi considerado o modelo musical mais complexo do mundo na época.


Mais tarde, David Ding convidou seus colegas para abrirem um negócio juntos, e foi assim que nasceu o Udio.
No entanto, novamente, apesar da capacidade do Udio, ainda não é ao ponto de poder substituir uma pessoa real.
Por exemplo, a relação entre os intervalos musicais e a direção da melodia ainda é muito estranha.Isso está relacionado ao fato de que modelos grandes não possuem capacidades reais de “compreensão”.
Sem falar nos vocais. Depois de ouvir algumas músicas, você descobrirá que basicamente não há aspecto de “cantar”. Se você deseja alcançar a destreza de mudança de alcance vocal, vibrato, respiração, etc. como um cantor profissional, é um pouco difícil usar um modelo forte.
Na faixa da "música generativa",ÁudioConcentre-se mais na palavra "música", a construção é apenas uma ferramenta para isso.
Durante o processo de redação desta análise, deixei que ela fosse retomada automaticamente. Quando precisei fazer uma pausa, inconscientemente mudei para o NetEase Cloud e quis pressionar a pausa, e de repente descobri que a música que estava tocando era na verdade Udio.
Isso me lembra um possível cenário de uso: música de fundo durante o trabalho diário e doméstico, que só precisa ser “ouvida”.
Com a qualidade atual, é totalmente viável usar a playlist do Udio para substituir o push diário existente e a reprodução aleatória. Embora seja difícil encontrar alguma música que me impressione o suficiente para colocar um coração vermelho nela.
O que é realmente emocionante é o impulso aleatório ligado ao “tráfego”, que está diminuindo gradualmente.Deixe os músicos saírem do círculo vicioso de serem sequestrados por cliques e números de reprodução e voltarem à origem do uso da música para se expressarem., essa será a contribuição da inovação musical generativa.

Texto |