nouvelles

Suno est en crise, Udio met à jour la v1.5, c'est parce qu'il veut sérieusement faire de la musique

2024-07-27

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

Suno est sur le point de ressentir un sentiment de crise. Udio a publié une nouvelle version v1.5, qui peut être décrite comme un front difficile.
Hier soir, Udio a publié une mise à jour majeure, qui inclut de nombreuses nouvelles fonctionnalités et améliorations de performances.
Udio est sorti en avril de cette année avec a16z comme investisseur. Il était connu comme le plus grand concurrent de Suno lors de son lancement et a été reconnu par les musiciens professionnels.
Il existe de nombreuses applications de la musique générative, et Udio est particulièrement doué pour comprendre et contrôler différents styles et genres musicaux."Talents musicaux"
Vous pouvez obtenir deux produits finis avec une seule commande. Prompt est écrit de manière frugale Compte tenu de ses attributs uniques, plus vous entrez clairement le style de musique souhaité dans l'invite, plus l'effet sera étonnant.

Mais ne soyez pas trop stressé. Il existe de nombreux travaux recommandés sur la page d’accueil. Lorsque vous regardez les invites, c’est si simple que cela fait peur. Par exemple, pour cette chanson sous forme de symphonie, l’invite est simplement « la symphonie de Beethoven ».

La durée par défaut est de 30 secondes et vous pouvez choisir de l'étendre. La façon de l'étendre est que l'utilisateur peut choisir d'ajouter un paragraphe de début, un paragraphe de fin ou un paragraphe de connexion au milieu. Il est également très convivial pour la musique. novices.

Commençons par l’un des points forts de cette mise à jour : le support multilingue. Dans la démo officielle, une démo en mandarin est donnée.
歌词内容是怪怪的😂 不少生成式音乐的 demo 都喜欢用「人机情感」的主题,一种奇奇怪怪的执念。
Cependant, l'arrangement est très complet, et le chant en mandarin est également très doux, sans la sensation boiteuse des « étrangers chantant en chinois ».
Le traitement des voix humaines par Udio est remarquable. Dans la comparaison entre la v1 et la v1.5 officiellement fournie, on peut clairement entendre que la "saveur IA" a été réduite à un niveau sans précédent (même si on peut aussi entendre qu'il y a beaucoup de mixage). a été fait). Anneau à couvrir).
aussi,L'amélioration de la qualité sonore est cette fois-ci la plus étonnante parmi toutes les mises à jour, piste sonore stéréo 48 kHz, les basses sont particulièrement remarquables, très solides, et la qualité sonore peut résister aux écouteurs hifi.
Vous savez, l’amélioration de la qualité sonore apporte la possibilité de donner plus de couches à la musique.
Suno peut également obtenir un bon son stéréo. Par exemple, une musique orchestrale complexe peut également produire un effet stéréo.
Mais cette mise à jour d'Udio présente des couches plus riches et plus claires. Les positions des différents instruments peuvent être plus clairement distinguées, tout en conservant l'harmonie de l'ensemble sans entrer en conflit les uns avec les autres ni se confondre.
La nouvelle version introduit également le contrôle des touches, ce qui améliore la contrôlabilité pour les utilisateurs ayant des connaissances professionnelles en musique.De plus, il prend également en charge la génération audio (payante), qui est la même que l'image génératrice d'image.
Utilisez un morceau de musique comme base et laissez le modèle générer. Que vous soyez un musicien professionnel (mais pauvre) ou un utilisateur ordinaire, vous pouvez laisser Udio vous aider à organiser de la musique.
Vidéo de l'utilisateur Udio@maxbarzel
Si vous êtes un utilisateur ordinaire, la génération Udio possède une fonctionnalité particulière.
Lorsqu'il n'est pas très familier avec le genre musical et ne peut pas l'écrire clairement dans le message, Udio part souvent d'un style très "Disney".
Par exemple, il proposera une orchestration orchestrale, des chants de type musical et, plus important encore, une méthode de modulation particulièrement courante dans la musique des films Disney.
Si cette musique est utilisée comme segment solo de l'héroïne dans "Cendrillon" ou "Blanche Neige", elle ne sera pas incohérente.
On peut seulement dire qu'il s'agit de Disney après tout, un géant de la culture pop, et c'est aussi un choix sûr qui peut être considéré comme le « plus grand dénominateur commun » dans l'esthétique musicale des utilisateurs.
maisLes affaires juridiques de Disney sont également très solides, Udio a déjà été poursuivi conjointement par trois grands labels de musique avec Suno, accusant les œuvres musicales de ses artistes d'être collectées et utilisées comme données pour la formation de modèles, ce qui constitue une infraction.
Si Udio ne veut pas de nouveau procès, il ferait mieux d'être plus prudent.
La performance d'Udio en jazz est tout à fait satisfaisante. Le jazz se caractérise par des rythmes intelligents et changeants. S'il s'agit d'une performance live, il y a même de nombreux changements et performances sur place.Il est donc difficile pour le modèle d'apprendre clairement le Jazz, mais il peut aussi être compris.
Dans d’autres musiques pop aux rythmes plus distincts, il n’y a fondamentalement pas de gros problème.
Udio se considère vraiment comme une application musicale. Comparé à la façon dont la page d'accueil du site officiel de Suno présente les chansons en fonction de mots-clés et de leur popularité, Udio utilise principalement des genres et des styles musicaux.

Quoi, tu veux vraiment faire de la musique ?
Les responsables d'Udio n'ont pas divulgué les détails techniques, mais utiliser de grands modèles de langage pour générer de la musique n'a jamais été simple.
Le langage de la musique est difficile à décrire avec des mots, il contient une grande quantité d'informations, peut-être juste une seconde, et contient l'intégration organique de chaque battement, note, voix et harmonie.
Lorsqu’ils génèrent de longues séquences de sons, les modèles d’IA ont du mal à maintenir une continuité musicale au sein de phrases, de paroles ou de passages prolongés. De plus, comme la musique comprend des voix et des instruments, elle est beaucoup plus difficile à générer que la parole.
Mais lorsque vous le proposez aux utilisateurs, cela doit être simple et direct. Les utilisateurs doivent uniquement utiliser le langage naturel, plutôt que d'exiger de chaque utilisateur qu'il maîtrise des connaissances professionnelles en théorie musicale.
Le PDG d'Udio, David Ding, et le co-fondateur Charlie Nash ont tous deux travaillé pour Deepmind et participé au développement du modèle musical Lyria, sorti en novembre de l'année dernière et considéré à l'époque comme le modèle musical le plus complexe au monde.


Plus tard, David Ding a invité ses collègues à créer une entreprise ensemble, et c'est ainsi qu'est né Udio.
Cependant, encore une fois, malgré les capacités d'Udio, il n'est toujours pas au point de pouvoir remplacer une personne réelle.
Par exemple, les relations entre les intervalles musicaux et la direction de la mélodie sont encore très délicates.Ceci est lié au fait que les grands modèles n’ont pas de réelles capacités de « compréhension ».
Sans parler du chant Après avoir écouté quelques chansons, vous constaterez qu'il n'y a fondamentalement aucun aspect « chant ». Si vous souhaitez acquérir la dextérité du changement de gamme vocale, du vibrato, du souffle, etc. comme un chanteur professionnel, il est un peu difficile d'utiliser un modèle puissant.
Sur le morceau de « musique générative »,AudioConcentrez-vous davantage sur le mot « musique », la construction n'est qu'un outil pour cela.
Pendant le processus de rédaction de cette critique, j'ai continué à laisser la lecture reprendre automatiquement. Lorsque j'avais besoin de faire une pause, je suis inconsciemment passé à NetEase Cloud et j'ai voulu appuyer sur pause, et j'ai soudainement découvert que la musique diffusée était en réalité Udio.
Cela me rappelle un scénario d'utilisation possible : une musique de fond pendant le travail quotidien et les tâches ménagères, qu'il suffit de "écouter".
Avec la qualité actuelle, il est tout à fait réalisable de remplacer le push quotidien et la lecture aléatoire existants par la playlist d'Udio. Cependant, il est difficile de trouver une chanson qui m'impressionne suffisamment pour y mettre un cœur rouge.
Ce qui est vraiment excitant, c'est la poussée aléatoire liée au « trafic », qui diminue progressivement.Laissez les musiciens sortir du cercle vicieux de l'enlèvement par les clics et les numéros de lecture, et revenir à l'origine de l'utilisation de la musique pour s'exprimer., telle sera la contribution de l’innovation musicale générative.

Texte |