Nachricht

Suno steckt in der Krise, Udio aktualisiert Version 1.5, weil er es ernst meint, Musik zu machen

2024-07-27

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

Suno ist dabei, ein Gefühl der Krise zu verspüren. Udio hat eine neue Version v1.5 veröffentlicht, die als harte Front bezeichnet werden kann.
Gestern Abend hat Udio ein großes Update veröffentlicht, das viele neue Funktionen und Leistungsverbesserungen enthält.
Udio wurde im April dieses Jahres mit a16z als Investor veröffentlicht. Es galt bei seiner Einführung als Sunos größter Konkurrent und wurde von professionellen Musikern anerkannt.
Es gibt viele Anwendungen generativer Musik, und Udio ist besonders gut darin, verschiedene Stile und Musikgenres zu verstehen und zu kontrollieren„Musikalisches Talent“
Mit einem Befehl können Sie zwei fertige Produkte erhalten. In Anbetracht seiner einzigartigen Eigenschaften ist Prompt sparsam geschrieben: Je klarer Sie den gewünschten Musikstil in Prompt eingeben, desto erstaunlicher wird der Effekt sein.

Aber seien Sie nicht zu gestresst. Auf der Homepage werden viele Werke empfohlen. Wenn Sie sich die Eingabeaufforderungen ansehen, ist es so einfach, dass es beängstigend ist. Bei diesem Lied in Form einer Symphonie lautet die Ansage beispielsweise einfach „Beethovens Symphonie“.

Die Standardlänge beträgt 30 Sekunden, und Sie können sie verlängern. Der Benutzer kann einen Anfangsabsatz, einen Endabsatz oder einen Verbindungsabsatz in der Mitte hinzufügen. Dies ist auch für Musikanfänger geeignet .

Beginnen wir mit einem der Highlights dieses Updates: der Unterstützung mehrerer Sprachen. In der offiziellen Demo wird eine Demo auf Mandarin gegeben.
歌词内容是怪怪的😂 不少生成式音乐的 demo 都喜欢用「人机情感」的主题,一种奇奇怪怪的执念。
Allerdings ist das Arrangement sehr vollständig und auch der Mandarin-Gesang ist sehr sanft, ohne das lahme Gefühl, „Ausländer singen auf Chinesisch“.
Bemerkenswert ist die Verarbeitung menschlicher Stimmen durch Udio. Im Vergleich zwischen Version 1 und Version 1.5 ist deutlich zu erkennen, dass der „KI-Geschmack“ auf ein noch nie dagewesenes Maß reduziert wurde (obwohl auch viel zu hören ist). des Mischvorgangs).
Auch,Die Verbesserung der Klangqualität ist dieses Mal die erstaunlichste aller Updates, 48-kHz-Stereo-Tonspur, der Bass ist besonders herausragend, sehr solide und die Klangqualität hält HiFi-Kopfhörern stand.
Wissen Sie, die Verbesserung der Klangqualität eröffnet die Möglichkeit, der Musik mehr Ebenen zu verleihen.
Suno kann auch einen guten Stereoklang erzielen. Beispielsweise kann auch komplexe Orchestermusik einen Stereoeffekt erzeugen.
Aber dieses Update von Udio verfügt über reichhaltigere und klarere Ebenen. Die Positionen verschiedener Instrumente können klarer unterschieden werden, während die Harmonie des Ensembles erhalten bleibt, ohne dass es zu Konflikten oder Verwechslungen kommt.
Die neue Version führt außerdem eine Tastensteuerung ein, die die Steuerbarkeit für Benutzer mit professionellen Musikkenntnissen verbessert.Darüber hinaus wird auch die Audiogenerierung (kostenpflichtig) unterstützt, die mit der Bildgenerierung identisch ist.
Verwenden Sie ein Musikstück als Basis und lassen Sie das Modell generieren. Egal, ob Sie ein professioneller (aber schlechter) Musiker oder ein gewöhnlicher Benutzer sind, Sie können sich von Udio beim Arrangieren von Musik helfen lassen.
Video vom Udio-Benutzer@maxbarzel
Wenn Sie ein normaler Benutzer sind, bietet die Udio-Generation eine Besonderheit.
Wenn er mit dem Musikgenre nicht so vertraut ist und es in der Aufforderung nicht klar formulieren kann, geht Udio oft von einem sehr „Disney“-Stil aus.
Es wird beispielsweise eine auf Orchester basierende Orchestrierung, musikalisch anmutenden Gesang und, was noch wichtiger ist, eine Modulationsmethode beinhalten, die besonders in Disney-Filmmusik üblich ist.
Wenn diese Musik als Solo-Segment der Heldin in „Cinderella“ oder „Snow White“ verwendet wird, wird sie nicht inkonsistent sein.
Man kann nur sagen, dass es sich schließlich um Disney handelt, einen Giganten der Popkultur, und es ist auch eine sichere Wahl. Es kann als „größter gemeinsamer Nenner“ in der Musikästhetik der Nutzer angesehen werden.
AberAuch die rechtlichen Angelegenheiten von Disney sind sehr starkUdio wurde zuvor gemeinsam mit Suno von drei großen Musiklabels verklagt und beschuldigt, die Musikwerke seiner Künstler gesammelt und als Daten für Trainingsmodelle verwendet zu haben, was einen Verstoß darstellt.
Wenn Udio keine weitere Klage will, sollte er vorsichtiger sein.
Udios Auftritt im Jazz ist durchaus zufriedenstellend. Wenn es sich um einen Live-Auftritt handelt, gibt es sogar viele Änderungen und Auftritte vor Ort.Daher ist es für das Modell schwierig, Jazz klar zu lernen, aber er kann auch verstanden werden.
Bei anderer Popmusik mit ausgeprägteren Rhythmen gibt es grundsätzlich kein großes Problem.
Udio versteht sich wirklich als Musik-App. Verglichen mit der Art und Weise, wie die offizielle Website-Homepage von Suno Songs basierend auf Schlüsselwörtern und Beliebtheit präsentiert, verwendet Udio hauptsächlich Musikgenres und -stile.

Was, willst du wirklich Musik machen?
Die Verantwortlichen von Udio gaben die technischen Details nicht bekannt, aber die Verwendung großer Sprachmodelle zur Generierung von Musik war noch nie so einfach.
Die Sprache der Musik lässt sich nur schwer mit Worten beschreibenEs enthält eine große Menge an Informationen – vielleicht nur eine Sekunde – und enthält die organische Integration jedes Schlags, jeder Note, jedes Gesangs und jeder Harmonie.
Bei der Generierung langer Klangsequenzen haben KI-Modelle Schwierigkeiten, die musikalische Kontinuität innerhalb von Phrasen, Liedtexten oder längeren Passagen aufrechtzuerhalten. Da Musik außerdem Gesang und Instrumente umfasst, ist es viel schwieriger, sie zu erzeugen als Sprache.
Aber wenn man es an die Benutzer weitergibt, muss es einfach und direkt sein. Benutzer müssen nur natürliche Sprache verwenden, anstatt von jedem Benutzer professionelle Musiktheoriekenntnisse zu verlangen.
Udio-CEO David Ding und Mitbegründer Charlie Nash haben beide für Deepmind gearbeitet und waren an der Entwicklung des Musikmodells Lyria beteiligt, das im November letzten Jahres erschien und damals als das komplexeste Musikmodell der Welt galt.


Später lud David Ding seine Kollegen ein, gemeinsam ein Unternehmen zu gründen, und so wurde Udio geboren.
Trotz Udios Fähigkeiten ist es jedoch immer noch nicht so weit, dass es eine echte Person ersetzen kann.
Beispielsweise sind die Beziehungen zwischen musikalischen Intervallen und der Richtung der Melodie immer noch sehr schwierig.Dies hängt damit zusammen, dass große Modelle nicht über echte „Verständnis“-Fähigkeiten verfügen.
Ganz zu schweigen vom Gesang. Nach dem Anhören einiger Lieder werden Sie feststellen, dass es im Grunde keinen „Gesang“-Aspekt gibt. Wenn Sie wie ein professioneller Sänger die Geschicklichkeit des Wechsels des Stimmumfangs, des Vibratos, des Atems usw. erreichen möchten, ist es etwas schwierig, ein starkes Modell zu verwenden.
Auf der Spur der „generativen Musik“,HörbeispieleKonzentrieren Sie sich mehr auf das Wort „Musik“, der Build ist nur ein Werkzeug dafür.
Während ich diese Rezension schrieb, ließ ich sie immer wieder automatisch weiterlaufen. Als ich eine Pause brauchte, wechselte ich unbewusst zu NetEase Cloud und wollte auf Pause drücken, und plötzlich stellte ich fest, dass die Musik tatsächlich Udio war.
Da fällt mir ein mögliches Nutzungsszenario ein: Hintergrundmusik im Arbeitsalltag und bei der Hausarbeit, die einfach „angehört“ werden muss.
Mit der aktuellen Qualität ist es durchaus machbar, die Playlist von Udio als Ersatz für die bestehende tägliche Push- und Zufallswiedergabe zu verwenden. Allerdings ist es schwer, ein Lied zu finden, das mich so beeindruckt, dass ich ihm ein rotes Herz verleihen könnte.
Was wirklich spannend ist, ist der zufällige Push, der mit dem „Verkehr“ verbunden ist, der allmählich abnimmt.Lassen Sie Musiker aus dem Teufelskreis der Entführung durch Klicks und Wiedergabezahlen ausbrechen und zum Ursprung zurückkehren, in dem sie Musik nutzen, um sich auszudrücken., das wird der Beitrag generativer Musikinnovation sein.

Text |. Selina