소식

수노는 위기에 처했고, 유디오는 v1.5 업데이트, 음악을 만드는 데 진지하기 때문이다.

2024-07-27

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

수노는 위기감을 느끼기 직전이다. 유디오가 새 버전 v1.5를 내놨는데, 이는 험난한 전선이라고 할 수 있다.
어젯밤 Udio는 많은 새로운 기능과 성능 향상이 포함된 주요 업데이트를 출시했습니다.
Udio는 a16z를 투자자로 하여 올해 4월 출시되었으며, 출시 당시 Suno의 최대 경쟁자로 알려졌으며 전문 음악가들로부터 인정을 받았습니다.
제너레이티브 음악에는 다양한 응용이 있는데, 특히 Udio는 다양한 스타일과 음악 장르를 이해하고 제어하는 ​​데 능숙하다고 할 수 있습니다."음악 재능"
하나의 명령으로 두 개의 완제품을 얻을 수 있습니다. 프롬프트는 알뜰하게 작성되어 있어 프롬프트에 원하는 음악 스타일을 명확하게 입력할수록 효과가 더욱 놀랍습니다.

하지만 너무 스트레스 받지 마세요. 홈페이지에 추천 작품이 많으니, 프롬프트를 보면 겁나도록 간단해요. 예를 들어 교향곡 형식의 이 노래의 경우 프롬프트는 '베토벤 교향곡'입니다.

기본 길이는 30초이며, 연장을 선택할 수 있습니다. 연장 방법은 사용자가 시작 문단, 뒷문단, 중간에 연결 문단을 추가할 수 있도록 되어 있습니다. .

이번 업데이트의 주요 특징 중 하나인 다국어 지원부터 시작해 보겠습니다. 공식 데모에서는 중국어 데모가 제공됩니다.
歌词内容是怪怪的😂 不少生成式音乐的 demo 都喜欢用「人机情感」的主题,一种奇奇怪怪的执念。
하지만 편곡이 매우 완벽하고 중국어 노래도 매우 부드러우며 "외국인이 중국어로 노래하는" 느낌이 들지 않습니다.
Udio의 사람 목소리 처리 능력은 놀랍습니다. 공식이 제공한 v1과 v1.5를 비교하면 "AI 풍미"가 전례 없는 수준으로 감소했다는 것을 분명히 들을 수 있습니다. 혼합이 완료되었습니다).
또한,이번 업데이트 중 음질 개선이 가장 놀랍네요, 48kHz 스테레오 사운드 트랙, 저음이 특히 뛰어나고 매우 견고하며 음질은 하이파이 헤드폰을 견딜 수 있습니다.
아시다시피, 음질의 향상은 음악에 더 많은 레이어를 부여할 가능성을 가져옵니다.
Suno는 또한 좋은 스테레오 사운드를 얻을 수 있습니다. 예를 들어 복잡한 오케스트라 음악도 스테레오 효과를 생성할 수 있습니다.
하지만 이번 Udio 업데이트에서는 서로 다른 악기들의 위치가 더욱 명확하게 구분되면서도 서로 충돌하거나 헷갈리지 않고 앙상블의 조화를 유지할 수 있게 되어 더욱 풍부하고 명확해졌습니다.
새 버전에는 전문적인 음악 지식을 갖춘 사용자의 제어 가능성을 향상시키는 키 제어 기능도 도입되었습니다.또한, 사진 생성과 동일한 오디오 생성 오디오(유료)도 지원합니다.
음악을 기반으로 모델을 생성해 보세요. 전문적인(그러나 가난한) 음악가이든 일반 사용자이든 Udio가 음악 편곡을 도와줄 수 있습니다.
Udio 사용자의 비디오@맥스바젤
일반 사용자라면 유디오세대에는 특별한 특징이 있다.
그가 음악 장르에 익숙하지 않고 프롬프트에 명확하게 쓸 수 없을 때 Udio는 종종 매우 "디즈니" 스타일에서 시작합니다.
예를 들어 오케스트라 기반의 오케스트레이션, 뮤지컬 같은 노래, 그리고 더 중요하게는 디즈니 영화 음악에서 특히 흔히 볼 수 있는 변조 방식이 특징입니다.
이 음악이 <신데렐라>나 <백설공주>에서 여주인공의 솔로 부분으로 사용된다면 일관성이 없을 것이다.
결국 대중문화의 거인인 디즈니라고 할 수 밖에 없고, 사용자들의 음악미학에 있어 '가장 큰 공통분모'라고 볼 수도 있다.
하지만디즈니의 법적 업무도 매우 강력합니다., Udio는 이전에 Suno와 함께 3개 주요 음반사로부터 자사 아티스트의 음악 작품을 수집하여 모델 훈련을 위한 데이터로 사용하는 것이 침해라며 공동 고소를 당했습니다.
우디오가 또 다른 소송을 원하지 않는다면 좀 더 조심하는 게 좋을 것 같다.
재즈에서 유디오의 연주는 상당히 만족스럽다. 재즈는 라이브 연주라면 즉석에서 변화를 주는 연주도 많다.따라서 모델이 재즈를 명확하게 배우기는 어렵지만 이해할 수도 있습니다.
좀 더 뚜렷한 리듬을 가진 다른 팝음악에서는 기본적으로 큰 문제는 없습니다.
Udio는 실제로 그 자체를 음악 앱으로 간주합니다. Suno의 공식 홈페이지가 키워드와 인기도를 바탕으로 노래를 소개하는 방식에 비해 Udio는 주로 음악 장르와 스타일을 사용합니다.

뭐야, 정말 음악을 만들고 싶은 거야?
Udio 관계자는 기술적 세부 사항을 공개하지 않았지만 대규모 언어 모델을 사용하여 음악을 생성하는 것은 결코 간단하지 않았습니다.
음악의 언어는 말로 설명하기가 어렵습니다., 어쩌면 단 1초에 불과한 많은 양의 정보를 담고 있으며, 모든 비트, 음표, 보컬, 하모니의 유기적인 통합을 담고 있습니다.
긴 사운드 시퀀스를 생성할 때 AI 모델은 문구, 가사 또는 확장된 구절 내에서 음악적 연속성을 유지하는 데 어려움을 겪습니다. 또한 음악에는 보컬과 악기가 포함되어 있기 때문에 음성보다 생성하기가 훨씬 더 어렵습니다.
하지만 사용자에게 전달할 때는 간단하고 직접적이어야 합니다. 사용자는 각 사용자에게 전문적인 음악 이론 지식을 습득하도록 요구하는 것이 아니라 자연어만 사용하면 됩니다.
Udio CEO David Ding과 공동 창립자 Charlie Nash는 Deepmind에서 근무하며 지난해 11월 출시되어 당시 세계에서 가장 복잡한 음악 모델로 불렸던 Lyria 음악 모델 개발에 참여했습니다.


나중에 David Ding은 동료들을 초대하여 함께 사업을 시작했고 이것이 Udio가 탄생한 방식이었습니다.
그러나 역시 유디오의 능력에도 불구하고 아직까지 실존인물을 대체할 수 있을 정도는 아니다.
예를 들어, 음악적 간격과 선율의 방향 사이의 관계는 여전히 매우 어색합니다.이는 대형 모델에는 실제 "이해" 기능이 없다는 사실과 관련이 있습니다.
보컬은 말할 것도 없고, 몇 곡을 들어보면 기본적으로 "노래하는" 측면이 없다는 것을 알게 될 것입니다. 전문 가수처럼 음역 전환, 비브라토, 호흡 등의 손재주를 구현하려면 강력한 모델을 사용하기가 다소 어렵습니다.
"생성음악"이라는 트랙에서,오디오"음악"이라는 단어에 더 집중하세요, 빌드는 단지 도구일 뿐입니다.
이 리뷰를 작성하는 동안 계속 자동으로 재개되도록 했고, 일시 중지해야 할 때 무의식적으로 NetEase Cloud로 전환하여 일시 중지를 누르고 싶었는데 갑자기 재생되는 음악이 실제로 Udio라는 것을 알게 되었습니다.
이는 가능한 사용 시나리오를 생각나게 합니다. 일상 업무와 집안일 중 "듣기"만 하면 되는 배경 음악입니다.
현재 품질로는 Udio의 재생 목록을 사용하여 기존 일일 푸시 및 무작위 재생을 대체하는 것이 완전히 가능합니다. 하지만 붉은 마음을 담을 만큼 감동을 주는 노래를 찾기는 어렵습니다.
정말 흥미로운 점은 점차 감소하고 있는 "트래픽"과 관련된 무작위 푸시입니다.뮤지션들이 클릭수와 재생수에 납치되는 악순환에서 벗어나 음악을 통해 자신을 표현하는 원점으로 돌아가게 해주세요., 그것이 바로 생성적 음악 혁신의 공헌이 될 것입니다.

텍스트 |