주문형 음악, 이제 AI가 주문형 전체 노래를 생성한다.
지난 3월에는 Suno라는 "음악용 ChatGPT"가 출시되었다. Suno는 생성 AI를 사용하여 짧은 텍스트 프롬프트에서 요구에 따라 사실적인 노래를 생성한다. 몇 주 후 유사한 경쟁업체인 Udio가 현장에 등장했다.
나는 지난 15년 동안 연구자이자 프로듀서로서 다양한 창의적 컴퓨팅 도구를 사용해 왔으며 최근의 변화 속도에 충격을 받았다. 내가 다른 곳에서 주장했듯이, AI 시스템이 결코 인간처럼 "진짜" 음악을 만들지 않을 것이라는 견해는 기술적 능력보다는 사회적 맥락에 대한 주장으로 더 이해되어야 한다.
“물론 인간의 감정을 자극할 수 있는 표현력이 풍부하고, 복잡하고, 구조가 자연스럽고, 기교적이고, 독창적인 음악을 만들 수 있지만 AI는 적절한 음악을 만들 수 없다”라는 주장은 몬티 파이 튼(Monty Python) 스케치에서 나온 것처럼 쉽게 들릴 수 있다.
Suno와 Udio를 함께 연주한 후, 나는 그들이 변화하는 것이 정확히 무엇인지, 그리고 그것이 전문가와 아마추어 아티스트가 음악을 만드는 방식뿐만 아니라 우리 모두가 음악을 소비하는 방식에 어떤 의미를 가질 수 있는지 생각해 보았다.
느끼지 않고 감정을 표현하기
텍스트 프롬프트에서 오디오를 생성하는 것 자체는 새로운 것이 아니다. 그러나 Suno와 Udio는 다음과 같은 확실한 발전을 이루었다. 간단한 텍스트 프롬프트에서 노래 가사를 생성하고(ChatGPT와 같은 텍스트 생성기를 사용하여) 이를 생성 음성 모델에 입력하고 생성된 음악과 "보컬"을 통합하여 일관된 노래 세그먼트를 생성한다.
이러한 통합은 작지만 놀라운 성과이다. 시스템은 표현적으로 "노래"(나는 의인화)하는 일관된 노래를 만드는 데 매우 능숙하다.
그 효과는 놀라울 수 있다. AI인 건 알지만 목소리는 여전히 감정적인 영향을 미칠 수 있다. 음악이 새로운 섹션으로 완벽하게 실행된 바 끝 피루엣을 연주할 때, 내 뇌는 훌륭한 밴드의 음악을 들을 때 얻을 수 있는 패턴 처리 기쁨의 작은 불꽃을 얻는다.
나에게 이는 음악적 표현에 대해 때때로 간과되는 점을 강조한다. AI는 사람들의 공감을 불러일으키는 음악으로 감정과 삶의 사건을 성공적으로 표현하기 위해 감정과 삶의 사건을 경험할 필요가 없다.
일상 언어로서의 음악
다른 생성 AI 제품과 마찬가지로 Suno와 Udio는 실제 인간이 수행한 방대한 양의 기존 작업에 대해 교육을 받았으며 해당 인간의 지적 재산권에 대해 많은 논쟁이 있다.
그럼에도 불구하고 이러한 도구는 주류 AI 음악 문화의 시작을 알릴 수 있다. 그들은 사람들이 자신의 즐거움을 위해 사용하고, 탐색하고, 놀고, 실제로 듣고 싶어하는 새로운 형태의 음악적 참여를 제공한다.
"엔드 투 엔드" 음악 창작이 가능한 AI는 틀림없이 음악 제작자를 위한 기술이 아니라 음악 소비자를 위한 기술이다. 현재로서는 Udio와 Suno의 사용자가 제작자인지 소비자인지, 아니면 이러한 구별이 유용한지 여부가 불분명하다.
창의적 기술에서 오랫동안 관찰된 현상은 제작이 더 쉽고 저렴해짐에 따라 좀 더 캐주얼한 표현에 사용된다는 것이다. 결과적으로 매체는 독점적인 고급 예술 형식에서 일상 언어로 발전했다. 스마트폰이 사진에 어떤 영향을 미쳤는지 생각해 보라.
따라서 최소한의 비용과 노력으로 아버지가 선호하는 스타일, 즉 현대 생일 카드로 아버지의 생일을 맞아 전문적으로 제작된 아버지에 관한 노래를 보낼 수 있다고 상상해 보라. 연구자들은 오랫동안 이러한 만일의 사태를 고려해 왔으며 이제 우리는 그렇게 할 수 있다. 생일 축하해요, 아빠!
Mr Bown’s Blues. Generated by Oliver Bown using Udio [3.75 MB (download)
통제 없이 창조할 수 있는가?
이러한 시스템이 달성한 성과와 가까운 미래에 달성할 수 있는 성과가 무엇이든 제어 부족이라는 눈에 띄는 한계에 직면하게 된다.
특히 음악에서는 텍스트 프롬프트가 정확한 지침만큼 좋지 않은 경우가 많다. 따라서 이러한 도구는 가능성의 공간을 헤매는 일종의 맹목적인 검색에 적합하지만 정확한 제어에는 적합하지 않다. (그것이 그들의 가치를 감소시키려는 것은 아니다. 맹목적인 검색은 강력한 창의력이 될 수 있다.)
현직 음악 프로듀서로서 이러한 도구를 보면 상황이 매우 달라 보인다. Udio의 정보 페이지에는 "곡, 가사 또는 재미있는 아이디어가 있는 사람은 누구나 이제 자신을 음악으로 표현할 수 있다"라고 나와 있지만 이러한 도구를 사용하여 자신을 표현할 만큼 충분한 통제력이 없다고 생각한다.
샘플 및 현장 기록과 마찬가지로 조작을 위해 원자재를 시드하는 데 유용하다는 것을 알 수 있다. 하지만 나 자신을 표현하려고 할 때는 통제가 필요하다.
Suno를 사용하면서 나는 그것에서 얻을 수 있는 가장 끔찍하고 어두운 테크노 그루브를 찾는 재미를 느꼈다. 그 결과 트랙에서 꼭 사용하고 싶은 것이 탄생했다.
Cheese Lovers’ Anthem. Generated by Oliver Bown using Suno [2.75 MB (download)]
그러나 나는 또한 기꺼이 들을 수도 있다는 것을 알았다. 나는 내 표시를 추가하기 위해 무엇이든 추가하거나 결과를 조작해야 한다는 강박감을 느끼지 않았다.
그리고 많은 관할권에서는 AI를 통해 무언가를 탄생시켰다는 이유만으로 저작권을 부여받지 않을 것이라고 선언했다.
우선, 결과물은 수백만 명의 다른 아티스트의 창의적인 작업을 포함하여 AI에 들어간 모든 것에 크게 좌우된다. 틀림없이 당신은 창조의 일을 하지 않았다. 당신은 단지 그것을 요청했을 뿐이다.
생산과 소비 사이, 무인지대에서의 새로운 음악적 경험
그래서 누구나 음악으로 자신을 표현할 수 있다는 우디오의 선언은 흥미로운 도발이다. Suno 및 Udio와 같은 도구를 사용하는 사람들은 음악 AI 작업 제작자보다 음악 AI 경험의 소비자로 간주될 수 있으며, 많은 기술적 영향과 마찬가지로 그들이 수행하는 작업에 대한 새로운 개념을 제시해야 할 수도 있다.
생성 음악으로의 전환은 녹음 음악 시대에 한때 복잡하고 음색이 풍부하며 시끄러운 음악을 들을 수 있는 유일한 방법이었던 관현악 음악이 감소한 것처럼(사망은 아님) 현재 형태의 음악 문화에서 관심을 끌 수 있다. 이러한 새로운 유형의 음악 문화에 대한 참여와 교류가 폭발적으로 증가하면 아티스트, 밴드, 라디오 및 재생 목록의 전통적인 음악 소비에 대한 참여가 감소할 수 있다.
어떤 영향을 미칠지 말하기에는 너무 이르지만, 우리는 주의를 기울여야 한다. 중요한 저작인격권 문제인 기존 창작자의 지적 재산권 보호를 방어하려는 노력도 이러한 방정식의 일부이다.
그러나 그것이 성공하더라도 나는 이것이 잠재적으로 폭발할 수 있는 문화 변화를 근본적으로 해결하지 못할 것이라고 믿고 있으며, 그러한 음악이 열등할 수 있다는 주장도 오래전 테크노나 심지어 재즈와 마찬가지로 역사적으로 문화적 변화를 막는 데 거의 효과가 없었다. 정부 AI 정책은 이러한 문제를 넘어 음악이 사회적으로 어떻게 작동하는지 이해하고 우리의 음악 문화가 개인과 지역 사회 모두에게 활기차고 지속 가능하며 풍요롭고 의미가 있도록 보장해야 할 수도 있다.
이미지 출처: Pawel Czerwinski / Unsplash
글쓴이: 올리버 보운
http://www.olliebown.com/
올리버 보운(Oliver Bown)은 창의적인 기술을 연구하는 연구자이자 제작자이다. 그는 사회인류학, 진화 및 적응 시스템, 음악 정보학, 상호작용 디자인 등 매우 다양한 학문적 배경을 갖고 있으며 전자 음악 및 디지털 아트 분야에서 15년 이상 경력을 쌓았다. 그는 예술가, 디자이너, 음악가가 고급 컴퓨팅 기술을 사용하여 복잡하고 창의적인 작품을 제작하는 방법에 관심이 있다. 현재 그의 활발한 연구 분야에는 미디어 다양성, 음악적 메타창조, 컴퓨팅 창의성의 이론 및 방법론, 음악 표현을 위한 새로운 인터페이스, 사회적 창의성의 다중 에이전트 모델이 포함된다. 그는 뉴사우스웨일스 대학교 예술 및 디자인 대학의 부교수이자 인터랙티브 미디어 연구소의 공동 책임자이자 연구 및 참여 부문의 공동 책임자이기도 하다.