원본 논문이 인공지능 훈련을 위한 무료 도구가 되어서는 안 됩니다.
2024-08-18
한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina
최근 CNKI는 AI 검색 스타트업 미타테크놀로지(MiTa Technology)에 AI 검색 결과에 학술 문헌 제목, 목차, 초록을 무단으로 게재한 것은 심각한 침해에 해당한다고 경고했다. 이에 대해 시크릿타워테크놀러지는 의심과 이해불가를 표명했다. 또한, 국제적으로 유명한 저널인 "Nature"의 편집자인 Elizabeth Jipney는 최근 기사에서 스마트 모델 훈련을 위해 연구 논문을 기술 회사에 라이센스하는 학술 출판사가 점점 더 많아지고 있다고 지적했습니다. 한 학술 출판사는 이를 통해 2,300만 달러를 벌었지만 저자는 0달러를 벌었습니다.
인공지능은 점점 더 잘 알려진 새로운 것, 첨단 기술이 되어가고 있습니다. 대규모 언어 모델(LLM)은 훈련을 위해 인터넷에서 스크랩한 대량의 데이터에 의존하는 경우가 많습니다. 학술 논문은 풍부한 콘텐츠와 높은 정보 밀도로 인해 대량의 일반 데이터보다 가치가 높으며 AI 훈련에 있어서 중요한 데이터 소스입니다.
이는 결국 상대적으로 정상적인 것으로 보입니다. 이전 연구 결과를 인용하는 것은 논문의 설득력과 신뢰성을 높이는 데에도 도움이 됩니다. 그러나 이러한 현상은 실제로 심각한 지적재산권 문제를 수반합니다. 저작권법에 따르면 저작권자는 자신의 저작물에 대한 출판권, 허가권, 배포권, 저작물의 완전성 보호권, 정보 네트워크 보급권, 개작권, 편집권 등의 권리를 갖습니다. 저자가 승인한 출판사도 해당 권리를 갖습니다.
물론 저작권에도 해당 제한이 적용됩니다. 해당 상황에서는 저작물 사용에 대해 저작자에게 보수를 지급할 수 없지만 저작자의 이름과 저작물의 제목을 명시해야 합니다. 예를 들어, 개인적인 연구, 조사 또는 감상을 위해, 특정 작품을 소개하거나 논평하거나 특정 문제를 설명하기 위해 다른 사람의 출판물을 사용하거나, 뉴스 보도를 위해 다른 사람의 출판물을 적절하게 인용하거나, 신문, 저널, 라디오에서 라디오, 텔레비전 및 기타 매체에 출판된 작품을 불가피하게 복제하거나 인용하는 행위 ; 도서관, 기록 보관소 등은 출판된 작품을 전시하거나 보존할 목적으로 복제한 작품으로, 대중에게 요금을 부과하지 않으며 공연자에게 보수를 지급하지 않습니다. 이익을 위해서가 아닙니다.
위에서 보면 타인의 저작물에 대한 공정한 이용은 공익과 비영리를 위해 이루어져야 함을 알 수 있습니다. 다른 사람의 저작물을 영리 목적으로 '무료'로 사용하는 것은 명백한 침해입니다. 인공지능 교육을 예로 들어보겠습니다. 기업이 인공지능을 교육하는 목적은 비즈니스 가치를 향상하여 치열한 시장 경쟁에서 우위를 점하는 것입니다. 물론, 인터넷 이용자를 대상으로 검색 서비스를 제공할 때 저작자를 명시하고 원문을 링크함으로써 원문의 인기도를 높이고, 원문의 다운로드 및 인용을 증가시키는 경우에는 공정이용으로 간주되어 침해에 해당하지 않습니다.
일부 저널과 출판사가 저작권을 "매수"하여 출판사가 출판 및 배포할 권리가 있음을 나타내지만 이것이 출판사가 저자를 완전히 대체할 권리가 있다는 의미는 아닙니다. 일반적으로 인공지능을 훈련시키는 것은 기술 발전에 도움이 되지만 관련 회사는 저작권법의 틀 내에서 자유롭게 저작물을 사용할 수 없으며 기술 혁신이라는 기치 아래 침해할 수 없습니다.
글 | 시홍주