미국의 AI 저작권 최신 판례 동향 / 김형지, 김효정
|
미국의 AI 저작권 최신 판례 동향 김형지 | 김·장 법률사무소 변호사 김효정 | 김·장 법률사무소 변호사 1. 들어가며 – 생성형 AI에 관한 미국의 동향 최근 다양한 형태의 생성형 인공지능(generative artificial intelligence, 이하 ‘생성형 AI’) 시스템들이 다량 출현하면서 여러 가지 저작권 쟁점들이 다루어지고 있다. 특히, 미국에서는 AI와 저작권과 관련하여 소송이 연이어 제기되고 있는데, 주로 AI가 생성한 산출물이 저작권의 보호를 받을 수 있는지 여부와 AI의 개발 과정에서, 또는 산출물이 제3자의 저작권을 침해하였는지 여부가 다루어지고 있다. 올해 초 미국 저작권청은 2023년 3월 16일 AI 산출물을 포함한 창작물에 대한 저작권 등록 지침(Copyright Registration Guidance: Works Containing Material Generated by Artificial Intelligence)을 발표하였는데, 저작권을 등록하기 위해서는 원칙적으로 인간이 저작자일 것이 요구되고, AI 산출물 중 인간의 창작 부분이 있는 경우에는 그 부분만 독립하여 저작권 보호를 받을 수 있다는 점을 명시하였다. 이어, 하반기에는 이러한 AI 쟁점과 관련된 3건의 판결이 선고되었는바, 본 기고에서는 선고된 판결의 내용을 살펴보고, 아직 진행 중인 소송 중 일부 사례를 선별하여 함께 소개하기로 한다. 2. AI가 생성한 산출물에 대한 저작권 등록 거부를 정당하다고 판단한 판결: Thaler v. Perlmutter (D.D.C.) 워싱턴 D.C. 연방지방법원은 지난 2023년 8월 18일 AI를 사용하여 제작한 예술 작품의 저작권 등록을 거부한 미국 저작권청의 결정이 적법하다는 취지의 판결을 선고하였다. 원고 스티븐 탈러(Stephen Thaler)는 2012년경 자신이 소유한 ‘크리에이티비티 머신(Creativity Machine)’이라는 AI 시스템을 사용하여 ‘A Recent Entrance to Paradise’이라는 예술 작품을 제작하였고, 2018년에 미국 저작권청에 창작자를 크리에이티비티 머신으로 명시하면서, 미국법상 업무상 저작물의 법리에 따라 본인을 저작권자로 하여 저작권 등록 신청을 하였다. 미국 저작권청은 해당 작품이 인간이 창작한 것이 아니라는 이유로 스티븐 탈러의 저작권 등록 신청을 거절하였고, 이에 대해 그가 불복 소송을 제기한 것이다. 법원은 판결문에서 미국 저작권법은 인간이 창작한 작품만을 보호하며, 인간의 창의성이 저작권 등록 가능성의 핵심 요건이라는 점을 강조하였다. 또한, 법원은 인간의 창작성이 새로운 도구 또는 매체를 통하여 표현된 작품과 인간의 개입이 전혀 없이 AI가 창작한 작품을 구분하였다. 예를 들어 법원은 기계적인 도구로 촬영된 사진 작품의 저작물성이 문제되었던 사건의 경우에는 사진작가가 피사체의 배치, 의상, 액세서리 등의 선택 및 배열, 빛과 그림자의 배치 등 배열, 배치 또는 표현을 통해 전체적인 이미지를 형성하였고, 이와 같이 인간의 독창적이고 최종적인 판단이 개입되었기 때문에 사진 작품의 저작물성이 인정되었다고 하였다[Burrow-Giles Lithographic Co. v. Sarony, 111 U.S. 53, 58 (1884)]. 반면 인간의 개입이 전혀 없는 새로운 기술에 따라 발생하는 작품에 대해서까지 저작권이 확장되지는 아니하며, 예를 들어 원숭이가 스스로를 촬영한 ‘셀카’ 사진의 경우 원숭이는 저작권자가 될 수 없으므로 저작권의 보호를 받지 못하였다고 판시하였다[Naruto v. Slater, 888 F.3d 418, 420 (9th Cir. 2018)]. 결론적으로 법원은 미국 저작권청과 같은 입장을 취하면서 해당 작품은 전적으로 AI에 의하여 산출된 작품으로서 인간의 개입이 없다는 이유로 저작물성을 부인하였다. 그러면서 미국법상 업무상 저작물 법리에 기반한 스티븐 탈러의 주장은 유효한 저작권이 누구에게 등록되어야 하는지의 문제인데, 해당 사건의 경우에는 인간이 창작한 작품이 아니어서 애초에 유효한 저작권이 존재하지 아니하므로 저작권 등록의 귀속을 따질 필요도 없다고 보았다. 스티븐 탈러는 2023년 10월 11일 위 판결에 항소하였으며, 구체적인 항소 이유는 아직 제출하지 않은 상태이다. 3. AI의 개발, 학습 과정 및 산출물의 제3자의 저작권 침해 여부가 문제된 사건 가. 미술 작품의 무단 사용이 문제된 판결: Andersen et al. v. Stability AI Ltd. et al. (N.D. Cal.) Sarah Andersen을 포함한 3명의 화가들은 자신들의 미술 작품이 허락 없이 이미지 생성형 AI 모델인 스테이블 디퓨전의 학습용 데이터로 사용되었다고 주장하며, 2023. 1. 13. 스태빌리티 AI, 미드저니, 디비언트 아트(원고들의 주장에 따르면 스테이블 디퓨전을 제작하였거나 활용하는 AI 이미지 생성툴 제공 회사들)를 상대로 집단 소송을 제기하였다. 법원은 2023. 10. 30. 원고들의 청구 중 스태빌리티 AI에 대한 저작물 직접 침해 주장을 제외한 청구를 모두 배척(motion to dismiss granted)하였으며, 원고들에게 판결 선고일로부터 30일 내에 변경된 소장을 제출하도록 하였다. 법원의 구체적인 판결 이유는 아래와 같다. 우선 법원은 미국 저작권청에 작품을 등록하지 않은 원고 Andersen 이외 2명의 원고들의 작품에 대한 저작권 침해 주장은 배척하였고, 원고 Andersen의 경우에도 미국 저작권청에 등록된 작품 16개에 한정하여 저작권 침해 주장을 판단하였다. 나아가 법원은 비록 원고 Andersen이 미국 저작권청에 등록한 작품들 중 구체적으로 어떠한 작품이 학습용 데이터로 사용되었는지 특정하지는 않았으나, 원고 Andersen이 ‘haveibeentrained.com’ 사이트(아티스트들이 본인의 작품을 검색하여 자신의 그림이 이미지 생성형 AI의 학습에 사용되었는지 확인할 수 있는 사이트)에서 자신의 작품이 스테이블 디퓨전의 학습용 데이터로 사용되고 있다는 검색 결과를 얻었고, 특히 스테이블 디퓨전이 사용하는 학습용 데이터를 구축한 LAION이 50억 개의 이미지를 스크랩하였다는 점을 고려하여 볼 때, 현재 단계에서는 원고 Andersen의 저작권청에 등록되고 온라인에 게시된 작품들은 모두 학습용 데이터로 스크랩되었다고 합리적으로 추론할 수 있으며, 피고들은 이를 디스커버리 절차에서 다툴 수 있다고 하였다. 다음으로 저작권 직접 침해 주장(Direct copyright infringement)에 대해서 살펴본다. 원고들은 스태빌리티 AI가 스테이블 디퓨전을 생성하기 위하여 허락 없이 수십억 개의 저작권으로 보호받는 이미지들을 다운로드 등으로 취득하였고, 이러한 학습용 이미지를 스테이블 디퓨전을 학습시키기 위하여 사용하였으며, 학습용 이미지가 스테이블 디퓨전에 ‘압축된 복사본(compressed copies)’으로 저장되도록 하였다고 주장하였다. 원고들의 스태빌리티 AI에 대한 위 주장은 현 단계에서 배척되지 않았다. 그러나 법원은 디비언트 아트에 대한 원고들의 저작권 직접 침해 주장은 모두 배척하였다. 우선 원고들은 피고 디비언트 아트가 학습용 데이터의 ‘압축된 복사본’을 포함한 스테이블 디퓨전을 드림업(DreamUP, AI 이미지 생성기)의 일부로 배포함으로써 저작권을 침해한다고 주장하였는데, 스테이블 디퓨전이 50억 개의 학습용 이미지의 ‘압축된 복사본’으로 구성되어 있다는 주장이 무슨 의미인지 불분명하므로 이를 명확하게 할 필요가 있다고 지적하였다. 두 번째로 원고들은 디비언트 아트가 그 자체로 저작권을 침해하는 2차적 저작물에 해당하는 드림업을 생성, 배포함으로써 저작권을 침해한다고 주장하였는데, 법원은 디비언트 아트가 학습용 데이터를 만들기 위하여 타인의 저작물을 스크랩하고 사용하는 데에 있어 적극적인 역할을 수행하였다는 점을 원고들이 제대로 설명하지 못하였으며, 원고들의 주장에 따르면 오히려 학습용 이미지의 스크랩 및 생성은 스태빌리티 AI에 의해 이루어졌고, 디비언트 아트는 단순히 사용자들에게 스테이블 디퓨전에 대한 접근을 제공할 뿐이므로 원고들의 주장을 보강할 필요가 있다고 판시하였다. 세 번째로 원고들은 디비언트 아트가 저작권을 침해하는 2차적 저작물인 산출물을 생성, 배포함으로써 저작권을 침해한다고 주장하였다. 원고들은 Andersen의 저작물이 모두 학습용 데이터로 복제되었으므로 산출물은 2차적 저작물일 수밖에 없다고 하면서, 스테이블 디퓨전의 산출물과 학습용 데이터로 사용된 이미지 사이의 실질적 유사성을 입증할 필요가 없다고 주장하였으나, 스테이블 디퓨전의 산출물과 학습용 데이터로 사용된 특정한 이미지가 밀접하게 매치되는 사례는 없다고 자인하였다. 그러나 법원은 스테이블 디퓨전을 학습시킨 학습용 데이터가 모두 저작물이거나 디비언트 아트의 산출물이 저작물로 보호받는 학습용 데이터에 기반한 것이라고 해서 모든 산출물이 곧바로 2차적 저작물에 해당한다는 원고의 주장은 받아들일 수 없으며, 나아가 실질적 유사성에 대한 주장 및 입증도 필요하다고 판시하였다. 미드저니에 대한 원고들의 저작권 직접 침해 주장도 배척되었는데, 법원은 원고들의 저작권 직접 침해 주장의 근거가 미드저니가 스테이블 디퓨전을 사용하였다는 것인지, 미드저니가 자체적으로 학습용 이미지를 사용했다는 것인지, 둘 다인지에 대해서 명확히 할 필요가 있다고 지적하였고, 원고들의 다른 저작권 침해 주장들의 경우 디비언트 아트와 같은 이유로 배척하였다. 한편, 법원은 저작권 침해의 대위 책임(Vicarious Copyright Infringement)에 대해서는, 원고가 스테이블 디퓨전에 존재한다고 주장하는 저작물 이미지들의 ‘압축된 복사본’이 AI 이미지 생성기인 Dream Studio, DreamUp 및 미드저니에서 저작권을 침해하는 어떠한 방식으로 존재하고 있는지 또는 사용되는지에 관해 명확하게 하고, 나아가 원고 Andersen의 작품이 어떻게 해당 작품의 ‘복제품’을 만들어 내는 데에 사용되었는지에 대한 설명이 필요하다고 보았다. 법원은 피고들이 디지털 밀레니엄 저작권법을 위반하였다는 주장에 관하여서는 저작권관리정보(Copyright Management Information, 이하, ‘CMI’)를 무단으로 제거하였다는 점을 입증하지 못하였다고 보면서, 저작물에서 제거되었거나 변경되었다고 생각되는 CMI의 특정 유형을 밝히고, 피고들 중 누가 그리고 언제 CMI를 변경 또는 제거하였는지 명확하게 밝혀야 한다고 판시하였다. 마지막으로 사용자들이 원고들의 이름을 사용하여 원고들의 스타일로 만들어진 산출물을 생성할 수 있게 함으로써 피고들이 퍼블리시티권을 침해하였다는 주장에 관해서는 피고들이 AI 이미지 생성기의 광고, 판매 또는 구매를 권유하기 위해 원고들의 이름을 사용하였다는 근거가 없고, 원고들의 이름을 AI 텍스트 프롬프트에 사용하여 원고의 스타일과 유사한 이미지를 만들어내는 것이 원고들의 영업권에 어떻게 타격을 줄 수 있는지에 관한 주장, 입증이 부족하다고 보았다. 나. 작가들의 저서에 대한 무단 사용이 문제된 사건 (1) Kadrey et al. v. Meta Platforms, Inc. (N.D. Cal.) Richard Kadrey를 비롯한 3명의 작가들은 자신들의 저서가 허락 없이 메타 플랫폼의 대규모 언어 모델인 LLaMA 의 학습용 데이터로 사용되었다고 주장하며 2023년 7월 7일 메타 플랫폼을 상대로 집단 소송을 제기하였다. 법원은 2023년 11월 20일 피고가 LLaMa 학습을 위하여 원고들의 저서를 무단 복제함으로써 저작권을 침해하였다는 주장을 제외한(피고가 배척 주장을 하지 않았다) 원고들의 청구를 모두 배척(motion to dismiss granted)하며 원고들에게 판결 선고일로부터 21일 내에 변경된 소장을 제출하도록 하였다. 우선 원고들은 LLaMA 언어 모델이 원고들의 저서에서 추출한 표현적 정보 없이는 기능하지 못하므로 LLaMA 언어 모델 그 자체가 저작권을 침해하는 2차적 저작물에 해당한다며 저작권 직접 침해 주장을 하였으나(direct copyright infringement), 법원은 해당 주장은 무의미하며, LLaMA 언어 모델 그 자체가 원고들의 저서를 재구성 또는 각색한 2차적 저작물이라고 이해할 방법이 없다고 판단하였다. 다음으로 원고들은 LLaMA 언어 모델을 이용하여 생성되는 모든 산출물은 2차적 저작물로 원고들의 저작권을 침해하고 있으며, 사용자들이 LLaMA 언어 모델을 이용하고 있으므로 피고에게 저작권 침해의 대위 책임(vicarious copyright infringement)이 있다고 주장하였다. 이에 대하여 법원은 원고들이 원고들의 저서를 변형, 재구성 또는 각색한 산출물에 대한 구체적인 주장이나 증거를 전혀 제시하지 못하고 있으며, 따라서 산출물의 저작권 침해가 인정되기 않기 때문에 저작권 침해의 대위 책임도 성립할 수 없다고 보았다. 그러면서 법원은 LLaMA 학습 과정에서 원고들의 저서 전체가 복제되었으므로 원고들의 저서와 산출물 사이의 유사성을 주장할 필요가 없다는 원고들의 주장은 타당하지 않으며, 산출물이 2차적 저작물에 해당한다는 원고의 주장이 인용되기 위해서는 산출물에 실제로 원고들의 서적 일부가 어떠한 형태로든 포함된다는 주장 및 입증이 필요하다고 판시하였다. 나아가 법원은 피고가 CMI를 무단으로 제거하여 디지털 밀레니엄 저작권법을 위반하였다는 주장에 관하여서는, LLaMA가 원고들의 저서를 저작권관리정보 없이 배포하였다는 증거가 없고, LLaMA가 침해적인 2차적 저작물이라고 볼 수도 없다는 이유로 원고의 주장을 배척하였다. (2) Tremblay et al. v. OpenAI, Inc. et al. (N.D. Cal.), Silverman et al. v. OpenAI, Inc. et al. (N.D. Cal) 오픈 AI를 상대로, 소설가 폴 트램블레이와 모나 아와드는 2023. 6. 28., 사라 실버맨을 비롯한 3명의 작가들은 2023. 7. 7. 각각 자신들의 저서가 무단으로 학습용 데이터로 사용되었다는 이유로 집단 소송을 제기하였다. 아직 판결은 선고되기 전이나 그 주장을 살펴보기로 한다. 원고들은 오픈 AI가 인터넷에서 자신들이 서적을 포함하여 대량의 텍스트 자료를 수집하였고, 오픈 AI 언어 모델의 학습 과정에서 피고들의 서적을 복제하였으며, 해당 사건과 같이 저작물이 전부 직접적으로 복제된 경우에는 실질적인 유사성을 입증할 필요가 없다고 주장하였다. 그러면서 원고들은 ChatGPT가 각 원고의 저서 대부분의 내용을 정확하게 요약할 수 있었는데, 이는 ChatGPT가 해당 저서들에 대한 내용을 학습용 데이터에 보유하고 있으며 유사한 텍스트 콘텐츠를 출력할 수 있다는 것을 의미한다고 주장하였다. 구체적으로 원고들은 저작권 직접 침해(Direct copyright infringement)를 3가지로 나누어, (1) 학습 또는 인풋 단계에서의 침해(원고들의 저서를 복제하고 학습용 데이터로 사용), (2) 오픈 AI 언어 모델 그 자체의 침해(오픈 AI 언어 모델은 원고들의 저서에서 추출한 표현적 정보 없이는 기능하지 못하므로 오픈 AI 언어 모델 그 자체가 저작권을 침해하는 2차적 저작물에 해당), (3) 산출물 단계에서의 침해(오픈 AI 언어 모델이 2차적 저작물에 해당하므로 산출물도 저작권을 침해하는 2차적 저작물에 해당)를 주장하였다. 이에 대해 피고는 실질적 유사성이 입증되지 않으면 복제본 또는 2차적 저작물에 해당하지 않는다고 항변하면서, 설령 실질적 유사성이 인정되더라도 저작물의 공정한 이용에 해당한다고 주장하였다. 다음으로 원고들은 저작권 침해의 대위 책임(Vicarious Copyright Infringement)에 대해서, 오픈 AI 언어 모델의 산출물은 원고들의 저작물 및 기타 저작물에서 추출한 표현적 정보에 기반하고 있기 때문에 오픈 AI 언어 모델의 모든 산출물은 저작권을 침해하는 2차적 저작물이라고 주장하면서, 구체적으로는 오픈 AI 언어 모델의 사용자들이 산출물을 만들고 있고, 오픈 AI는 이러한 침해 행위를 중지시킬 능력이 있으며, 산출물로 인하여 경제적으로 이익을 얻고 있으므로 저작권 침해의 대위 책임이 있다고 하였다. 이에 대하여 피고는 피고에게 책임이 있는 제3자에 의한 저작권 직접 침해가 성립하지 아니하는 이상 대위 책임이 성립하지 않는데 원고들은 저작권 직접 침해 행위를 특정하지 못하고 있고, 이외에도 제3자의 침해행위를 감독할 권리 및 능력, 침해로 인한 직접적인 경제적 이익 등 대위 책임이 성립하기 위한 다른 요건들도 주장 및 입증하지 못하고 있다고 항변하였다. 나아가 원고들은 피고가 저작권관리정보(CMI)를 고의적으로 무단으로 제거하였다고 하며 디지털 밀레니엄 저작권법 위반 주장도 하였는데, 피고는 이에 대하여 오픈 AI가 학습용 데이터를 취합할 때 저자, 저서의 출판연도 등을 삭제하였다는 구체적인 주장이 없다고 항변하였다. 4. 마치며 본 기고에서는 먼저 AI가 생성한 산출물에 대한 저작권 등록 거부를 정당하다고 판단한 Thaler 사례를 살펴보았고, 다음으로 AI 개발 과정, 학습 및 산출물 생성 과정에서 제3자의 권리를 침해하는지 여부가 문제가 된 사례들을 살펴보았다. 후자의 사례에서 원고들은 주로 저작권 직접 침해, 저작권 침해의 대위 책임, 디지털 밀레니엄 저작권법 위반을 주장하고 있으며, 그중 저작권 직접 침해에 관해서는 ① 학습 단계에서 원저작물의 무단 수집 및 복제가 일어나고, ② AI 모델 그 자체가 저작권을 침해하는 2차적 저작물이며, ③ AI 모델의 산출물이 2차적 저작물로서 저작권을 침해하고 있다고 주장하는 것으로 보인다. 본 기고에서 소개한 바와 같이 올해 하반기에 선고된 2건의 판결에서 원고들의 청구 대부분이 배척되었는데, 대상 저작물의 복제나 2차적 저작물 작성 그 자체를 입증하지 못하였다거나, AI 산출물과 원저작물 사이의 실질적 유사성을 입증하지 못하였다는 것이 법원의 주된 입장으로 보인다. 따라서 권리자들의 추상적인 주장만으로는 입증책임을 충족시키기 어려워 보이며, 실제로 향후에도 AI의 기술적 특성상 이를 입증하는 것은 쉽지 않을 것으로 생각된다. 아직 작가들의 저서에 대한 무단 사용이 문제가 된 사건들 중 소설가 폴 트램블레이와 모나 아와드, 그리고 사라 실버맨을 비롯한 3명의 작가들에 대한 사건은 판결이 선고되지 않은 상태이나, 위와 같은 입증을 본격적으로 하지 않는 이상 Richard Kadrey 판결과 유사한 결과가 나올 가능성을 배제할 수는 없을 것으로 보인다. 그러나 이러한 법원의 기조가 계속된다면, 권리자들이 AI를 상대로 저작권 침해를 주장하여 승소하기는 어려워 사실상 법원이 AI 플랫폼의 저작물 이용에 대해 면책을 주는 결과가 될 가능성도 있어 보인다. 한편, 본 기고에서는 소개하지 않았지만, 게티이미지가 2023. 2. 3. 스태빌리티 AI를 상대로 집단 소송을 제기한 사건의 경우에는 게티이미지의 워터마크가 변형되어 남아 있는 산출물이 존재하는 등 게티이미지의 저작물과 스태빌리티 AI의 산출물 사이의 연관성을 추측할 수 있는 증거들이 제출되었는바, 추후 선고될 판결 내용에 대해 관심을 가지고 살펴볼 필요가 있겠다[Getty Images (US), Inc. v. Stability AI, Ltd. et al. (D. Del.)]. |
이전글 | 유럽연합 지식재산청, ‘EU의 온라인 저작권 침해에 관한 보고서’ 발표 / 이나라 |
---|---|
다음글 | 2023 하반기 해외 저작권 보호 동향(Vol.40) |
페이지
만족도 조사