본문으로 바로가기 본문으로 바로가기 대메뉴로 바로가기
네이버 블로그
인스타그램
유튜브
저작권보호


"미국 델라웨어 연방법원, 인공지능 학습용 정보 수집에 공정이용을 인정하지 않은 판결" 상세페이지

제목, 작성일, 내용 정보를 제공합니다.

미국 델라웨어 연방법원, 인공지능 학습용 정보 수집에 공정이용을 인정하지 않은 판결

  • 작성일2025.05.02
  • 조회수583

미국 델라웨어 연방법원인공지능 학습용 

정보 수집에 공정이용을 인정하지 않은 판결

유재규 | 법무법인 태평양 변호사



1. 이 사건의 개요

 

  톰슨 로이터(Thomson Reuters)는 법률 리서치 플랫폼인 웨스트로(Westlaw) 운영하는 회사이다웨스트로 이용자는 비용을 지불하고 미국의 연방 법령 및 각 주의 법령 정보미국 연방법원 및 주 법원의 판결문법률 저널 및 논문 등에 대한 데이터베이스에 접속하여 필요한 정보를 검색할 수 있다.

  웨스트로는 키 넘버 시스템(key number system)을 이용하여 판례를 분류하고 있다. 키 넘버 시스템은 관련되는 법률의 주제세부 항목에 숫자를 부여하여해당 숫자를 클릭하면 유사한 쟁점을 다룬 다른 사건들도 검색할 수 있도록 한 것이다또한 웨스트로는 키 넘버 시스템과 연동되어 법률의 핵심 사항과 판결 요지를 요약한 헤드노트(head notes)’를 제공한다톰슨 로이터는 헤드노트와 키 넘버 시스템을 포함하여 웨스트로에 대한 저작권을 등록하였다.

  로스 인텔리전스(Ross Intelligence Inc., 이하 로스”)는 머신러닝과 인공지능을 이용하여 법률 관련 자연어 검색 엔진을 개발하는 신생 기업이다.

  로스는 인공지능을 사용하는 검색 엔진을 개발하기 위해 학습 데이터가 필요했고톰슨 로이터로부터 웨스트로에 대한 라이선스를 얻으려고 했다그러나 톰슨 로이터는 이를 허락하지 않았다.

  로스는 법률 리서치 회사인 LegalEase Solutions(이하 리걸이즈”)와 계약을 맺고 인공지능 학습에 사용할 수 있도록 법률 관련 질문과 답변을 모아 놓은 “bulk memo”를 확보하였다리걸이즈는“bulk memo”를 작성하는 변호사들에게 웨스트로의 헤드노트를 이용하여 질문을 만드는 방법에 대한 안내를 제공하면서헤드노트를 그대로 복사하여 붙여 넣으면 안 된다는 점을 분명히 하였다고 주장하였다.

  리걸이즈는 로스에게 약 25,000개의 메모를 판매하였고로스는 이들 메모를 인공지능 학습에 이용하였다이에 톰슨 로이터는 2020. 5. bulk memo가 헤드노트를 복제한 것에 불과하다고 주장하면서 저작권 침해 소송을 제기하였다.

 

2. 이 사건에서 법원의 판단

 

웨스트로의 헤드노트가 보호받을 저작물에 해당하는지

  법원의 판결문은 저작권 보호 대상에서 제외되어 있다따라서 헤드노트가 단순히 법원의 판결문을 가져온 것이라면 저작권법의 보호를 받을 수 없다.

  법원은 헤드노트가 법원 판결의 일부를 발췌(distilling), 종합(synthesizing), 설명(explaining)하는 등 선택과 배열(choices as to selection and arrangement)을 통한 편집물(compilation)이라고 보았다.

  이 사건 판결문에서 담당 판사인 Bibas는 판결문을 대리석 덩어리에 비유하였다판결문은 대리석 덩어리와 마찬가지로 저작권이 인정되지 않지만 조각가가 그 대리석에 깎아낼 부분과 남길 부분을 선택하여 조각품을 만들면 그 조각품은 저작권의 보호 대상이 된다는 것이다. Bibas 판사는 이처럼 헤드노트도 법원 판결 중 어떤 단어가 중요한지 파악하고 그에 맞추어 재구성하는 과정에서 편집자의 창작성이 표현될 수 있으며 이는 저작권으로 보호를 받을 수 있다고 판단하였다.

 

헤드노트와 bulk memo의 실질적 유사성

  톰슨 로이터는 헤드노트 21,787키 넘버 시스템 등이 그대로 복제되었다고 주장하였다.

Bibas 판사는 키 넘버 시스템에 대하여도 저작물성은 인정하였으나 로스가 이를 이용하였는지에 대한 사실관계가 분명하지 않다며 실질적 유사성에 대하여는 판단하지 않았다.

  그러나 Bibas 판사는 헤드노트에 대하여는 톰슨 로이터가 주장한 21,787개의 헤드노트 중 실제 복제가 너무 명백하여 배심원단이 달리 판단할 수 없는 2,243개 헤드노트에 대하여 실제 복제가 이루어졌고 실질적 유사성도 인정된다는 약식판결(summary judgment)을 하였다로스도 리걸이즈가 웨스트로에 접속하여 웨스트로를 bulk memo 작성에 이용하였다는 것에 동의하였다는 점로스 측 전문가 증인도 bulk memo의 question이 법원 판결문과는 차이가 있고 웨스트로의 헤드노트와 유사하다는 것을 인정한 점 등을 근거로 하였다.

공정이용 여부

 

1) 로스의 사용 목적과 성격(판단 요소 1)

  Bibas 판사는 공정이용 판단 요소 1과 관련하여 상업적 이용인지와 변형적 이용인지 여부가 주요한 판단 요소라고 하였다.


상업적 이용 여부

  이 사건의 경우 로스도 인정하고 있듯이 로스는 상업적 목적으로 헤드노트를 이용였다다만 Bibas 판사는 상업적 목적으로 이용했다는 사실이 결정적인 요소가 되지는 않는다고 하였다(not dispositive).

 

변형적 이용(transformative use) 여부

  로스는 소니 게임을 별도의 소니 게임기 대신 개인용 컴퓨터에서 실행할 수 있게 해주는 제품을 만들기 위해 소스코드를 복제하는 것은 변형적이라고 판단한 Sony Comput. Ent., Inc. v. Connectix Corp., 203 F.3d 596, 599, 60607 (9th Cir. 2000) 사례(이하 소니 판결’), 기존 게임 시스템과 호환되는 게임을 만들기 위해 소스코드를 복제하는 것이 변형적이라고 판단한 Sega Enters. Ltd. v. Accolade, Inc., 977 F.2d 1510, 15141515, 152223 (9th Cir. 1992) 사례(이하 세가 판결’)들을 원용하며헤드노트의 이용이 변형적 이용에 해당한다고 주장하였다.

  또한 로스는 헤드노트가 소비자에게 제공되는 최종 결과물로 나타나는 것이 아니라는 , 중간 단계(intermediate step)에서 복제가 일어난 것이라는 점, AI에 입력하기 위하여 헤드노트에 있는 법률 용어 간의 관계를 수치 데이터로 변환하여 이용한 것이라는 점 등을 들어 변형적 이용에 해당한다고 주장하였다.

  Bibas 판사는 이러한 요소로 인해 판단이 더 까다로워진다고 하였다.

  그러나 Bibas 판사는 위 판결들을 이 사건에 원용하는 것은 적절하지 않다고 판단하였다위 사례들은 모두 컴퓨터 프로그램의 소스코드를 복제한 것인데컴퓨터 프로그램은 영화나 책 등과는 성격이 달라 이러한 사례를 그대로 적용하는 것은 적절하지 않다는 것이다.

  위 소니 판결의 경우 법원이 "프로그램 내의 보호받지 않는 기능적 요소에 접근하기 위해 역공학(reverse engineering)적으로 접근하는 데 필요한 중간 복제(intermediate copying)가 공정이용에 해당한다"고 판단한 것이고세가 판결 역시 호환성을 위한 기능적 요건을 알아내기 위한 목적으로만 복제가 이루어진 사례였다.

  Bibas 판사는 이 사건의 경우아이디어에 접근하기 위해 반드시 그 표현을 복제해야 하는 컴퓨터 프로그램이 있는 것이 아니라고 보았다이런 점을 볼 때 새로운 목적을 달성하기 위해 합리적으로 필요한 복제로 보기 어렵다는 것이다.

  Bibas 판사는 또한로스의 서비스는 스스로 콘텐츠를 작성하는 생성형 AI가 아니라 사용자가 법률 관련 질문을 입력하면 이미 작성되어 있는 의견을 찾아 주는 것이어서 웨스트로에서 적절한 헤드노트가 있는 판례 목록을 제공하는 것과 유사하다고 하였다.

  Bibas 판사는 미국 연방대법원의 Andy Warhol Foundation v. Goldsmith 판결(이하앤디 워홀판결)을 원용하여원본 저작물과 2차적 사용의 목적이 동일하거나 매우 유사하고, 2차적 사용이 상업적 성격을 가진 경우복제에 대한 다른 정당한 이유가 없는 한 공정이용 판단에 있어 불리한 요소가 된다고 하였다.

  결국 Bibas 판사는 로스가 웨스트로의 경쟁 플랫폼을 더 쉽게 개발하기 위하여 헤드노트를 이용한 것이며 이러한 이용이 혁신적이라 보기 어렵다는 점헤드노트를 이용한 목적이나 성격을 톰슨 로이터의 이용 목적이나 성격과 비교할 때 추가적인 목적이나 다른 성격을 인정하기 어렵다는 점을 들어 변형적 이용에 해당하지 않는다고 판단하였다.

 

2) 원본 저작물의 성격(판단 요소 2)

  Bibas 판사는 웨스트로의 헤드노트가 저작물로 보호를 받을 수 있지만 그 성격을 볼 때 소설가나 예술가의 작품처럼 창작성이 있다고 보기는 어렵다며이 부분은 로스에 유리한 요소라고 하였다.

  하지만 Bibas 판사는 Authors Guild Inc. v. Google Inc. 판결을 언급하며 공정이용에 대한 두 번째 요소는 공정이용 판단에 있어 중요한 역할을 하지는 않는다고 하였다.

 

3) 저작물 전체와의 관계에서 이용된 부분의 분량과 상당성(판단 요소 3)

  Bibas 판사는 Authors Guild Inc. v. Google Inc. 판결을 원용하며이 사건에서 중요한 것은 복제될 때 이용된 부분의 양과 상당성이 아니라 그로 인해 대중이 접근할 수 있는 것 중 경쟁적인 대체물로 이용될 수 있는 부분의 양과 상당성이라고 하였다.

Bibas 판사는 이러한 판단 기준 하에로스가 웨스트로의 헤드노트를 대중에게 공개한 것은 아니므로 공정이용에 대한 세 번째 요소는 로스에게 유리하게 작용할 수 있다고 하였다.

 

4) 저작물의 이용이 그 저작물의 가치나 잠재적인 시장에 미치는 영향(판단 요소 4)

  Bibas 판사는 미국 연방대법원의 Harper & row publishers inc. v. nation enterprises 판결을 원용하며 공정이용 판단에 있어 가장 중요한 요소는 네 번째 요인이라고 하였다.

  Bibas 판사는 이 요소를 판단할 때 현재 시장에 대한 영향뿐 아니라 원본 저작물 창작자가 일반적으로 개발할 수 있거나 다른 사람이 개발하도록 라이선스를 줄 수 있는 잠재적인 시장에 대한 영향복제로 인해 발생할 수 있는 공공의 이익도 고려해야 한다고 하였다.

  Bibas 판사는 이 사건의 경우 법률에 대한 리서치 플랫폼이라는 현재 존재하고 있는 시장이 명백하고, ‘법률 AI를 훈련시키는 데이터 시장이라는 잠재적 시장도 분명하다고 하였다.

  한편 Bibas 판사는 판결문에서 공정이용 판단 요소 4’인 수요 대체성에 대한 2023년 판단을 변경한 이유를 설명하였다. Bibas 판사는 2023년에는 로스가 웨스트로와 다른 목적에 부합하는 새로운 플랫폼을 만들 수 있고이러한 새로운 플랫폼은 웨스트로의 시장 대체재가 아닐 것으로 생각하였고 배심원단이 창작자와 복제자 중 누구를 보호하는 것이 공공의 이익에 더 부합하는지 판단해야 한다고 생각했다고 하였다그러나 사건이 계속 진행된 2025년에는 모든 사실을 로스에 유리하게 고려하더라도 로스가 웨스트로의 시장 대체재를 개발하여 경쟁하려 한 것으로 보인다며로스는 법률 AI 훈련시키는 데이터 시장이 영향을 미치지 않을 것이라는 점에 대하여도 충분히 입증하지 못하였다고 하였다.

 

5) 종합적인 판단

  Bibas 판사는 위와 같이 공정이용 판단 요소 1과 4는 톰슨 로이터에 유리하고판단 요소 2와 3은 로스에게 유리하다고 하였다그런데 판단 요소 2는 다른 요소보다 덜 중요하고 4는 더 중요하다고 하였다.

  Bibas 판사는 이런 요소들을 종합적으로 고려할 때 로스의 이용이 공정이용에 해당한다고 보기 어렵다고 판단하였다.

 

 

3. 이 사건 판결의 의미 및 시사점

 

인공지능 학습과 관련하여 공정이용 여부를 판단한 최초의 사례

  입력한 데이터의 구조와 특성을 모방하여 글소리그림영상그 밖의 다양한 결과물을 생성하는 생성형 AI 서비스가 2022. 11. 출시된 이후 다양한 분야에서 AI 서비스가 이용되고 있다이와 함께 이러한 생성형 AI 개발 단계에서 학습에 이용된 콘텐츠의 저작권과 관련하여 미국을 중심으로 저작권 침해 소송이 잇따르고 있다.

  예를 들어뉴욕타임즈 등 언론사들이 AI 학습에 뉴스 콘텐츠가 무단으로 사용되어 저작권을 침해당했다고 주장하며 오픈 AI(Open AI) 등을 상대로 소송을 제기했다생성형 AI가 컴퓨터 프로그램 코딩에도 활용되면서프로그래머들이 오픈소스 라이선스로 공개한 소스코드가 AI 학습에 무단으로 사용되었다며 소송을 제기한 사건도 있다.

  국내에서도 지상파 방송 3사가 지난 1월 네이버를 상대로하이퍼클로바 및 하이퍼클로바 X를 개발하는 과정에서 뉴스 데이터를 무단 이용하였다며 저작권 침해 및 부정경쟁방지법 위반으로 인한 손해배상 및 AI 학습 금지 등을 청구하는 소송을 제기하였다.

  다만 이들 사건의 핵심 쟁점인 학습 데이터로 저작물을 복제한 행위에 대해 공정이용을 인정할 수 있는지에 대하여는 아직 본격적인 공방이 이루어진 사례를 찾기 어렵고참고할만한 법원의 판단도 없었다.

  이 사건에서 로스의 플랫폼은 생성형 AI 서비스가 아니라는 점에서 최근 문제되고 있는 생성형 AI 사건들과는 약간 차이가 있고판결문에도 생성형 AI에 대한 판단이 아니라는 점이 명시되어 있다그럼에도 인공지능 학습에 저작물을 이용한 행위가 공정이용에 해당하는지를 법원이 판단한 최초의 사례라는 점에서 검토할 의미가 있다.

 

변형적 이용에 관한 판단

  이 사건 판결은 미국 연방대법원의 앤디 워홀 판결의 판단 기준이 이 사건에 적용될 수 있다며 그 기준에 따라 변형적 이용에 해당하는지를 판단하였다.

  앤디 워홀 판결에 따르면, ‘변형적 이용이란 새로운 창작물이 기존 창작물에 새로운 목적이나 다른 성격을 추가한 것을 의미하고, 2차적저작물 이상의 변형이 되어야 변형적 이용으로 인정될 수 있다.

  최근 우리나라 대법원도 저작물의 공정한 이용에 해당하는지에 대한 판단 기준을 밝혔다그 중 이용의 목적 및 성격에 대하여는 그 이용이 원저작물을 단순히 대체하는 수준을 넘어 새로운 표현의미메시지 등을 나타내도록 변형한 것인지원저작물과는 구별되는 별개의 목적과 성격을 가지는지원저작물을 변형한 정도가 2차적 저작물 작성에 필요한 수준보다 더 높은 정도에 이르렀는지공익적이거나 비영리적인 이용인지 등을 고려할 수 있다고 하였다(대법원 2024. 7. 11. 선고 2021272001 판결).

  다만 이 사건 판결문에서 Bibas 판사가 AI 환경이 급속하게 바뀌고 있는데 로스의 플랫폼은 스스로 새로운 콘텐츠를 생성하는 AI가 아니라고 명시하는 등 생성형 AI와는 다른 사건이라는 점을 분명히 한 것을 볼 때입력된 데이터를 토대로 새로운 콘텐츠를 만들어 내는 생성형 AI가 변형적 이용(transformative use)’에 해당할지에 대하여 이 사건 판결을 직접적으로 적용하기에는 어려움이 있어 보인다.

 

중간 단계에서의 복제(intermediate copying)

  로스 측은 세가 판결을 원용하여컴퓨터 프로그램 분석에서 중간 단계 복제가 공정이용으로 허용되었다는 점, AI 학습을 위해 복제된 저작물은 컴퓨터가 이해할 수 있는 숫자 벡터로 변환된다는 점그 복제된 저작물이 결과물에 그대로 복제되지는 않는다는 점을 들어 이 사건에서 헤드노트를 복제한 것에 대하여도 공정이용이 인정되어야 한다는 취지로 주장을 하였다.

  그러나 세가 판결에서도 최종 결과물에 저작권이 있는 자료가 포함되어 있지 않고 중간 단계에서만 복제가 일어났다 하더라도 저작권 침해에 해당할 수 있다는 점을 분명히 하였다다만 이러한 복제가 소프트웨어의 기능적 요소에 접근하는 데 필수적이었다면공정이용으로 보호받을 수 있다고 하였다.

  소니 판결은 공정이용을 인정한 이유에 대해프로그램의 목적 코드(object code) 저작권 보호를 받을 수 있는 표현이지만사람이 읽을 수 없는 것이어서 그 코드 내의 저작권으로 보호받지 않는 아이디어와 기능을 파악하기 위하여 필수적이라고 하였다저작권으로 보호되는 소프트웨어에 포함되어 있는 (저작권의 보호 대상이 아닌아이디어와 기능 요소에 대하여 공공이 접근할 수 있도록 하는 것이 공정이용 제도의 목적이고공공의 이익을 위하여 예술적 창작을 자극한다는 저작권법의 궁극적인 목적에도 부합한다는 것이다.

  이 사건의 경우 Bibas 판사는 중간 단계 복제에 관한 세가 판결 및 소니 판결은 기능 파악을 위한 복제가 불가피한 컴퓨터 프로그램에 적용되는 것으로로스가 플랫폼을 개발하기 위해 웨스트로의 헤드노트 복제가 반드시 필요한 것이 아니었다며 공정이용을 인정하지 않았다.

 


4. 마치며

  생성형 AI 기술이 발전하면서 개발 과정의 학습 단계이후 결과물의 생성 및 이용 단계에서의 저작권 문제에 대한 논의가 계속되고 있다.

이 사건 판결은 생성형 AI에 대한 사안은 아니지만 AI 학습에 저작물을 이용하는 것을 공정이용으로 볼 수 있는지에 대한 판단이어서 생성형 AI 사안에도 그 판단 근거를 토대로 적용해 볼 수 있을 것이다.

  이 사건 판결에 따르면 생성형 AI와 관련하여저작권으로 보호가 되지 않는 아이디어, 패턴을 학습시키기 위한 복제인지그러한 복제가 필수 불가결한 것인지학습 데이터 시장에 미치는 영향을 어떻게 평가할 것인지가 주요 쟁점이 될 것으로 보인다.

  또한 로스는 ① 헤드노트가 판례 요약에 지나지 않아 창작성을 인정할 수 없다② 로스의 서비스는 AI 기반 리서치 도구여서 수작업으로 이루어진 헤드노트 분류 시스템과는 차이가 있음에도 이러한 차이에 대하여 로스가 새로운 무언가를 추가였는지를 판단하지 않았다③ ‘AI 학습 데이터 시장이라는 가상의 시장에 미치는 영향을 근거로 시장 대체성을 판단한 오류가 있다며 항소를 하였다. 항소심의 판단도 주의 깊게 살펴볼 필요가 있다.


공공누리와 CCL 안내입니다.
공공누리/CCL
이전,다음 게시물 목록을 볼 수 있습니다.
이전글 2024 하반기 해외 저작권 보호 동향(Vol.42)
다음글 '미국 경제의 저작권 산업 보고서 2024' 주요 결과 소개 및 시사점

페이지
만족도 조사

현재 페이지에 대하여 얼마나 만족하십니까?

평가
  • 담당부서 : 보호전략지원부
  • 문의전화 : 02-3153-2735