📌 AI 시대의 창작물, 누가 지켜줄 것인가?
🖋️ 텍스트 마이닝 면책 조항과 작가의 미래
2025년 호주에서 벌어지고 있는 논쟁은, 단순한 저작권 해석의 문제가 아니었습니다. 그것은 바로 ‘이야기의 미래’를 지키는 일과도 같았죠. 우리가 매일 스크롤하며 넘기는 수많은 콘텐츠 뒤에는 누군가의 삶과 목소리가 깃들어 있습니다. 그런데 그 소중한 이야기가, 우리도 모르는 사이에 ‘머신 러닝’이라는 이름의 블랙박스로 흘러들고 있다면요?
이번 블로그에서는 현재 호주에서 논의되는 ‘AI를 위한 텍스트-데이터 마이닝 저작권 면책 조항’ 이슈를 중심으로, 생성형 AI가 창작자에게 끼치는 영향 및 그에 대한 논점을 정리해보려 합니다.
🔍 사건의 발단 : AI가 사용한 것은 "나의 글"
호주의 저명 저널리스트이자 작가인 트레이시 스파이서(Tracey Spicer)는 한 언론에 기고한 글을 통해, Meta(페이스북의 모기업)와 같은 글로벌 테크 기업이 자국 작가들의 글 수천 편을 무단으로 수집("스크래핑")하고, 자사의 AI를 학습시키는 데 활용했다고 폭로했습니다.
그녀는 이렇게 말합니다:
“우리의 이야기를 마치 ‘쓰레기’처럼 긁어가더니, 그걸 다시 포장해 더 평평하고, 더 비인간적이고, 더 전형적인 이야기로 만들어버렸다.”
— 트레이시 스파이서
이것이 단순한 감정적 분노일까요? 절대 아닙니다.
호주의 생산성위원회(Productivity Commission)는 현재 '텍스트 및 데이터 마이닝'을 저작권 법에서 면책하는 조항을 도입할지를 논의하고 있습니다. 다시 말해, AI 모델이 작가의 책, 기사, 블로그 등 공개된 콘텐트를 학습 데이터로 자유롭게 사용해도 법적인 문제가 없도록 만들 수 있다는 이야기죠.
🧠 텍스트 마이닝이란? 왜 논란이 되고 있을까?
"텍스트 마이닝(Text and Data Mining, TDM)"은 인터넷에 공개된 수많은 문서들을 수집해 특정 패턴이나 인사이트를 추출하는 기술로, 생성형 AI의 핵심 연료입니다.
일례로, 우리가 매일 사용하는 ChatGPT도 수십억 문서의 텍스트를 사전에 학습했습니다. 이 학습 과정에서 뉴스 기사, 블로그 글, 문학 작품, 위키피디아 등 무수한 콘텐츠가 활용됐습니다.
문제는 이 학습 데이터가 저작권자의 동의 없이 수집된 경우가 많다는 점입니다.
단어 하나로 봐선 큰 일 같지 않지만, 수없이 많은 작가들의 생각과 문장이 모여 이 AI가 만들어졌다는 걸 알면 이야기는 달라집니다.
💵 면책조항이 생기면 정말 더 나은 기술이 탄생할까?
정부와 테크 기업의 입장은 간단합니다: 텍스트 마이닝은 혁신을 가속화한다는 논리입니다. 생산성 향상, 디지털 경제 성장, AI 경쟁력 강화 등 목표는 뚜렷하죠.
실제로 호주 생산성 위원회는 "면책 조항이 신기술 개발을 촉진하고, 향후 10년간 경제에 약 1160억 호주달러의 부가가치를 창출할 수 있다"라는 보고서도 발표했습니다.
하지만 그게 진짜 생산성일까요?
트레이시 스파이서는 이런 반문을 던집니다:
“생산성을 높이는 방법은 AI뿐만이 아닙니다. 모바일 기기 줄이기, 인간적인 노동 환경 조성, 그리고 '속기 능력 향상'도 큰 영향을 줍니다.”
즉, "기술=생산성이라는 단선적인 프레임"에 갇히지 말자는 뜻입니다.
✍️ AI의 창작물, 인간의 이야기를 따라잡을 수 있을까?
AI는 소설을 쓰고, 시를 짓고, 칼럼까지 씁니다. 그런데 이상하게도 그 이야기들은 점점 더 '도시의 30대 남성', '미국식 일상', '장애 없는 삶'만을 그리죠.
왜 그럴까요?
그 이유는 학습 데이터의 편향성과 다양성 부족에 있습니다.
ChatGPT나 다른 생성형 모델은 정형화된 데이터를 중심으로 학습되기에, 소외 지역의 문화, 언어, 관습, 감정 등 다층적인 인간 경험을 반영하기 어렵습니다.
그렇기에 트레이시 스파이서는 이렇게 말합니다:
“세상에는 수백만 명의 '리얼한 존재'가 있습니다. 그들의 이야기를 기술이 재현하지 못한다면 이는 기술 발전이 아닌 퇴보입니다.”
🛡️ 우리가 가져야 할 세 가지 질문
-
AI가 학습한 데이터가 나의 콘텐츠일 경우, 나는 어떤 권리를 주장할 수 있나요?
-
AI로 인한 기술 혁신이 창작자의 생계와 창작 의욕을 박탈한다면, 이는 과연 지속 가능한 발전일까요?
-
우리는 콘텐츠를 소비함에 있어 누가 그것을 만들었고, 그 과정이 어땠는지에 대해 얼마나 신경 쓰고 있나요?
✨ 해결 방향은 없는 걸까?
다행히 세계 곳곳에서 '생성형 AI의 저작권 윤리'에 대한 고민과 대응이 시작되고 있습니다.
- 유럽연합은 AI 학습에 쓰일 수 있는 데이터의 범위를 축소하고 있으며, 투명성 규정을 곧 신설할 예정입니다.
- 미국 일부 작가는 ChatGPT 개발사 OpenAI를 상대로 저작권 침해 소송을 제기한 상태입니다.
- 한국의 저작권위원회 역시 2024년 ‘AI 저작권 가이드라인’을 통해 AI 학습 데이터로 사용하기 위한 콘텐츠는 명시적 동의가 필요하다고 밝혔습니다.
✅ 그럼 이 글을 읽은 우리는 무엇을 할 수 있을까요?
- 내가 창작한 콘텐츠가 어디에 어떻게 활용되는지 알아보세요.
- AI 모델이 만드는 '정제된 정보'뿐 아니라, 사람 냄새 나는 이야기를 더 많이 찾아 읽어보세요.
- 텍스트 마이닝과 AI 학습의 윤리에 대해 친구, 동료, 커뮤니티와 함께 이야기해 보세요.
💬 사람의 이야기는 데이터셋이 될 수 없습니다
디지털 시대에도 여전히 중요한 건 ‘사람’의 목소리입니다. 기술이 인간의 창작을 보조하거나 보강할 수는 있어도, 그 본질을 대체해서는 안 됩니다. 그 목소리를 지키는 것이야말로 우리가 이 시대를 살아가는 창작자이자 독자로서 할 수 있는 가장 중요한 역할 아닐까요?
🖋️ 트레이시 스파이서의 경험처럼, 누군가의 '삶'과 '페르소나'가 기억되는 사회를 만들기 위해, 이제 우리는 다시 창작자의 편에 서야 할 때입니다.
—
📎 참고 자료
· The Guardian: 「Watering down Australia’s AI copyright laws would sacrifice writers’ livelihoods to ‘brogrammers’」
· Australia Productivity Committee Interim Report
· 한국저작권위원회 AI 가이드라인 (2024)
· OpenAI 저작권 관련 소송 사례
© 대한민국 블로그 전문 콘텐츠 연구소 | AI 시대의 윤리에 대하여

