오픈킹카지노, 무단 데이터 활용 의혹…유료 콘텐츠로 GPT-4o 훈련?
킹카지노한줄요약 ☞ 오픈킹카지노가 폐쇄형 유료 콘텐츠를 무단 활용해 GPT-4o를 훈련했다는 의혹이 불거졌다. 오픈킹카지노는 일부 데이터를 구매하지만, 저작권 침해 논란은 계속되고 있다.
2025-04-02 AI리포터
[디지털투데이 AI리포터] 오픈AI가 저작권이 있는 콘텐츠를 무단으로 자사 인공지능(AI) 모델 훈련에 활용했다는 의혹이 다시 불거졌다.
1일(현지시간) IT매체 테크크런치에 따르면 AI 디스클로저 프로젝트(AI Disclosures Project)라는 비영리 단체는 최근 발표한 연구에서 GPT-4o 모델 학습에 오라일리(O’Reilly) 미디어의 유료 도서가 무단으로 활용되었다고 주장했다.
논문은 DE-COP이라는 방법론을 활용해 GPT-4o, GPT-3.5 터보 등 오픈킹카지노 모델들이 오라일리 책을 얼마나 인식하는지 분석했다. 그 결과, GPT-4o는 이전 모델보다 유료 콘텐츠를 더 잘 인식했으며, 이는 폐쇄형 데이터를 무단 활용했을 가능성을 시사한다고 단체 측은 밝혔다. 특히 GPT-4o는 훈련 종료 이전에 출판된 오라일리 책을 상당수 인식했으며, 이는 오픈킹카지노가 직접 데이터를 수집했을 가능성을 뒷받침한다는 설명이다.
오픈AI는 일부 데이터를 구매하며, 뉴스, 소셜미디어, 스톡 미디어 등과 라이선스 계약을 맺고 있다. 또한, 저작권자가 훈련 데이터에서 제외될 수 있는 옵트아웃 메커니즘도 제공한다. 그러나 AI 훈련 데이터 활용을 둘러싼 법적 공방이 이어지는 가운데, 이번 연구는 오픈AI의 데이터 수집 방식에 대한 새로운 논란을 불러일으키고 있다.