Nhóm tác giả gồm Michael Chabon, nhà viết kịch David Henry Hwang và các tác giả Matthew Klam, Rachel Louise Snyder và Ayelet Waldman đã đưa ra vụ kiện OpenAI tại tòa án liên bang ở San Francisco vì việc sao chép tác phẩm của họ mà không có sự cho phép nhằm đào tạo ChatGPT.
Các tác giả cáo buộc rằng các bài viết của họ đã được thêm vào tập dữ liệu huấn luyện của ChatGPT mà không được sự đồng ý của họ. Họ lập luận rằng hệ thống có khả năng tóm tắt đúng nội dung tác phẩm của họ và tạo ra văn bản bắt chước theo phong cách của họ. Họ yêu cầu một khoản tiền bồi thường thiệt hại không xác định và yêu cầu lệnh ngăn chặn "các hoạt động kinh doanh bất hợp pháp và không công bằng" của OpenAI.
OpenAI và các công ty khác đã đưa ra lập luận rằng việc huấn luyện trí tuệ nhân tạo sử dụng cách thức sử dụng đúng mức các tài liệu từ internet.
Vụ kiện đã chỉ ra rằng các tác phẩm như sách, vở kịch, và bài báo đặc biệt có giá trị quan trọng đối với quá trình huấn luyện của ChatGPT vì chúng là "những ví dụ gần như hoàn hảo về văn bản độ dài lớn và chất lượng cao".
Từ khi ChatGPT ra mắt vào tháng 11/2022, ngành xuất bản đã trở thành một trong những ngành hàng đầu bị ảnh hưởng. Cuộc tranh luận về cách bảo vệ tác giả khỏi những hậu quả tiềm ẩn của công nghệ AI đã trở thành một chủ đề nóng.
Tháng 7 vừa qua, diễn viên hài người Mỹ Sarah Silverman cùng hai tác giả Christopher Golden và Richard Kadrey đã kiện công ty OpenAI vi phạm bản quyền.
Các tác giả cáo buộc OpenAI sử dụng các tác phẩm của họ mà không xin phép để đào tạo các mô hình AI. Trong đó có cuốn hồi ký “The Bedwetter” bán chạy nhất năm 2010 của Silverman, tiểu thuyết kinh dị "Ararat" của Golden và loạt tiểu thuyết siêu nhiên lừng danh “Sandman Slim” của Kadrey.
Hồi tháng 6, hai tác giả người Mỹ, Paul Tremblay và Mona Awad ở Massachusetts cho biết ChatGPT đã khai thác dữ liệu được sao chép từ hàng nghìn cuốn sách mà không được phép, điều này đã vi phạm bản quyền của tác giả.
Vụ kiện của Tremblay và Awad cho biết sách là "thành phần chính" vì chúng cung cấp "những ví dụ tốt nhất về cách viết dài chất lượng cao."
Khiếu nại ước tính rằng dữ liệu đào tạo của OpenAI đã kết hợp hơn 300.000 cuốn sách, bao gồm cả từ "thư viện bóng tối" bất hợp pháp cung cấp sách có bản quyền mà không được phép.
Awad được biết đến với các tiểu thuyết bao gồm "13 cách nhìn một cô gái mập" và "Bunny". Các tiểu thuyết của Tremblay bao gồm "The Cabin at the End of the World", được chuyển thể thành phim "Knock at the Cabin" của M. Night Shyamalan phát hành vào tháng Hai.
Tremblay và Awad cho biết ChatGPT có thể tạo ra các bản tóm tắt "rất chính xác" về sách của họ và chúng đã xuất hiện trong cơ sở dữ liệu của hệ thống này.
Những vụ việc này được cho là sẽ dẫn tới gia tăng các trường hợp gây phức tạp cho sự phát triển của xu hướng công nghệ mới lớn nhất thế giới. Ngoài ra, các nguyên đơn cũng kiện công ty mẹ của Facebook là Meta đã dùng các bản tải sách của họ cho mục đích đào tạo.