Trong đơn kiện, tờ báo Mỹ cáo buộc hai công ty công nghệ đã sao chép và sử dụng hàng triệu bài viết của báo mà không xin phép để đào tạo cho các mô hình AI như ChatGPT của OpenAI và Copilot của Microsoft, và giờ sử dụng nội dung đó để "cạnh tranh trực tiếp" với báo.
Tờ New York Times cáo buộc các mô hình ngôn ngữ lớn của OpenAI và Microsoft có thể tạo ra nội dung trích dẫn nguyên văn nội dung của tờ báo, tóm tắt cô đọng và bắt chước văn phong. "Điều này gây tổn hại" mối quan hệ của báo với độc giả và lấy mất doanh thu đăng ký đọc báo, doanh thu quảng cáo...
Ngoài ra, đơn kiện lập luận rằng việc sử dụng các mô hình AI được huấn luyện trên nội dung của Times đe dọa đến chất lượng báo chí nghiêm túc bằng cách hạn chế khả năng bảo vệ và kiếm tiền từ nội dung của các hãng tin. Times cáo buộc: "Thông qua công cụ Bing Chat (nay đổi tên thành Copilot) của Microsoft và ChatGPT của OpenAI, hai bên bị đơn đang tận dụng khoản đầu tư khổng lồ của NYT vào lĩnh vực báo chí để xây dựng các sản phẩm thay thế mà không xin phép hoặc thanh toán."
New York Times tuyên bố đã nỗ lực đàm phán với cả hai công ty trong nhiều tháng để "đảm bảo nhận được giá trị xứng đáng cho việc sử dụng nội dung của mình" nhưng không thành công. OpenAI trả lời The Verge trong một tuyên bố qua email rằng họ tôn trọng quyền của người sáng tạo nội dung và cam kết làm việc với họ để đảm bảo lợi ích từ công nghệ AI và các mô hình doanh thu mới. Microsoft hiện chưa đưa ra bình luận chính thức.
New York Times yêu cầu tòa án buộc OpenAI và Microsoft phải chịu trách nhiệm với "hàng tỷ đô la thiệt hại" vì vi phạm bản quyền và cấm hai công ty sử dụng nội dung của Times để huấn luyện các mô hình AI, đồng thời xóa các tác phẩm của Times khỏi bộ dữ liệu của họ.
Tuy nhiên, OpenAI lại nói rằng: “Chúng tôi tôn trọng quyền của người sáng tạo và chủ sở hữu nội dung. Các cuộc trò chuyện đang diễn ra của chúng tôi với New York Times đã diễn ra hiệu quả và tiến triển theo hướng xây dựng, vì vậy chúng tôi rất ngạc nhiên và thất vọng với diễn biến này”.
Vụ kiện của New York Times đánh dấu một bước ngoặt quan trọng trong mối quan hệ giữa các hãng tin và AI. Trong khi nhiều đơn vị như BBC, CNN và Reuters đã chặn công cụ thu thập dữ liệu của OpenAI để bảo vệ nội dung của mình, một số khác lại tìm cách hợp tác. Axel Springer, công ty sở hữu Politico và Business Insider, vừa ký thỏa thuận cho phép ChatGPT khai thác thông tin trực tiếp từ hai nguồn này, và Associated Press cũng cho phép OpenAI huấn luyện các mô hình của mình trên các bài báo của họ trong 2 năm tới.