OpenAI đã yêu cầu thẩm phán bác bỏ một phần vụ kiện của The New York Times chống lại họ, cáo buộc rằng công ty truyền thông “đã trả tiền cho ai đó để hack các sản phẩm của OpenAI”, chẳng hạn như ChatGPT, để tạo ra 100 ví dụ vi phạm bản quyền cho vụ kiện của họ.
Trong hồ sơ hôm thứ Hai gửi lên tòa án liên bang Manhattan, OpenAI cáo buộc New York Times đã phải thực hiện “hàng chục nghìn nỗ lực để tạo ra các kết quả rất bất thường” và công ty đã làm như vậy bằng cách sử dụng “những lời nhắc lừa đảo vi phạm trắng trợn các điều khoản sử dụng của OpenAI”. OpenAI đã viết trong hồ sơ: “Người bình thường không sử dụng các sản phẩm của OpenAI theo cách này”.
Việc "hack" mà OpenAI cáo buộc trong hồ sơ cũng có thể được gọi là kỹ thuật nhanh chóng hoặc "đội đỏ", một cách phổ biến để các nhóm an toàn và tin cậy trí tuệ nhân tạo, các nhà đạo đức, học giả và công ty công nghệ "kiểm tra căng thẳng" các hệ thống AI để tìm lỗ hổng . Đó là một thực tiễn phổ biến trong ngành AI và là một cách phổ biến để cảnh báo các công ty về các vấn đề trong hệ thống của họ, tương tự như cách các chuyên gia an ninh mạng kiểm tra các điểm yếu trên trang web của công ty.
New York Times đã không trả lời ngay lập tức yêu cầu bình luận của báo giới.
Việc nộp đơn được đưa ra khi một cuộc chiến rộng lớn hơn đang nóng lên giữa OpenAI và các nhà xuất bản, tác giả và nghệ sĩ về việc sử dụng tài liệu có bản quyền cho dữ liệu đào tạo AI, bao gồm cả vụ kiện cấp cao của Times, mà một số người coi là thời điểm bước ngoặt cho ngành. Vụ kiện của hãng tin này, được đệ trình vào tháng 12, nhằm buộc Microsoft và OpenAI phải chịu trách nhiệm về những thiệt hại hàng tỷ đô la.
Trước đây, OpenAI từng nói rằng “không thể” đào tạo các mô hình AI hàng đầu nếu không có tác phẩm có bản quyền.
OpenAI viết trong một báo cáo rằng: “Bởi vì bản quyền ngày nay bao trùm hầu như mọi loại biểu hiện của con người – bao gồm các bài đăng trên blog, ảnh, bài đăng trên diễn đàn, đoạn mã phần mềm và tài liệu của chính phủ – nên sẽ không thể đào tạo các mô hình AI hàng đầu ngày nay nếu không sử dụng các tài liệu có bản quyền”. nộp đơn vào tháng trước tại Vương quốc Anh, để đáp lại cuộc điều tra từ Hạ viện Vương quốc Anh.
OpenAI tiếp tục trong hồ sơ: “Việc giới hạn dữ liệu đào tạo đối với các sách và bản vẽ thuộc phạm vi công cộng được tạo ra cách đây hơn một thế kỷ có thể mang lại một thử nghiệm thú vị, nhưng sẽ không cung cấp các hệ thống AI đáp ứng nhu cầu của công dân ngày nay”.
Gần đây nhất vào tháng trước, tại Davos, Thụy Sĩ, Giám đốc điều hành OpenAI Sam Altman cho biết ông “ngạc nhiên” trước vụ kiện của New York Times, nói rằng, các mô hình của OpenAI không cần đào tạo về dữ liệu của nhà xuất bản.
“Chúng tôi thực sự không cần đào tạo về dữ liệu của họ,” Altman nói tại một sự kiện do Bloomberg tổ chức ở Davos. “Tôi nghĩ đây là điều mà mọi người không hiểu. Bất kỳ nguồn đào tạo cụ thể nào cũng không ảnh hưởng nhiều đến chúng tôi.”
Mặc dù một nhà xuất bản có thể không tạo ra sự khác biệt trong khả năng vận hành của ChatGPT, nhưng hồ sơ của OpenAI cho thấy rằng quyết định từ chối của nhiều nhà xuất bản có thể có hiệu lực. Trong những tháng gần đây, công ty bắt đầu thuyết phục các nhà xuất bản cho phép sử dụng nội dung cho dữ liệu đào tạo.
Công ty đã đạt được thỏa thuận với Axel Springer, tập đoàn truyền thông Đức sở hữu Business Insider, Morning Brew và các cửa hàng khác, đồng thời cũng được cho là đang đàm phán với CNN, Fox Corp. và Time để cấp phép cho hoạt động của họ.
OpenAI viết trong hồ sơ: “Chúng tôi hy vọng các cuộc đàm phán đang diễn ra của chúng tôi với những bên khác sẽ sớm mang lại các mối quan hệ đối tác bổ sung”.
Trong hồ sơ và các bài đăng trên blog của mình, OpenAI đã nhấn mạnh quy trình từ chối dành cho các nhà xuất bản, cho phép các cửa hàng cấm trình thu thập dữ liệu web của công ty truy cập vào trang web của họ. Nhưng trong hồ sơ, OpenAI cho biết nội dung này rất quan trọng để đào tạo các mô hình AI ngày nay.
“Mặc dù chúng tôi mong muốn tiếp tục phát triển các cơ chế bổ sung để trao quyền cho chủ sở hữu quyền từ chối tham gia đào tạo, nhưng chúng tôi vẫn tích cực hợp tác với họ để tìm ra các thỏa thuận cùng có lợi nhằm có được quyền truy cập vào các tài liệu không thể truy cập được và cũng để hiển thị nội dung theo cách mà các bên không thể tiếp cận được. vượt xa những gì luật bản quyền cho phép,” công ty viết.