DeepSeek, công ty khởi nghiệp công nghệ, vừa trình làng mô hình AI nguồn mở mang tên DeepSeek V3, được quảng bá là bước tiến vượt bậc trong xử lý tác vụ bằng văn bản.
Phát hành vào giữa tuần trước, DeepSeek V3 được mô tả là có thể thực hiện nhiều tác vụ phức tạp như mã hóa, dịch thuật, và viết nội dung từ văn bản đầu vào "một cách thông minh nhất". Với 671 tỷ tham số – lớn hơn khoảng 1,6 lần so với Llama 3.1 405B của Meta – mô hình này được đào tạo trên một tập dữ liệu khổng lồ lên đến 14,8 nghìn tỷ token.
DeepSeek khẳng định V3 vượt trội so với các mô hình hiện có, cả nguồn mở lẫn nguồn đóng. Trong các thử nghiệm trên Codeforces và Aider Polyglot – hai nền tảng đánh giá hiệu suất AI – V3 đánh bại các đối thủ lớn như GPT-4o của OpenAI và Qwen 2.5 của Alibaba.
Tuy nhiên, khi được thử nghiệm bởi TechCrunch và cộng đồng mạng xã hội, DeepSeek V3 lại bất ngờ tự nhận mình là ChatGPT. Khi được hỏi, mô hình này khẳng định là phiên bản của GPT-4, thậm chí hướng dẫn sử dụng API của OpenAI và kể chuyện cười theo phong cách tương tự GPT-4.
TechCrunch nghi ngờ DeepSeek đã sử dụng dữ liệu công khai từ GPT-4 thông qua ChatGPT để đào tạo mô hình. Điều này có thể dẫn đến tình trạng "ảo giác" AI – nơi các mô hình tạo ra câu trả lời không chính xác hoặc gây hiểu lầm.
Mike Cook, nhà nghiên cứu AI tại King's College London, cho rằng cách tiếp cận này có thể gây rủi ro lớn:
"Việc đào tạo dựa trên dữ liệu của một mô hình khác giống như sao chép một bản sao – các thông tin gốc dần mất đi. Điều này không chỉ vi phạm điều khoản sử dụng mà còn làm suy giảm chất lượng và tính độc lập của mô hình mới."
CEO OpenAI Sam Altman, trong một phát biểu trên mạng xã hội X, đã chế nhạo các AI đến từ Trung Quốc:
"Sao chép những gì hiệu quả là dễ, nhưng sáng tạo ra điều mới mẻ, đầy rủi ro và không chắc chắn mới là thách thức thực sự."
Trong khi đó, DeepSeek từ chối bình luận về nguồn dữ liệu đào tạo của V3.
Thành lập vào tháng 5/2023 tại Hàng Châu, DeepSeek tập trung vào nghiên cứu các thuật toán và kiến trúc AI đột phá. Khác với nhiều công ty công nghệ tại Trung Quốc, DeepSeek tự nhận sứ mệnh "giải mã bí ẩn của AGI bằng sự tò mò".
Dù đang đứng trước tranh cãi, DeepSeek V3 vẫn đánh dấu một bước tiến quan trọng trong nỗ lực khẳng định vị thế của Trung Quốc trên bản đồ AI toàn cầu. Tuy nhiên, câu chuyện về tính minh bạch và trách nhiệm của các mô hình AI vẫn sẽ là chủ đề được bàn luận sôi nổi trong thời gian tới.