Thời điểm phát hành Qwen 2.5-Max bất thường, vào ngày đầu tiên của Tết Nguyên đán khi hầu hết người dân Trung Quốc nghỉ làm và ở bên gia đình, cho thấy áp lực mà công ty khởi nghiệp AI Trung Quốc DeepSeek phải chịu trong ba tuần qua không chỉ đối với các đối thủ nước ngoài mà còn đối với cả đối thủ cạnh tranh trong nước.
"Qwen 2.5-Max vượt trội hơn ... hầu như trên mọi phương diện so với GPT-4o, DeepSeek-V3 và Llama-3.1-405B", đơn vị đám mây của Alibaba cho biết trong một thông báo được đăng trên tài khoản WeChat chính thức của mình, ám chỉ đến các mô hình AI nguồn mở tiên tiến nhất của OpenAI và Meta.
Việc phát hành trợ lý AI của DeepSeek vào ngày 10 tháng 1, được hỗ trợ bởi mô hình DeepSeek-V3, cũng như việc phát hành mô hình R1 vào ngày 20 tháng 1, đã gây sốc cho Thung lũng Silicon và khiến cổ phiếu công nghệ lao dốc, với chi phí phát triển và sử dụng được cho là thấp của công ty khởi nghiệp Trung Quốc này khiến các nhà đầu tư đặt câu hỏi về các kế hoạch chi tiêu lớn của các công ty AI hàng đầu tại Hoa Kỳ.
Nhưng thành công của DeepSeek cũng dẫn đến một cuộc chạy đua giữa các đối thủ cạnh tranh trong nước để nâng cấp các mô hình AI của riêng họ.
Hai ngày sau khi phát hành DeepSeek-R1, chủ sở hữu TikTok là ByteDance đã phát hành bản cập nhật cho mô hình AI hàng đầu của mình, được cho là vượt trội hơn o1 của OpenAI do Microsoft hỗ trợ trong AIME, một bài kiểm tra chuẩn mực đo lường mức độ hiểu và phản hồi của các mô hình AI đối với các hướng dẫn phức tạp.
Điều này lặp lại tuyên bố của DeepSeek rằng mô hình R1 của họ cạnh tranh với o1 của OpenAI trên một số chuẩn mực hiệu suất.
Flying V, một khái niệm đang được phát triển tại Đại học Delft ở Hà Lan,
DEEPSEEK ĐỐI ĐẦU VỚI CÁC ĐỐI THỦ TRONG NƯỚC
Tiền thân của mô hình V3 của DeepSeek, DeepSeek-V2, đã gây ra cuộc chiến giá mô hình AI tại Trung Quốc sau khi nó được phát hành vào tháng 5 năm ngoái.
Thực tế là DeepSeek-V2 là mã nguồn mở và rẻ chưa từng có, chỉ 1 nhân dân tệ (0,14 đô la) cho 1 triệu mã thông báo - hoặc đơn vị dữ liệu được xử lý bởi mô hình AI - đã khiến đơn vị đám mây của Alibaba tuyên bố giảm giá tới 97% cho một loạt các mô hình.
Các công ty công nghệ Trung Quốc khác cũng làm theo, bao gồm Baidu, đã phát hành phiên bản tương đương đầu tiên của Trung Quốc với ChatGPT vào tháng 3 năm 2023 và công ty internet có giá trị nhất của đất nước này là Tencent.