Đáng chú ý, đây là lần đầu tiên mô hình chủ lực của hãng được tối ưu để vận hành trên chip Ascend của Huawei, cho thấy bước tiến quan trọng trong nỗ lực tự chủ công nghệ AI của Trung Quốc.
Theo Reuters, DeepSeek đã giới thiệu bản preview của DeepSeek-V4 với hai phiên bản gồm V4-Pro và V4-Flash. Phiên bản Pro được định vị cho các tác vụ phức tạp như lập trình tác tử (agentic coding), thi đấu lập trình và xử lý tri thức chuyên sâu, trong khi bản Flash hướng tới tốc độ phản hồi nhanh hơn và chi phí sử dụng thấp hơn. Cả hai đều sở hữu cửa sổ ngữ cảnh lên tới 1 triệu token – một bước nhảy lớn về khả năng xử lý văn bản dài và các tác vụ đa tầng phức tạp.
DeepSeek cho biết V4-Pro vượt qua hầu hết các mô hình mã nguồn mở hiện nay ở các bài kiểm tra toán học, lập trình và suy luận, chỉ xếp sau Gemini 3.1 Pro của Google trong một số bài đánh giá tri thức tổng hợp. Điều này cho thấy khoảng cách giữa các mô hình AI mở của Trung Quốc với các hệ thống đóng hàng đầu của Mỹ đang ngày càng thu hẹp.
Điểm đáng chú ý nhất của V4 nằm ở khả năng tương thích hoàn toàn với nền tảng Ascend 950 của Huawei. Đây là mô hình đầu tiên của DeepSeek được thiết kế để vận hành trên hệ sinh thái chip nội địa Trung Quốc thay vì phụ thuộc chủ yếu vào GPU Nvidia như các thế hệ trước. Huawei cũng xác nhận hệ thống Ascend supernode của hãng sẽ hỗ trợ đầy đủ cho DeepSeek-V4, đồng thời tham gia vào quá trình huấn luyện phiên bản Flash.
Giới phân tích nhận định đây là bước ngoặt quan trọng trong chiến lược AI của Trung Quốc. Các lệnh kiểm soát xuất khẩu chip từ Mỹ đã khiến việc tiếp cận GPU cao cấp của Nvidia trở nên khó khăn hơn, buộc các công ty AI Trung Quốc phải đẩy nhanh việc xây dựng hệ sinh thái phần cứng – phần mềm nội địa. Việc DeepSeek chuyển sang Huawei không chỉ mang ý nghĩa kỹ thuật mà còn phản ánh tham vọng thiết lập một tiêu chuẩn AI độc lập với hệ sinh thái CUDA của Nvidia.
Tuy nhiên, DeepSeek vẫn phải đối mặt với cạnh tranh gay gắt tại thị trường nội địa khi Alibaba, Baidu, Zhipu AI và nhiều startup AI khác cũng đang đẩy mạnh phát triển mô hình riêng. Reuters cho biết DeepSeek hiện đang hướng tới vòng gọi vốn mới với định giá có thể vượt 20 tỷ USD, trong đó Alibaba và Tencent được cho là đang xem xét đầu tư chiến lược.
Sự trở lại của DeepSeek diễn ra trong bối cảnh căng thẳng công nghệ Mỹ - Trung tiếp tục leo thang, đặc biệt khi Washington ngày càng siết chặt kiểm soát xuất khẩu chip và tăng cường giám sát hoạt động AI của các doanh nghiệp Trung Quốc. Trong bối cảnh đó, DeepSeek-V4 không chỉ là một sản phẩm công nghệ mới mà còn là biểu tượng cho nỗ lực tự chủ AI của Trung Quốc trong cuộc cạnh tranh công nghệ toàn cầu ngày càng quyết liệt.