Hàng loạt công ty công nghệ lớn của Trung Quốc như Baidu, ByteDance, Tencent và Alibaba đã đặt hàng khoảng 100.000 bộ vi xử lý A800 trị giá hơn một tỷ USD từ Nvidia, giao hàng năm nay. Bên cạnh đó, số lượng đơn hàng khác với tổng giá bốn tỷ USD sẽ được giao vào năm 2024.
A800, được giới thiệu đầu năm nay, là phiên bản chip đồ họa (GPU) cho xử lý dữ liệu lớn, dùng trong các trung tâm dữ liệu. Đây là bản tinh chỉnh từ mẫu A100 mạnh hơn của Nvidia nhằm lách luật hạn chế xuất khẩu bán dẫn của Mỹ năm ngoái. Nvidia không công bố thông số cụ thể của H800. Theo một nguồn tin trong ngành công nghiệp bán dẫn Trung Quốc tiết lộ với Reuters, chip bị hạ tốc độ truyền dữ liệu chip-to-chip xuống mức đủ để Nvidia được phép đưa sang Trung Quốc.
Các công ty Internet hàng đầu Trung Quốc đang chạy đua tích trữ A800 vì lo chính quyền Tổng thống Mỹ Joe Biden đang xem xét nhiều lệnh hành pháp mới, trong đó có thể cấm cả các mẫu chip yếu hơn mà doanh nghiệp Mỹ đang bán cho Trung Quốc.
Sau khi các quan chức Mỹ yêu cầu Nvidia ngừng xuất khẩu hai chip máy tính hàng đầu của mình sang Trung Quốc, công ty đã lách luật bằng cách phát triển thêm chip A800 - bộ xử lý được tinh chỉnh từ mẫu A100 mạnh hơn của Nvidia. Theo một nguồn tin trong ngành công nghiệp bán dẫn, chip A800 bị hạ tốc độ truyền dữ liệu chip-to-chip xuống mức đủ để Nvidia được phép xuất khẩu sang Trung Quốc.
Ngày 9/8, Washington thông báo lệnh cấm mới có hiệu lực từ năm sau đối với một số khoản đầu tư của Mỹ vào lĩnh vực công nghệ cao Trung Quốc, bao gồm điện toán lượng tử, chip tiên tiến và AI. “Nếu không có chip Nvidia, chúng tôi không thể đào tạo bất kỳ mô hình ngôn ngữ lớn nào”, một nhân viên Baidu giấu tên chia sẻ.
Khi AI đang gây sốt toàn cầu, GPU của Nvidia trở thành món hàng “nóng” nhất vì cung cấp năng lực điện toán để phát triển mô hình ngôn ngữ lớn. Big Tech Trung Quốc chạy đua dự trữ chip A800 vì lo ngại chính quyền ông Biden sẽ áp dụng các biện pháp hạn chế xuất khẩu mới, ảnh hưởng đến cả những con chip thấp hơn của Nvidia, cũng như thiếu hụt GPU do cầu vượt quá cung.
Các công ty đang phát triển mô hình ngôn ngữ lớn riêng sau thành công của ChatGPT, chatbot do OpenAI ra mắt 8 tháng trước. Theo nguồn tin, vài nhóm nhỏ trong ByteDance đang làm các sản phẩm AI tạo sinh khác nhau, trong đó có chatbot Grace.
Đầu năm nay, ByteDance đã thử nghiệm tính năng AI tạo sinh cho TikTok – TikTok Tako – dùng ChatGPT của OpenAI. Hai nhân viên của hãng tiết lộ họ đã dự trữ ít nhất 10.000 GPU Nvidia để phục vụ tham vọng của mình. Ngoài ra, ByteDance còn đặt gần 70.000 chip A8 trị giá khoảng 700 triệu USD cho năm sau.
Trong khi đó, Alibaba muốn đưa mô hình ngôn ngữ lớn lên mọi sản phẩm, bao gồm nền tảng mua sắm trực tuyến Taobao, công cụ bản đồ Gaode Map. Baidu đang có dự án tương tự ChatGPT mang tên Ernie Bot.
Ngoài mô hình AI, chip cũng được tích trữ để sử dụng cho các trung tâm dữ liệu đám mây. Hồi tháng 4, Tencent tạo hệ thống máy chủ cho thuê sử dụng GPU Nvidia H800, một bản hạ hiệu năng khác từ chip H100. Alibaba Cloud và Baidu cũng nhập hàng nghìn chip H800 thời gian qua.
Baidu, ByteDance, Tencent và Alibaba từ chối bình luận. Nvidia không nhắc trực tiếp đến đối tác Trung Quốc, nhưng cho hay: "Những doanh nghiệp đầu tư hàng tỷ USD cho dịch vụ Internet lẫn nền tảng đám mây thường đặt hàng chúng tôi trước nhiều tháng".
Theo tiết lộ từ nhân viên tại các công ty công nghệ Trung Quốc, kể từ đầu năm nay, hầu hết tên tuổi lớn trong nước đều tích trữ ít nhất vài nghìn chip nhằm sẵn sàng cho các hệ thống đào tạo LLM. Điều này khiến giá chip tăng vọt trong thời gian ngắn.
"Giá A800 khi đến tay nhà phân phối đã tăng hơn 50% từ đầu năm", một nhà phân phối của Nvidia cho biết.