Trong khi phần lớn ngành công nghiệp chip đổ dồn nguồn lực vào GPU phục vụ AI tạo sinh, nhiều phòng thí nghiệm quốc gia của Mỹ lại bắt đầu tìm kiếm các kiến trúc xử lý hoàn toàn khác để xây dựng thế hệ siêu máy tính mới cho nghiên cứu khoa học và an ninh quốc gia.
Theo Reuters, Sandia National Laboratories — một trong những trung tâm nghiên cứu hạt nhân quan trọng nhất của Mỹ — hiện đang thử nghiệm chip từ startup Israel NextSilicon thay vì phụ thuộc hoàn toàn vào Nvidia hay AMD như trước đây. Động thái này phản ánh một thực tế ngày càng rõ ràng trong kỷ nguyên AI: không phải mọi workload đều được tối ưu cho kiến trúc GPU vốn đang thống trị toàn bộ ngành công nghệ hiện nay.
Trong giai đoạn đầu của AI boom, GPU gần như trở thành chuẩn tính toán mặc định cho mọi thứ, từ chatbot, mô hình ngôn ngữ cho tới datacenter hyperscale. Nvidia nhờ đó vươn lên vị trí trung tâm của nền kinh tế AI toàn cầu khi GPU H100 và Blackwell trở thành “động cơ” cho hầu hết hệ thống AI hiện đại. Tuy nhiên, các ứng dụng khoa học cấp quốc gia lại vận hành theo logic hoàn toàn khác với AI tạo sinh.
Những hệ thống như mô phỏng hạt nhân, vật lý plasma, mô hình khí hậu hay nghiên cứu vật liệu tiên tiến đòi hỏi độ chính xác số học cực cao, khả năng tính toán ổn định và deterministic computing — nơi sai số nhỏ cũng có thể làm sụp đổ toàn bộ kết quả mô phỏng. Trong khi đó, AI hiện đại chủ yếu ưu tiên tensor throughput (thông lượng tensor), inference efficiency (hiệu quả suy luận) và các dạng tính toán độ chính xác thấp nhằm tối đa hóa tốc độ xử lý và giảm điện năng tiêu thụ.
Điều này khiến nhiều phòng thí nghiệm Mỹ bắt đầu lo ngại rằng ngành chip đang chuyển sang trạng thái “AI-first” quá mạnh, nơi gần như toàn bộ năng lực R&D đều xoay quanh chatbot và AI accelerator, còn các hệ thống HPC khoa học truyền thống ngày càng ít được ưu tiên hơn.
Chính khoảng trống đó đang tạo cơ hội cho các startup bán dẫn mới nổi như NextSilicon.
Nhà khoa học cấp cao tại Phòng thí nghiệm Quốc gia Sandia, James Laros, và Giám đốc điều hành của công ty khởi nghiệp chip NextSilicon, Elad Raz, cùng đứng cầm một trong những con chip của NextSilicon tại Viện Nghiên cứu Khoa học Máy tính tại Sandia ở Albuquerque, New Mexico, Hoa Kỳ, ngày 12 tháng 5 năm 2026.
Khác với CPU hay GPU truyền thống vốn sử dụng kiến trúc xử lý cố định, NextSilicon phát triển một nền tảng compute có khả năng tái cấu hình động theo từng workload. Thay vì ép mọi bài toán chạy trên cùng một kiến trúc chung, hệ thống của hãng có thể điều chỉnh pipeline xử lý theo thời gian thực để tối ưu cho từng loại tác vụ khoa học cụ thể.
Theo Reuters, công nghệ của NextSilicon đã vượt qua nhiều bài kiểm tra ban đầu tại Sandia và hiện được tích hợp vào hệ thống siêu máy tính thông qua hợp tác với Penguin Solutions. Dù còn ở giai đoạn thử nghiệm, động thái này cho thấy các phòng thí nghiệm quốc gia Mỹ đang bắt đầu mở cửa cho một thế hệ kiến trúc tính toán mới bên ngoài hệ sinh thái Nvidia.
Đây không phải thay đổi nhỏ.
Trong lịch sử ngành HPC, các national lab của Mỹ từng đóng vai trò “vườn ươm” cho nhiều công nghệ sau này trở thành tiêu chuẩn toàn ngành, từ liquid cooling, interconnect tốc độ cao cho tới heterogeneous computing. Những hệ thống ban đầu được thử nghiệm trong môi trường nghiên cứu quốc phòng thường sẽ dần lan sang thị trường thương mại nếu chứng minh được hiệu quả ở quy mô lớn.
Điều đó khiến giới công nghệ bắt đầu nhìn nhận cuộc thử nghiệm của Sandia như tín hiệu cho một giai đoạn phân hóa mới của ngành compute.
Trong nhiều năm, GPU được xem như lời giải gần như toàn năng cho mọi loại tính toán hiệu năng cao. Nhưng AI boom đang khiến thị trường bước sang kỷ nguyên “specialized compute” — nơi các loại workload khác nhau cần kiến trúc chip khác nhau thay vì phụ thuộc vào một nền tảng duy nhất.
Các hệ thống training AI cần AI accelerator tối ưu tensor operation. Edge AI cần chip siêu tiết kiệm điện. Datacenter inference yêu cầu hiệu suất trên watt cao nhất có thể. Trong khi đó, siêu máy tính phục vụ mô phỏng khoa học lại cần khả năng tính toán chính xác cao và độ ổn định tuyệt đối.
Sự phân hóa này đang mở ra cơ hội cho hàng loạt công ty trước đây bị lu mờ dưới cái bóng của Nvidia, từ Cerebras, Groq cho tới NextSilicon. Thị trường compute giờ không còn vận hành theo mô hình “one-size-fits-all” nữa.
Ở góc độ địa chính trị, xu hướng này cũng phản ánh nỗi lo ngày càng lớn của Washington về khả năng phụ thuộc quá mức vào một số nhà thống trị cung cấp chip. Khi hạ tầng AI trở thành tài sản chiến lược quốc gia, Mỹ không muốn toàn bộ hệ thống tính toán phục vụ quốc phòng, nghiên cứu hạt nhân và khoa học phụ thuộc hoàn toàn vào GPU thương mại từ một vài công ty duy nhất.
Đó là lý do các phòng thí nghiệm quốc gia hiện được xem như nơi thử nghiệm cho thế hệ compute architecture (kiến trúc máy tính) hậu GPU. Không chỉ tìm kiếm hiệu năng cao hơn, họ còn muốn xây dựng “supply resilience” — khả năng duy trì một hệ sinh thái chip đa dạng và ít rủi ro hơn trong bối cảnh chuỗi cung ứng bán dẫn toàn cầu ngày càng bất ổn.
Điều đáng chú ý là sự chuyển dịch này diễn ra đúng lúc AI đang tái định nghĩa toàn bộ ngành công nghiệp bán dẫn. Nếu giai đoạn đầu của AI boom xoay quanh chatbot và mô hình ngôn ngữ, thì đến năm 2026, cuộc cạnh tranh đã dịch chuyển sâu xuống tầng hạ tầng tính toán: ai kiểm soát chip, ai sở hữu compute capacity (năng lực tính toán) và ai có khả năng xây hệ sinh thái tính toán độc lập.
Trong bối cảnh đó, việc các phòng thí nghiệm hạt nhân Mỹ tìm đến những startup chip nhỏ không chỉ là một câu chuyện công nghệ, mà phản ánh nỗ lực lớn hơn nhằm định hình lại tương lai của ngành siêu máy tính trong kỷ nguyên AI.