"Điểm uốn của suy luận đã đến," Huang nói tại hội nghị GTC 2026 thường niên của Nvidia ở San Jose, California, và cho biết thêm rằng sự chuyển dịch sang điện toán dựa trên suy luận đang đẩy nhu cầu về cơ sở hạ tầng AI vượt quá 1 nghìn tỷ đô la Mỹ trong những năm tới.
Dự báo này gấp đôi ước tính trước đó của Huang rằng nhu cầu về hệ thống Blackwell và Vera Rubin của Nvidia có thể đạt khoảng 500 tỷ đô la Mỹ vào năm 2026.
"Điện toán trước đây dựa trên việc truy xuất. Giờ đây nó dựa trên việc tạo ra," ông nói, mô tả một sự chuyển đổi cơ bản trong cách máy móc xử lý thông tin. Ông nhắc lại rằng Định luật Moore "đã hết động lực" và dự đoán rằng "mọi công ty phần mềm trong tương lai sẽ là các tác nhân, và họ sẽ là những nhà sản xuất token."
Huang kỳ vọng Đài Loan sẽ là một phần quan trọng trong chuỗi cung ứng cung cấp kiến trúc Vera Rubin của Nvidia.
Ba slide trong bài thuyết trình của ông cho thấy trong số hơn 60 đối tác toàn cầu của kiến trúc Vera Rubin của Nvidia, nhiều đối tác đến từ Đài Loan, chẳng hạn như Asustek Computer Inc., Foxconn, Quanta Cloud Technology, Wistron Corp. và Wiwynn Corp.
Ông Huang cũng tiết lộ thêm chi tiết về các hệ thống AI thế hệ tiếp theo của Nvidia, bao gồm nền tảng Vera Rubin, được thiết kế cho các tác vụ AI dựa trên tác nhân.
Hệ thống này có tính năng làm mát bằng chất lỏng 100% và thời gian triển khai được giảm đáng kể, ông cho biết sẽ rút ngắn thời gian cài đặt từ hai ngày xuống còn hai giờ.
Nvidia cũng đang hợp tác với công ty khởi nghiệp chip AI Groq Inc. để tối ưu hóa hiệu suất suy luận, với chip Groq sẽ được sản xuất bởi Samsung Electronics Co., ông Huang cho biết. Nhìn xa hơn, ông Huang giới thiệu kiến trúc Feynman của công ty như bước tiếp theo trong lộ trình phát triển, với các công nghệ xử lý và mạng mới, bao gồm cả quang học đóng gói chung.
Về mảng phần mềm, Huang nhấn mạnh sự trỗi dậy của "trí tuệ nhân tạo tự động" (agent AI), mô tả sự chuyển đổi trong đó các hệ thống phần mềm tự động thực hiện các nhiệm vụ và tạo ra kết quả đầu ra.
Ông chỉ ra sự nổi lên nhanh chóng của OpenClaw, một nền tảng trí tuệ nhân tạo tự động mã nguồn mở, và công bố hệ thống NemoClaw tập trung vào doanh nghiệp của Nvidia, được phát triển với các khả năng bảo mật và quyền riêng tư nâng cao dành cho mục đích sử dụng trong doanh nghiệp.
Huang cũng phác thảo tham vọng của Nvidia vượt ra ngoài Trái đất, tiết lộ kế hoạch phát triển các trung tâm dữ liệu đặt trong không gian được cung cấp năng lượng bởi hệ thống Vera Rubin Space-1 của hãng.
Những nỗ lực như vậy phải đối mặt với những thách thức kỹ thuật đáng kể do thiếu các phương pháp làm mát thông thường trong không gian, không có dẫn nhiệt hay đối lưu và chỉ có bức xạ để tản nhiệt.
"Chúng ta phải tìm ra cách làm mát các hệ thống này trong không gian, nhưng chúng tôi có rất nhiều kỹ sư giỏi đang làm việc về vấn đề này," ông nói.