Nvidia nhận thấy họ đang là trung tâm của sự bùng nổ trí tuệ nhân tạo vào năm ngoái khi bộ xử lý đồ họa máy chủ đắt tiền, bao gồm cả H100, trở nên cần thiết cho việc đào tạo và triển khai AI tổng hợp như ChatGPT của OpenAI. Giờ đây, Nvidia đang phát huy sức mạnh của mình trong lĩnh vực GPU tiêu dùng cho cái gọi là AI “cục bộ” có thể chạy trên PC hoặc máy tính xách tay ở nhà hoặc văn phòng.
Nvidia đã công bố ba card đồ họa mới vào thứ Hai – RTX 4060 Super, RTX 4070 Ti Super và RTX 4080 Super – có mức giá từ 599 USD đến 999 USD. Các thẻ này có thêm “lõi tensor” được thiết kế để chạy các ứng dụng AI tổng hợp. Nvidia cũng sẽ cung cấp card đồ họa cho laptop của các hãng như Acer, Dell và Lenovo.
Nhu cầu về GPU doanh nghiệp của Nvidia, vốn có giá hàng chục nghìn đô la mỗi GPU và thường đi kèm với một hệ thống có 8 GPU hoạt động cùng nhau, đã dẫn đến doanh số bán hàng tổng thể của Nvidia tăng vọt và giá trị thị trường lên tới hơn 1 nghìn tỷ USD.
GPU dành cho PC từ lâu đã là nguồn sống của Nvidia, nhằm mục đích chạy trò chơi điện tử, nhưng công ty cho biết card đồ họa năm nay đã được cải tiến nhằm hướng tới việc chạy các mô hình AI mà không gửi thông tin trở lại đám mây.
Công ty cho biết các chip đồ họa mới dành cho người tiêu dùng sẽ chủ yếu được sử dụng để chơi game nhưng vẫn có thể xử lý các ứng dụng AI. Ví dụ: Nvidia cho biết RTX 4080 Super có thể tạo video AI nhanh hơn 150% so với mẫu thế hệ trước. Nvidia cho biết những cải tiến phần mềm khác mà công ty công bố gần đây sẽ giúp việc xử lý mô hình ngôn ngữ lớn nhanh hơn gấp 5 lần.
Justin Walker, giám đốc quản lý sản phẩm cấp cao của Nvidia, nói với các phóng viên trong một cuộc họp báo: “Với 100 triệu GPU RTX được xuất xưởng, chúng cung cấp cơ sở cài đặt khổng lồ cho các PC mạnh mẽ dành cho các ứng dụng AI”.
Nvidia hy vọng các ứng dụng AI mới sẽ xuất hiện trong năm tới để tận dụng sức mạnh tăng lên. Microsoft dự kiến sẽ phát hành phiên bản Windows mới vào cuối năm nay, Windows 12, phiên bản này có thể tận dụng tối đa lợi thế của chip AI.
Walker cho biết, con chip mới có thể được sử dụng để tạo hình ảnh trên trình tạo Firefly của Adobe Photoshop hoặc để xóa nền trong các cuộc gọi điện video. Nvidia cũng đang tạo ra các công cụ cho phép các nhà phát triển trò chơi tích hợp AI tổng hợp vào các tựa game của họ, chẳng hạn như để tạo ra cuộc đối thoại từ một nhân vật không phải người chơi.
Cạnh so với máy chủ
Các thông báo về chip của Nvidia trong tuần này cho thấy rằng mặc dù đây là công ty liên kết nhiều nhất với GPU máy chủ lớn, nhưng nó cũng sẽ cạnh tranh với Intel, AMD và Qualcomm trong lĩnh vực AI địa phương. Cả ba đều đã công bố những con chip mới sẽ cung cấp năng lượng cho cái gọi là “PC AI” với các bộ phận chuyên dụng cho máy học.
Động thái của Nvidia diễn ra khi ngành công nghệ đang tìm ra cách tốt nhất để triển khai AI tổng hợp, vốn đòi hỏi một lượng sức mạnh tính toán khổng lồ và có thể tốn một khoản chi phí đáng kinh ngạc để chạy trên các dịch vụ đám mây.
Một giải pháp kỹ thuật đang được các đối thủ của Microsoft và Nvidia quảng bá là cái được gọi là “AI PC” hay đôi khi được gọi là “điện toán biên”. Thay vì sử dụng các siêu máy tính mạnh mẽ qua internet, các thiết bị sẽ có chip AI mạnh hơn bên trong và chúng có thể chạy cái gọi là mô hình ngôn ngữ lớn hoặc trình tạo hình ảnh, mặc dù có một số hạn chế và thiếu sót.
Nvidia đề xuất các ứng dụng có thể sử dụng mô hình đám mây cho các câu hỏi phức tạp và mô hình AI cục bộ cho các tác vụ cần thực hiện nhanh chóng.
“GPU Nvidia trên đám mây có thể chạy các mô hình ngôn ngữ lớn thực sự lớn và sử dụng tất cả sức mạnh xử lý đó để cung cấp năng lượng cho các mô hình AI rất lớn, đồng thời các lõi tensor RTX trong PC của bạn sẽ chạy các ứng dụng AI nhạy cảm với độ trễ hơn, ” Walker của Nvidia cho biết.
Công ty cho biết các card đồ họa mới sẽ tuân thủ các biện pháp kiểm soát xuất khẩu và có thể được chuyển đến Trung Quốc, đồng thời cung cấp giải pháp thay thế cho các nhà nghiên cứu và công ty Trung Quốc không thể có được GPU máy chủ mạnh nhất của Nvidia.