DeepSeek đã làm rung chuyển hệ sinh thái AI do Hoa Kỳ dẫn đầu với mô hình mới nhất của mình, làm giảm hàng trăm tỷ đô la vốn hóa thị trường của công ty chip hàng đầu Nvidia. Trong khi các công ty dẫn đầu ngành đang vật lộn với hậu quả, các công ty AI nhỏ hơn nhìn thấy cơ hội mở rộng quy mô với công ty khởi nghiệp của Trung Quốc.
Một số công ty liên quan đến AI đã nói với CNBC rằng sự xuất hiện của DeepSeek là một cơ hội "lớn" đối với họ, thay vì là một mối đe dọa.
Andrew Feldman, Giám đốc điều hành của công ty khởi nghiệp chip trí tuệ nhân tạo Cerebras Systems cho biết: "Các nhà phát triển rất muốn thay thế các mô hình đóng và đắt tiền của OpenAI bằng các mô hình nguồn mở như DeepSeek R1...".
Công ty cạnh tranh với các đơn vị xử lý đồ họa của Nvidia và cung cấp các dịch vụ dựa trên đám mây thông qua các cụm máy tính của riêng mình. Feldman cho biết việc phát hành mô hình R1 đã tạo ra một trong những đợt tăng đột biến lớn nhất từ trước đến nay của Cerebras về nhu cầu đối với các dịch vụ của mình.
Feldman nói thêm: "R1 cho thấy rằng sự tăng trưởng [thị trường AI] sẽ không bị chi phối bởi một công ty duy nhất — không có rào cản về phần cứng và phần mềm đối với các mô hình nguồn mở".
Nguồn mở đề cập đến phần mềm trong đó mã nguồn được cung cấp miễn phí trên web để có thể sửa đổi và phân phối lại. Các mô hình của DeepSeek là nguồn mở, không giống như các mô hình của các đối thủ cạnh tranh như OpenAI.
DeepSeek cũng tuyên bố mô hình lý luận R1 của mình có thể sánh ngang với công nghệ tốt nhất của Mỹ, mặc dù chạy với chi phí thấp hơn và được đào tạo mà không cần các đơn vị xử lý đồ họa tiên tiến, mặc dù những người theo dõi ngành và các đối thủ cạnh tranh đã đặt câu hỏi về những khẳng định này.
Feldman cho biết "Giống như trên thị trường PC và internet, giá giảm giúp thúc đẩy việc áp dụng trên toàn cầu. Thị trường AI đang trên con đường tăng trưởng thế tục tương tự".
Chip suy luận
DeepSeek có thể tăng cường việc áp dụng các công nghệ chip mới bằng cách đẩy nhanh chu kỳ AI từ giai đoạn đào tạo đến giai đoạn "suy luận", các công ty khởi nghiệp về chip và các chuyên gia trong ngành cho biết.
Suy luận đề cập đến hành động sử dụng và áp dụng AI để đưa ra dự đoán hoặc quyết định dựa trên thông tin mới, thay vì xây dựng hoặc đào tạo mô hình.
"Nói một cách đơn giản, đào tạo AI là về việc xây dựng một công cụ hoặc thuật toán, trong khi suy luận là về việc thực sự triển khai công cụ này để sử dụng trong các ứng dụng thực tế", Phelix Lee, một nhà phân tích vốn chủ sở hữu tại Morningstar, tập trung vào chất bán dẫn, cho biết.
Mặc dù Nvidia nắm giữ vị trí thống lĩnh trong lĩnh vực GPU được sử dụng để đào tạo AI, nhiều đối thủ cạnh tranh thấy có chỗ để mở rộng trong phân khúc "suy luận", nơi họ hứa hẹn hiệu quả cao hơn với chi phí thấp hơn.
Đào tạo AI đòi hỏi rất nhiều tính toán, nhưng suy luận có thể hoạt động với các chip ít mạnh hơn được lập trình để thực hiện một phạm vi nhiệm vụ hẹp hơn, Lee nói thêm.
Một số công ty khởi nghiệp về chip AI đã nói với CNBC rằng họ thấy nhu cầu về chip suy luận và điện toán ngày càng tăng khi khách hàng áp dụng và xây dựng trên mô hình nguồn mở của DeepSeek.
″[DeepSeek] đã chứng minh rằng các mô hình mở nhỏ hơn có thể được đào tạo để có khả năng ngang bằng hoặc cao hơn các mô hình độc quyền lớn hơn và điều này có thể thực hiện được với chi phí chỉ bằng một phần nhỏ", Sid Sheth, CEO của công ty khởi nghiệp về chip AI d-Matrix cho biết.
"Với sự sẵn có rộng rãi của các mô hình nhỏ có khả năng, chúng đã thúc đẩy kỷ nguyên suy luận", ông nói với CNBC, đồng thời nói thêm rằng công ty gần đây đã chứng kiến sự gia tăng quan tâm từ các khách hàng toàn cầu muốn đẩy nhanh kế hoạch suy luận của họ.
Robert Wachen, đồng sáng lập kiêm giám đốc điều hành của nhà sản xuất chip AI Etched, cho biết hàng chục công ty đã liên hệ với công ty khởi nghiệp này kể từ khi DeepSeek phát hành các mô hình suy luận của mình.
"Các công ty [hiện] đang chuyển chi tiêu của họ từ các cụm đào tạo sang các cụm suy luận", ông nói.
“DeepSeek-R1 đã chứng minh rằng tính toán thời gian suy luận hiện là phương pháp tiếp cận [hiện đại] cho mọi nhà cung cấp mô hình lớn và suy nghĩ không hề rẻ - chúng ta chỉ cần ngày càng nhiều khả năng tính toán để mở rộng các mô hình này cho hàng triệu người dùng.”
Nghịch lý của Jevon
Các nhà phân tích và chuyên gia trong ngành đồng ý rằng những thành tựu của DeepSeek là động lực thúc đẩy suy luận AI và ngành công nghiệp chip AI nói chung.
“Hiệu suất của DeepSeek dường như dựa trên một loạt các cải tiến kỹ thuật giúp giảm đáng kể chi phí suy luận đồng thời cải thiện chi phí đào tạo”, theo báo cáo từ Bain & Company.
“Trong một kịch bản tăng giá, những cải tiến hiệu quả đang diễn ra sẽ dẫn đến suy luận rẻ hơn, thúc đẩy việc áp dụng AI nhiều hơn”, báo cáo cho biết thêm.
Mô hình này giải thích cho Nghịch lý của Jevon, một lý thuyết trong đó việc cắt giảm chi phí trong một công nghệ mới thúc đẩy nhu cầu tăng lên.
Công ty dịch vụ tài chính và đầu tư Wedbush cho biết trong một lưu ý nghiên cứu vào tuần trước rằng họ vẫn kỳ vọng việc sử dụng AI trên toàn bộ người tiêu dùng doanh nghiệp và bán lẻ trên toàn cầu sẽ thúc đẩy nhu cầu.
Phát biểu với chương trình “Fast Money” của CNBC tuần trước, Sunny Madra, Giám đốc điều hành tại Groq, đơn vị phát triển chip cho suy luận AI, cho rằng khi nhu cầu chung về AI tăng lên, các công ty nhỏ hơn sẽ có nhiều không gian hơn để phát triển. “Vì thế giới sẽ cần nhiều token hơn [một đơn vị dữ liệu mà mô hình AI xử lý] nên Nvidia không thể cung cấp đủ chip cho tất cả mọi người, vì vậy điều này tạo cơ hội cho chúng tôi bán ra thị trường một cách tích cực hơn nữa”, Madra cho biết.