Alibaba đã phát hành thế hệ tiếp theo của các mô hình ngôn ngữ lớn mã nguồn mở, Qwen3, vào thứ Ba (29/4) — và các chuyên gia gọi đây là một bước đột phá nữa trong không gian trí tuệ nhân tạo mã nguồn mở đang bùng nổ của Trung Quốc.
Trong một bài đăng trên blog, gã khổng lồ công nghệ Trung Quốc cho biết Qwen3 hứa hẹn sẽ cải thiện khả năng lập luận, tuân theo hướng dẫn, sử dụng công cụ và các tác vụ đa ngôn ngữ, cạnh tranh với các mô hình hàng đầu khác như R1 của DeepSeek trong một số tiêu chuẩn của ngành.
Dòng LLM bao gồm tám biến thể trải dài trên nhiều kiến trúc và kích thước, mang đến cho các nhà phát triển sự linh hoạt khi sử dụng Qwen để xây dựng các ứng dụng AI cho các thiết bị biên như điện thoại di động.
Qwen3 cũng là sản phẩm đầu tay của Alibaba trong cái gọi là "mô hình lập luận lai", mà hãng cho biết kết hợp các khả năng LLM truyền thống với "lập luận động, tiên tiến".
Theo Alibaba, các mô hình như vậy có thể chuyển đổi liền mạch giữa "chế độ suy nghĩ" cho các tác vụ phức tạp như mã hóa và "chế độ không suy nghĩ" để phản hồi nhanh hơn, có mục đích chung.
“Đáng chú ý, mô hình Qwen3-235B-A22B MoE giúp giảm đáng kể chi phí triển khai so với các mô hình tiên tiến khác, củng cố cam kết của Alibaba đối với AI có thể truy cập và hiệu suất cao”, Alibaba cho biết.
Các mô hình mới hiện đã có sẵn miễn phí cho người dùng cá nhân trên các nền tảng như Hugging Face và GitHub, cũng như giao diện web của Alibaba Cloud. Qwen3 cũng đang được sử dụng để hỗ trợ trợ lý AI của Alibaba, Quark.
Sự tiến bộ của AI tại Trung Quốc
Các nhà phân tích AI nói rằng, Qwen3 là một thách thức nghiêm trọng đối với các đối tác của Alibaba tại Trung Quốc, cũng như các công ty hàng đầu trong ngành tại Hoa Kỳ.
Trong một tuyên bố, Wei Sun, nhà phân tích chính về trí tuệ nhân tạo tại Counterpoint Research, cho biết dòng Qwen3 là một “bước đột phá đáng kể—không chỉ vì hiệu suất tốt nhất trong phân khúc” mà còn vì một số tính năng chỉ ra “tiềm năng ứng dụng của các mô hình”.
Các tính năng đó bao gồm chế độ tư duy lai của Qwen3, hỗ trợ đa ngôn ngữ bao gồm 119 ngôn ngữ và phương ngữ và tính khả dụng của mã nguồn mở, Sun nói thêm.
Phần mềm mã nguồn mở thường đề cập đến phần mềm trong đó mã nguồn được cung cấp miễn phí trên web để có thể sửa đổi và phân phối lại. Vào đầu năm nay, mô hình R1 mã nguồn mở của DeepSeek đã làm rung chuyển thế giới AI và nhanh chóng trở thành chất xúc tác cho không gian AI và việc áp dụng mô hình mã nguồn mở của Trung Quốc.
"Việc Alibaba phát hành loạt Qwen 3 càng nhấn mạnh thêm khả năng mạnh mẽ của các phòng thí nghiệm Trung Quốc trong việc phát triển các mô hình mã nguồn mở, sáng tạo và có tính cạnh tranh cao, bất chấp áp lực ngày càng tăng từ việc kiểm soát xuất khẩu chặt chẽ hơn của Hoa Kỳ", Ray Wang, một nhà phân tích có trụ sở tại Washington tập trung vào cạnh tranh kinh tế và công nghệ giữa Hoa Kỳ và Trung Quốc, cho biết.
Theo Alibaba, Qwen đã trở thành một trong những loạt mô hình AI mã nguồn mở được áp dụng rộng rãi nhất trên thế giới, thu hút hơn 300 triệu lượt tải xuống trên toàn thế giới và hơn 100.000 mô hình phái sinh trên Hugging Face.
Wang cho biết việc áp dụng này có thể tiếp tục với Qwen3, đồng thời nói thêm rằng các tuyên bố về hiệu suất của nó có thể biến nó thành mô hình nguồn mở tốt nhất trên toàn cầu — mặc dù vẫn kém hơn các mô hình tiên tiến nhất thế giới như o3 và o4-mini của OpenAI.
Các đối thủ cạnh tranh của Trung Quốc như Baidu cũng đã nhanh chóng phát hành các mô hình AI mới sau khi DeepSeek xuất hiện, bao gồm cả việc lập kế hoạch chuyển sang mô hình kinh doanh nguồn mở hơn.
Trong khi đó, Reuters đưa tin vào tháng 2 rằng DeepSeek đang đẩy nhanh việc ra mắt phiên bản kế nhiệm của R1, trích dẫn các nguồn tin ẩn danh.
Wang cho biết "Trong bối cảnh rộng hơn của cuộc đua AI giữa Hoa Kỳ và Trung Quốc, khoảng cách giữa các phòng thí nghiệm của Hoa Kỳ và Trung Quốc đã thu hẹp lại — có thể chỉ còn vài tháng, và một số người có thể cho rằng, thậm chí chỉ còn vài tuần".
"Với bản phát hành mới nhất của Qwen 3 và sự ra mắt sắp tới của R2 của DeepSeek, khoảng cách này khó có thể mở rộng — và thậm chí có thể tiếp tục thu hẹp".