Alibaba Group Holding, gã khổng lồ thương mại điện tử đang đầu tư mạnh vào trí tuệ nhân tạo (AI), đã cập nhật các mô hình AI nguồn mở của mình với tuyên bố vượt trội hơn mô hình Llama 3 của Meta Platforms trong một số nhiệm vụ nhất định.
Alibaba Cloud hôm thứ Sáu (7/6) đã ra mắt Qwen2 – phiên bản thứ hai của dòng mô hình ngôn ngữ lớn (LLM) mã nguồn mở Tongyi Qianwen, công nghệ đằng sau các chatbot như ChatGPT của OpenAI – với một loạt các bản cập nhật bao gồm đào tạo trước đa ngôn ngữ và bối cảnh mở rộng cửa sổ. Điều đó có nghĩa là giờ đây nó cho phép thực hiện các truy vấn và câu trả lời dài hơn nhiều, đưa nó vào danh sách các LLM nguồn mở mạnh mẽ nhất thế giới.
Qwen2 có năm biến thể. Theo Alibaba, mô hình Qwen2-72B cao cấp luôn mang lại kết quả tốt hơn so với Llama 3-70B của Meta – mô hình AI nguồn mở mạnh nhất của chủ sở hữu Facebook – trong nhiều bài kiểm tra điểm chuẩn khác nhau. Các bài kiểm tra bao gồm toán học, mã hóa, khoa học tự nhiên và xã hội, kỹ thuật và nhân văn, công ty cho biết trong một bài đăng được đăng trên trang GitHub chính thức của mô hình.
Alibaba đã ra mắt Qwen2 chỉ một tháng sau khi ra mắt Tongyi Qianwen 2.5, một nguồn đóng. Vào thời điểm đó, công ty cho biết mô hình đó hoạt động tốt hơn ở nhiều khả năng khác nhau của Trung Quốc so với GPT-4, mô hình tiên tiến nhất của OpenAI, cũng là mã nguồn đóng.
Năm biến thể của Qwen2 của Alibaba, từ Qwen2-0.5B nhanh nhẹn hơn đến Qwen2-72B phức tạp nhất, có từ 490 triệu đến 72,7 tỷ tham số. Họ cũng được đào tạo về 27 ngôn ngữ, ngoài tiếng Trung và tiếng Anh: 9 ngôn ngữ từ Châu Âu, 4 ngôn ngữ từ Trung Đông và 14 ngôn ngữ từ Châu Á.
Sự ra mắt nhanh chóng của một mô hình AI mới, với khả năng phù hợp với các mô hình hàng đầu toàn cầu, phản ánh niềm tin rằng công ty Trung Quốc có được nguồn lực ngày càng tăng vào cuộc đua AI đã nhấn chìm phần lớn ngành công nghệ.
Nhiều công ty Trung Quốc khác, từ những gã khổng lồ công nghệ lớn nhất cho đến vô số công ty khởi nghiệp, đều đang nỗ lực phát triển LLM của riêng mình, gần đây đã gây ra một cuộc chiến giá cả trong nước.
Gã khổng lồ về trò chơi điện tử và truyền thông xã hội có trụ sở tại Thâm Quyến, Tencent Holdings đã công bố chatbot chuyên dụng của riêng mình vào cuối tháng 5 có tên là Yuanbao, được hỗ trợ bởi Hunyuan LLM mới nhất của công ty. Tencent cho biết mô hình cây nhà lá vườn của họ đã trải qua một loạt cải tiến kể từ khi ra mắt vào tháng 9 năm ngoái.
Hunyuan đã được đưa vào hơn 600 kịch bản kinh doanh trên khắp các tổ chức của Tencent, nhằm mục đích sử dụng AI để giúp nâng cao hiệu quả. Alibaba cũng đang tìm cách tận dụng AI để giúp chuyển đổi doanh nghiệp.
Alibaba.com, nền tảng tìm nguồn cung ứng xuyên biên giới giữa doanh nghiệp với doanh nghiệp của gã khổng lồ thương mại điện tử, gần đây đã giới thiệu các công cụ hỗ trợ AI của riêng mình để giúp kết nối người bán và người mua nhằm tăng doanh số bán hàng, Zhang Kuo, chủ tịch của nền tảng, nói với tờ Post. một cuộc phỏng vấn gần đây