Hôm thứ Hai (1/9), gã khổng lồ công nghệ Trung Quốc Tencent Holdings đã ra mắt một mô hình dịch thuật nguồn mở mới, đã giành chiến thắng trong cuộc thi dịch máy toàn cầu mặc dù kích thước tham số của nó khá nhỏ, qua đó nhấn mạnh những tiến bộ mà quốc gia này đã đạt được trong lĩnh vực trí tuệ nhân tạo.
Theo kết quả sơ bộ do ban tổ chức sự kiện công bố, Hunyuan-MT-7B của Tencent đã giành giải nhất ở 30/31 bài kiểm tra trong cuộc thi dịch máy tổng quát, được tổ chức trong khuôn khổ Hội nghị Dịch máy lần thứ 10, hay còn gọi là WMT25. WMT25 đóng vai trò là nền tảng để các nhà nghiên cứu và nhà phát triển giới thiệu những tiến bộ của họ trong lĩnh vực dịch thuật hỗ trợ máy tính.
Mặc dù chỉ có 7 tỷ tham số - một thước đo cho các mô hình AI, trong đó càng lớn càng tốt - nhưng mô hình của Tencent đã vượt trội hơn hẳn, vượt trội hơn đáng kể so với các mô hình nguồn đóng và lớn hơn từ các đối thủ cạnh tranh toàn cầu, bao gồm Google và OpenAI.
Tencent có trụ sở tại Thâm Quyến ghi nhận khả năng dịch thuật của mô hình Hunyuan mới là nhờ "mô hình đào tạo mô hình dịch thuật hoàn chỉnh", bao gồm việc quản lý tập dữ liệu, đào tạo trước liên tục và nhiều phương pháp tinh chỉnh cũng như học tăng cường - những kỹ thuật được sử dụng để tinh chỉnh mô hình nhằm tạo ra hiệu suất tối ưu.
"Điểm mạnh của Hunyuan-MT-7B là nó sử dụng một số lượng nhỏ tham số để mang lại kết quả có thể đo lường hoặc thậm chí vượt trội hơn các mô hình lớn hơn", nhóm Tencent, chịu trách nhiệm phát triển loạt hệ thống AI Hunyuan, cho biết trong một tuyên bố.
Các cặp ngôn ngữ tiếng Anh được kiểm tra trong cuộc thi bao gồm tiếng Ả Rập, tiếng Estonia và tiếng Maasai, ngôn ngữ được 1,5 triệu người sống ở miền nam Kenya và miền bắc Tanzania sử dụng.
Các cặp ngôn ngữ khác bao gồm tiếng Séc-Ukraina và tiếng Nhật-Trung Quốc giản thể. Cặp ngôn ngữ tiếng Anh duy nhất mà Hunyuan không thể vượt qua là tiếng Bhojpuri, một ngôn ngữ được khoảng 50,5 triệu người sử dụng ở một số vùng miền bắc Ấn Độ và Nepal.
Tom Kocmi, một nhà nghiên cứu tại công ty công nghệ AI Cohere và là người tổ chức WMT25, cho biết trong một bài đăng trên LinkedIn rằng kết quả sơ bộ nên được xem xét "một cách thận trọng", vì chúng dựa trên đánh giá tự động và có thể bị ảnh hưởng bởi sự thiên vị.
Bảng xếp hạng chính thức dựa trên đánh giá của con người, kèm theo phân tích chi tiết, sẽ được công bố tại hội nghị WMT25 diễn ra từ ngày 5 đến ngày 9 tháng 11 tại Tô Châu, tỉnh Giang Tô, miền đông Trung Quốc.
Tencent cho biết mô hình dịch thuật Hunyuan của họ đã được sử dụng trên một loạt các sản phẩm nội bộ, chẳng hạn như Tencent Meeting tương tự Zoom, một trình duyệt web và phiên bản doanh nghiệp của ứng dụng nhắn tin WeChat.
Mô hình này cũng đã được tải lên Hugging Face và GitHub, các nền tảng trực tuyến lưu trữ các hệ thống AI và dự án phần mềm nguồn mở.