Công ty cho biết hôm Chủ nhật (11/1) rằng, mô hình AI mới nhất của họ đã đạt hiệu suất tổng thể mạnh nhất trong số năm đội tham gia cuộc thi mô hình nền tảng AI do chính phủ dẫn đầu, đứng đầu 10 trong số 13 bài kiểm tra chuẩn với điểm trung bình là 72.
Trên toàn cầu, K-Exaone xếp thứ bảy trên Chỉ số Trí tuệ do Artificial Analysis biên soạn, là mô hình Hàn Quốc duy nhất lọt vào top 10 bảng xếp hạng toàn cầu về mô hình mở, vốn bị chi phối bởi các nhà phát triển Trung Quốc và Mỹ. Trung Quốc có sáu mô hình trong danh sách, dẫn đầu là mô hình GLM-4.7 của Z.AI ở vị trí đầu tiên, trong khi Mỹ có ba mô hình.
Được phát hành dưới dạng mô hình mở trên Hugging Face, K-Exaone đã nhanh chóng leo lên vị trí thứ hai trên bảng xếp hạng xu hướng mô hình toàn cầu của nền tảng này, phản ánh sự quan tâm mạnh mẽ từ các nhà lãnh đạo quốc tế.
Công ty cho biết sẽ cung cấp quyền truy cập API miễn phí vào K-Exaone đến hết ngày 28 tháng 1, cho phép các nhà phát triển và công ty sử dụng mô hình mà không mất phí trong giai đoạn triển khai ban đầu.
Mô hình này cũng được Epoch AI, một tổ chức phi lợi nhuận có trụ sở tại Mỹ, công nhận và đưa K-Exaone vào danh sách “Các mô hình AI đáng chú ý”. LG AI Research hiện đã có năm mô hình trong danh sách này – nhiều nhất trong số các công ty Hàn Quốc – bắt đầu với Exaone 3.5 vào năm 2024, tiếp theo là Exaone Deep, Exaone Path 2.0 và Exaone 4.0.
“Chúng tôi đã lập kế hoạch phát triển dựa trên thời gian và cơ sở hạ tầng hiện có, và chúng tôi đã phát triển K-Exaone giai đoạn đầu tiên chỉ sử dụng khoảng một nửa lượng dữ liệu hiện có”, ông Lee Jin-sik, người đứng đầu Exaone Lab tại LG AI Research, cho biết.
LG cho biết mô hình này đánh dấu đỉnh cao của 5 năm nghiên cứu nội bộ và báo hiệu sự gia nhập của Hàn Quốc vào cuộc cạnh tranh toàn cầu về các hệ thống AI tiên tiến.
Thay vì chỉ dựa vào quy mô, viện nghiên cứu cho biết họ đã thiết kế lại kiến trúc của mô hình để tăng hiệu suất đồng thời giảm chi phí đào tạo và vận hành.
K-Exaone áp dụng kiến trúc hỗn hợp chuyên gia (MoE) với tổng cộng 236 tỷ tham số, trong đó khoảng 23 tỷ tham số - tương đương khoảng 10% - được kích hoạt cho mỗi lần suy luận, cho phép hiệu suất cao hơn với hiệu quả lớn hơn.
Công nghệ cốt lõi của mô hình, cơ chế chú ý lai (hybrid attention), tăng cường khả năng tập trung vào thông tin quan trọng trong quá trình xử lý dữ liệu đồng thời giảm yêu cầu bộ nhớ và tải tính toán đến 70% so với các mô hình trước đây.
Bộ phân tách từ (tokenizer) cũng được nâng cấp bằng cách mở rộng vốn từ vựng đào tạo lên 150.000 từ và tối ưu hóa các tổ hợp từ thường dùng, cải thiện khả năng xử lý tài liệu lên 1,3 lần. Việc áp dụng dự đoán đa từ (multi-token prediction) đã tăng tốc độ suy luận lên 150%,进一步 cải thiện hiệu quả tổng thể, LG cho biết.
“K-Exaone được thiết kế để tối đa hóa hiệu quả đồng thời giảm chi phí, cho phép nó hoạt động trên GPU loại A100 thay vì yêu cầu cơ sở hạ tầng đắt tiền nhất,” một quan chức của LG AI Research cho biết.
“Điều này giúp các công ty có nguồn lực tính toán hạn chế tiếp cận được trí tuệ nhân tạo tiên tiến hơn và giúp mở rộng hệ sinh thái AI của Hàn Quốc.”
Vượt xa khả năng ghi nhớ, quá trình huấn luyện của K-Exaone tập trung vào việc tăng cường khả năng suy luận và giải quyết vấn đề, viện nghiên cứu cho biết.
Trong giai đoạn tiền huấn luyện, mô hình được tiếp xúc với dữ liệu “quỹ đạo tư duy”, nhấn mạnh cách thức giải quyết vấn đề, chứ không chỉ là câu trả lời cuối cùng. Giai đoạn hậu huấn luyện kết hợp các thuật toán học tăng cường độc quyền, bao gồm Agapo, trích xuất tín hiệu học tập từ các câu trả lời sai, và GrouPER, tinh chỉnh đầu ra dựa trên sở thích của con người đối với ngôn ngữ tự nhiên, LG giải thích.
An toàn và tuân thủ cũng là những ưu tiên chính của mô hình. LG cho biết họ đã tiến hành đánh giá tuân thủ dữ liệu trên tất cả các tập dữ liệu huấn luyện, ngoại trừ các tài liệu có vấn đề về bản quyền.
Công ty vận hành một ủy ban đạo đức AI nội bộ đánh giá rủi ro trên bốn loại: giá trị nhân văn phổ quát, an toàn xã hội, các cân nhắc đặc thù của Hàn Quốc và rủi ro trong tương lai.
Theo tiêu chuẩn an toàn KGC-Safety, một tiêu chuẩn dành riêng cho Hàn Quốc do LG AI Research phát triển, K-Exaone đạt điểm trung bình 97,38 trên bốn hạng mục, vượt trội hơn mô hình GPT-OSS-120B của OpenAI (92,48) và mô hình Qwen-3-235B của Alibaba (66,16).