Tiêu dùng
Câu chuyện từ chương trình Singer 2024: AI gặp lỗi khi làm bài toán đơn giản
Phan Khôi - Thứ Sáu, 19/07/2024 7:00 CH
Vietnet24h - Trong bối cảnh AI đang dần trở thành công cụ hữu ích giúp con người xử lý nhiều công việc phức tạp, một tình huống bất ngờ xảy ra khi các mô hình trí tuệ nhân tạo gặp khó khăn với một bài toán đơn giản: so sánh 9,9 và 9,11.
Theo SCMP, câu chuyện bắt đầu từ chương trình truyền hình thực tế Singer 2024 do Đài truyền hình Hồ Nam sản xuất và phát sóng cuối tuần trước ở Trung Quốc. Trong chương trình, thí sinh Sun Nan nhận được 13,8% lượt bình chọn trực tuyến, vượt qua thí sinh người Mỹ Chanté Moore với 13,11% phiếu bầu. Tuy nhiên, điều này đã gây ra một làn sóng chỉ trích trên mạng xã hội khi nhiều người cho rằng "11 phải lớn hơn 8", ý nói thí sinh Moore biểu diễn tốt hơn nhưng lại thua.
 
Sự việc trở nên thú vị hơn khi một số người dùng thử hỏi các mô hình AI phổ biến về vấn đề này và nhận được kết quả bất ngờ. Hai chatbot phổ biến tại Trung Quốc là Kimi của Moonshot AI và Baixiaoying của Baichuan đều trả lời sai rằng 9,11 lớn hơn 9,9. Điều này đã dẫn đến một loạt phàn nàn từ người dùng, buộc các nhà phát triển phải sửa thuật toán và đưa ra lời xin lỗi.
 
Nguyên nhân của sai sót này được giải thích là do phương pháp "chuỗi suy nghĩ" mà các AI sử dụng. Cụ thể, khi tách số sau dấu phẩy, AI so sánh 11 với 9 và kết luận rằng 11 lớn hơn, dẫn đến khẳng định sai lầm rằng 9,11 lớn hơn 9,9. Một số mô hình AI như Qwen LLM của Alibaba phải sử dụng Python Code Interpreter để tính toán câu trả lời, trong khi Ernie Bot của Baidu phải thực hiện một quá trình diễn giải phức tạp mới đưa ra đáp án đúng.
 
Trái ngược, một số AI khác lại trả lời chính xác khá nhanh. Doubao LLM của ByteDance đưa ra ví dụ dễ hiểu: "Nếu bạn có 9,90 đô la Mỹ và 9,11 đô la Mỹ, rõ ràng 9,90 nhiều hơn".
 
Tại Việt Nam, người dùng cũng thử nghiệm với các mô hình AI phổ biến và nhận được kết quả tương tự. ChatGPT chạy GPT-3.5 và GPT4-o đều phản hồi sai rằng 9,9 bé hơn. Các mô hình khác như Claude 3.5, Sonnet và Mistral AI cũng trả lời không chính xác, trong khi Gemini của Google đưa ra đáp án đúng.
Theo Wu Yiquan, nhà nghiên cứu khoa học máy tính tại Đại học Chiết Giang, việc AI không giỏi toán rất phổ biến do các mô hình ngôn ngữ lớn (LLM) không sở hữu khả năng toán học thực sự. Chúng dự đoán câu trả lời dựa trên dữ liệu đào tạo mà không hiểu sâu về toán học. "Một số LLM hoạt động tốt trong bài kiểm tra toán có thể là do 'nhiễm dữ liệu', nghĩa là thuật toán đã ghi nhớ câu trả lời vì các câu hỏi tương tự đã có trong dữ liệu đào tạo của nó", Yiquan giải thích.
 
Trước đó, trên mạng xã hội X, nhà nghiên cứu Bill Yuchen Lin của Allen Institute và kỹ sư Riley Goodside của Scale AI cũng đã nêu ra những thiếu sót cơ bản về toán học của LLM. Cả hai cho rằng người dùng không nên tin tưởng hoàn toàn vào các mô hình AI, bởi chúng nhiều lần bị phát hiện trả lời sai hoặc gặp tình trạng "ảo giác", tức là bịa ra câu trả lời sao cho nghe có vẻ thuyết phục nhất.
Trí tuệ nhân tạo thúc đẩy làn sóng đầu tư mạo hiểm tại Mỹ Vietnet24h - Lĩnh vực trí tuệ nhân tạo đang làm nên cơn sốt đầu tư tại Mỹ, khi dòng vốn mạo hiểm đổ vào công nghệ này đạt mức cao nhất trong hai năm qua. Sự phục hồi ấn tượng này không chỉ phản ánh niềm tin của các nhà đầu tư mà còn mở ra triển vọng tăng trưởng đầy hứa hẹn cho ngành công nghiệp AI.
Tin khác cùng chuyên mục
Tin đọc nhiều
Chuyển đổi liền mạch giữa các thiết bị hiện có thể thực hiện được với Windows 11 Vietnet24h - Microsoft tiếp tục nỗ lực nâng cao khả năng tương thích của Android với Windows 11 bằng cách giới thiệu các bản cập nhật thú vị nhằm tạo điều kiện tương tác mượt mà hơn giữa hai nền tảng.
Samsung Galaxy Tab A11+ ra mắt: Hiệu năng vượt trội, trải nghiệm giải trí đỉnh cao Vietnet24h - Galaxy Tab A11+ sở hữu thiết kế thanh lịch, là người bạn đồng hành đáng tin cậy cho mọi nhu cầu đa dạng trong cuộc sống từ chơi game, làm việc đa nhiệm và hơn thế nữa.
Kính AI của Alibaba cạnh tranh với Meta được bán với giá 500 đô la Vietnet24h - Alibaba cho biết kính AI Quark của họ có hai phiên bản - S1, có giá khởi điểm là 3.799 nhân dân tệ Trung Quốc (536 đô la) và G1 có giá 1.899 nhân dân tệ.
Gemini cách mạng hóa Android Auto: Giới thiệu trợ lý AI thông minh hơn, đàm thoại tốt hơn cho việc lái xe rảnh tay hiệu quả Vietnet24h - Gemini, một AI đàm thoại mới, được thiết lập để nâng cao trải nghiệm Android Auto bằng cách cải thiện khả năng ra lệnh bằng giọng nói.
Đánh giá Grok 4.1 – Phiên bản mới nhất từ xAI Vietnet24h - Grok 4.1 là bản cập nhật lớn cho Grok 4 (ra mắt hồi tháng 7/2025), được xAI (công ty của Elon Musk) công bố chính thức vào ngày 17/11/2025.
Công ty khởi nghiệp AI Hyprnote tìm cách định nghĩa lại việc ghi chú trong doanh nghiệp Vietnet24h - Hyprnote, một công ty khởi nghiệp có trụ sở tại Seoul do CEO Jung Ji-heon và Giám đốc Công nghệ Lee Yoo-jong sáng lập, đang tìm cách cung cấp một lựa chọn cho các công ty ghi chú và quản lý thông tin một cách an toàn.
Google “lột xác” Fitbit: Giao diện Material 3 siêu biểu cảm, AI Coach chính thức ra mắt người dùng Premium Vietnet24h - Thiết kế lại này kết hợp phong cách Material 3 Expressive (M3E) của Google vào ứng dụng Android, cùng với một số điều chỉnh điều hướng.
LG Uplus ra mắt trợ lý cuộc gọi ixi-O AI được hỗ trợ bởi Google Vietnet24h - LG Uplus, một trong ba công ty viễn thông lớn của Hàn Quốc, đã ra mắt ixi-O, trợ lý cuộc gọi AI thời gian thực được nâng cấp, được hỗ trợ bởi mô hình ngôn ngữ lớn mới nhất của Google Cloud, vào thứ Năm (13/11).
Màn hình gập tiếp theo của Samsung: Ba cách Vietnet24h - Ra mắt tại hội nghị thượng đỉnh APEC ở Gyeongju, điện thoại gập ba của Samsung báo hiệu chương tiếp theo trong đổi mới màn hình gập.
Cách mạng hóa hành trình rèn luyện sức khỏe của bạn với Huấn luyện viên sức khỏe cá nhân tiên tiến được hỗ trợ bởi AI của Fitbit Vietnet24h - Fitbit ra mắt bản xem trước công khai của Huấn luyện viên Sức khỏe Cá nhân chạy bằng Gemini.
Đánh giá iPhone Air: Thiết kế siêu mỏng có đáng để đánh đổi không? Vietnet24h - Apple lần đầu tiên trình làng iPhone Air với thiết kế siêu mỏng chỉ 5,6 mm — điểm nhấn lớn về mặt thẩm mỹ và cảm giác cầm. Tuy nhiên, mức độ mỏng này đi kèm với một số “hy sinh” đáng kể so với dòng Pro của hãng.
EVA Air cấm ký gửi tai nghe Bluetooth Vietnet24h - Theo hãng hàng không, các thiết bị điện tử như tai nghe Bluetooth phải được để trong hành lý xách tay.
Oppo Find X9 Pro: Siêu phẩm “điên rồ” nhất 2025, pin 7.500 mAh, camera 200 MP, giá gần 42 triệu đồng Vietnet24h - Siêu phẩm Trung Quốc này mang đến pin 7.500 mAh trong thân máy mỏng 8 mm, màn hình sáng 3.600 nits, camera tele 200 MP cùng hiệu năng “khủng” từ chip MediaTek Dimensity 9500.
Đánh giá iPad Pro 13 inch (M5): Siêu mạnh, siêu thừa, siêu đắt! Vietnet24h - Apple lại tiếp tục “đốt tiền” vào chip khủng cho thiết bị bị… kìm hãm bởi hệ điều hành. iPad Pro 13 inch (M5) chính là minh chứng rõ nhất.
Google Pixel Watch 4: Kẻ Thay Đổi Cuộc Chơi Trong Ngành Đồng Hồ Thông Minh Vietnet24h - Google Pixel Watch 4 đánh dấu bước đột phá, khắc phục các hạn chế của các phiên bản trước, mang đến trải nghiệm đồng hồ thông minh hoàn chỉnh.
Apple Watch Series 11 Đối Đầu Series 10: Bước Tiến Nhỏ, Hiệu Quả Lớn Vietnet24h - Apple tiếp tục giữ đúng nhịp độ ra mắt thường niên với Apple Watch Series 11, đã trình làng vào tháng 9 vừa qua.
Samsung Galaxy S24 Plus Giảm Sốc 10 Triệu: Flagship Cao Cấp Giá Tầm Trung, Dùng Tốt Đến 2031! Vietnet24h - Hà Nội, ngày 3/10/2025 – Với mức giá giảm từ 27 triệu xuống chỉ còn 16 triệu đồng, Samsung Galaxy S24 Plus đang gây bão tại Việt Nam, trở thành “ngôi sao” flagship giá rẻ, ngang ngửa máy tầm trung nhưng hiệu năng và trải nghiệm vượt xa.
Phong trào toàn cầu bảo vệ trẻ em trực tuyến thúc đẩy làn sóng công nghệ an toàn AI Vietnet24h - Một phong trào toàn cầu nhằm bảo vệ trẻ em an toàn trực tuyến đang ngày càng phát triển, với các quy định mới nghiêm ngặt được đưa ra tại Vương quốc Anh và Hoa Kỳ.
Galaxy Watch8 series trở thành trợ thủ công nghệ mới của các tín đồ biohacking Vietnet24h - Biohacking hay ‘hack tuổi sinh học’ là việc biến dữ liệu sức khỏe cá nhân thành những thay đổi nhỏ mỗi ngày nhằm cải thiện thể chất và kéo dài tuổi thọ.
Apple cân nhắc khôi phục dịch vụ sửa chữa iPad tại cửa hàng vào cuối năm Vietnet24h - Apple đang đẩy mạnh dịch vụ khách hàng bằng cách có thể thay đổi cách thức xử lý việc sửa chữa iPad tại Hoa Kỳ.