Công nghệ
Câu chuyện từ chương trình Singer 2024: AI gặp lỗi khi làm bài toán đơn giản
Phan Khôi - Thứ Sáu, 19/07/2024 7:00 CH
Vietnet24h - Trong bối cảnh AI đang dần trở thành công cụ hữu ích giúp con người xử lý nhiều công việc phức tạp, một tình huống bất ngờ xảy ra khi các mô hình trí tuệ nhân tạo gặp khó khăn với một bài toán đơn giản: so sánh 9,9 và 9,11.
Theo SCMP, câu chuyện bắt đầu từ chương trình truyền hình thực tế Singer 2024 do Đài truyền hình Hồ Nam sản xuất và phát sóng cuối tuần trước ở Trung Quốc. Trong chương trình, thí sinh Sun Nan nhận được 13,8% lượt bình chọn trực tuyến, vượt qua thí sinh người Mỹ Chanté Moore với 13,11% phiếu bầu. Tuy nhiên, điều này đã gây ra một làn sóng chỉ trích trên mạng xã hội khi nhiều người cho rằng "11 phải lớn hơn 8", ý nói thí sinh Moore biểu diễn tốt hơn nhưng lại thua.
 
Sự việc trở nên thú vị hơn khi một số người dùng thử hỏi các mô hình AI phổ biến về vấn đề này và nhận được kết quả bất ngờ. Hai chatbot phổ biến tại Trung Quốc là Kimi của Moonshot AI và Baixiaoying của Baichuan đều trả lời sai rằng 9,11 lớn hơn 9,9. Điều này đã dẫn đến một loạt phàn nàn từ người dùng, buộc các nhà phát triển phải sửa thuật toán và đưa ra lời xin lỗi.
 
Nguyên nhân của sai sót này được giải thích là do phương pháp "chuỗi suy nghĩ" mà các AI sử dụng. Cụ thể, khi tách số sau dấu phẩy, AI so sánh 11 với 9 và kết luận rằng 11 lớn hơn, dẫn đến khẳng định sai lầm rằng 9,11 lớn hơn 9,9. Một số mô hình AI như Qwen LLM của Alibaba phải sử dụng Python Code Interpreter để tính toán câu trả lời, trong khi Ernie Bot của Baidu phải thực hiện một quá trình diễn giải phức tạp mới đưa ra đáp án đúng.
 
Trái ngược, một số AI khác lại trả lời chính xác khá nhanh. Doubao LLM của ByteDance đưa ra ví dụ dễ hiểu: "Nếu bạn có 9,90 đô la Mỹ và 9,11 đô la Mỹ, rõ ràng 9,90 nhiều hơn".
 
Tại Việt Nam, người dùng cũng thử nghiệm với các mô hình AI phổ biến và nhận được kết quả tương tự. ChatGPT chạy GPT-3.5 và GPT4-o đều phản hồi sai rằng 9,9 bé hơn. Các mô hình khác như Claude 3.5, Sonnet và Mistral AI cũng trả lời không chính xác, trong khi Gemini của Google đưa ra đáp án đúng.
Theo Wu Yiquan, nhà nghiên cứu khoa học máy tính tại Đại học Chiết Giang, việc AI không giỏi toán rất phổ biến do các mô hình ngôn ngữ lớn (LLM) không sở hữu khả năng toán học thực sự. Chúng dự đoán câu trả lời dựa trên dữ liệu đào tạo mà không hiểu sâu về toán học. "Một số LLM hoạt động tốt trong bài kiểm tra toán có thể là do 'nhiễm dữ liệu', nghĩa là thuật toán đã ghi nhớ câu trả lời vì các câu hỏi tương tự đã có trong dữ liệu đào tạo của nó", Yiquan giải thích.
 
Trước đó, trên mạng xã hội X, nhà nghiên cứu Bill Yuchen Lin của Allen Institute và kỹ sư Riley Goodside của Scale AI cũng đã nêu ra những thiếu sót cơ bản về toán học của LLM. Cả hai cho rằng người dùng không nên tin tưởng hoàn toàn vào các mô hình AI, bởi chúng nhiều lần bị phát hiện trả lời sai hoặc gặp tình trạng "ảo giác", tức là bịa ra câu trả lời sao cho nghe có vẻ thuyết phục nhất.
Trí tuệ nhân tạo thúc đẩy làn sóng đầu tư mạo hiểm tại Mỹ Vietnet24h - Lĩnh vực trí tuệ nhân tạo đang làm nên cơn sốt đầu tư tại Mỹ, khi dòng vốn mạo hiểm đổ vào công nghệ này đạt mức cao nhất trong hai năm qua. Sự phục hồi ấn tượng này không chỉ phản ánh niềm tin của các nhà đầu tư mà còn mở ra triển vọng tăng trưởng đầy hứa hẹn cho ngành công nghiệp AI.
Tin khác cùng chuyên mục
Tin đọc nhiều
LG CNS giới thiệu nền tảng nhà máy tích hợp trí tuệ nhân tạo tại triển lãm ở Mỹ Vietnet24h - LG CNS hôm thứ Tư cho biết họ đã giới thiệu các giải pháp nhà máy thông minh dựa trên trí tuệ nhân tạo (AI) tại Triển lãm Công nghệ IoT 2026 ở San Jose, khi công ty đẩy mạnh việc thâm nhập thị trường sản xuất Bắc Mỹ.
Samsung đang nghiên cứu thiết kế TriFold rộng hơn trong hồ sơ bằng sáng chế Vietnet24h - Theo một hồ sơ bằng sáng chế được công bố hôm thứ Tư, Samsung Electronics đã nghiên cứu một phiên bản rộng hơn của chiếc Galaxy Z TriFold.
Hiểu thể nào là đúng về Start Up? Vietnet24h - Không ít người vẫn hiểu sai rằng startup đơn giản chỉ là một công ty mới thành lập hoặc doanh nghiệp nhỏ.
DeepSeek V4 chạy trên chip Huawei: Bước tiến lớn của Trung Quốc trong cuộc đua AI và bán dẫn Vietnet24h - Cuộc cạnh tranh công nghệ toàn cầu đang chứng kiến một bước ngoặt đáng chú ý khi mô hình AI thế hệ mới DeepSeek V4 của Trung Quốc được cho là sẽ vận hành trên chip do Huawei phát triển.
Doanh nghiệp điện tử – bán dẫn cần chuẩn bị gì để đạt Giấy chứng nhận doanh nghiệp khoa học và công nghệ? Vietnet24h - Trong bối cảnh Việt Nam đẩy mạnh chiến lược phát triển công nghiệp công nghệ cao, bán dẫn và AI, Giấy chứng nhận doanh nghiệp khoa học và công nghệ (DN KH&CN) đang trở thành một “tấm vé chiến lược” giúp doanh nghiệp điện tử – bán dẫn bước lên nấc thang cao hơn trong chuỗi giá trị.
Camera sau của Galaxy S26 sẽ có thông số kỹ thuật tương tự như S25. Vietnet24h - Samsung đang lên kế hoạch trang bị camera sau có thông số kỹ thuật tương tự cho mẫu Galaxy S26 tiêu chuẩn ra mắt năm sau với tên gọi Galaxy S25.
Phần mềm mới của Nvidia có thể giúp theo dõi xem các chip AI của hãng được sử dụng đến đâu. Vietnet24h - Dịch vụ tùy chọn mới của Nvidia sẽ cung cấp dữ liệu định vị địa lý, giúp xác định quốc gia mà các GPU cụ thể đang hoạt động.
Digital Twin – “Bản sao số” đang cách mạng hóa công nghiệp và đời sống Việt Nam Vietnet24h - Trong kỷ nguyên Công nghiệp 4.0 và Chuyển đổi số quốc gia, khái niệm Digital Twin (Bản sao số) đang nổi lên như một “vũ khí bí mật” giúp doanh nghiệp tối ưu vận hành, giảm chi phí và dự đoán tương lai với độ chính xác chưa từng có.
SAMSUNG GALAXY Z FLIP 7 “ĐỐI ĐẦU” IPHONE 17 PRO: “SIÊU PHẨM” NÀO XỨNG ĐÁNG 1.099 USD NHẤT NĂM 2025? Vietnet24h - Điện thoại gập không còn là “hàng thử nghiệm” nữa! Chúng đang “chiến đấu sòng phẳng” với các flagship truyền thống.
Meta Connect 2025: Kính thông minh tích hợp AI chiếm vị trí trung tâm Vietnet24h - Meta đã chi hàng tỷ đô la để cố gắng đưa thực tế ảo (VR) trở thành xu hướng với người tiêu dùng. Khi chuyển hướng chiến lược metaverse sang kính thông minh, các nhà đầu tư sẽ theo dõi phản ứng của công chúng.
Marvell tiếp tục nâng dự báo doanh thu nhờ nhu cầu tăng cao đối với trung tâm dữ liệu AI Vietnet24h - Doanh thu quý đạt mức kỷ lục nhờ nhu cầu ngày càng tăng đối với chip kết nối.
STMicroelectronics nhắm đến lĩnh vực sản xuất chip lượng tử với công nghệ FD-SOI Vietnet24h - STMicroelectronics đã tuyên bố ý định tham gia vào lĩnh vực sản xuất chip lượng tử bằng công nghệ xử lý silicon-on-insulator (FD-SOI) 300mm của mình.
Computex 2026: Nvidia và Đài Loan trở thành trung tâm của cuộc đua hạ tầng AI toàn cầu Vietnet24h - Triển lãm công nghệ Computex 2026 tại Đài Bắc được dự báo sẽ tiếp tục là tâm điểm của ngành công nghệ thế giới khi Nvidia cùng hệ sinh thái công nghệ Đài Loan bước vào vị trí trung tâm của cuộc đua xây dựng hạ tầng AI toàn cầu.
Samsung bắt đầu cung cấp các mẫu HBM4E 12 lớp đầu tiên trên thế giới Vietnet24h - Samsung dẫn đầu cuộc đua HBM4E trong khi đối thủ SK hynix chuẩn bị cung cấp mẫu thử cho khách hàng.
Huawei tuyên bố chip Kirin mới vượt qua vòng siết công nghệ Mỹ, mở ra bước ngoặt mới cho bán dẫn Trung Quốc Vietnet24h - Huawei Technologies đang phát đi thông điệp mạnh mẽ nhất kể từ khi bị Mỹ đưa vào danh sách hạn chế công nghệ năm 2019: Trung Quốc có thể tìm ra con đường riêng để phát triển chip tiên tiến mà không phụ thuộc hoàn toàn vào công nghệ phương Tây.
Tập đoàn LG có triển vọng thị trường tươi sáng cho mảng kinh doanh robot Vietnet24h - Các công ty thuộc tập đoàn LG đang hưởng lợi từ triển vọng thị trường khả quan khi kỳ vọng về kế hoạch kinh doanh robot của họ tiếp tục đẩy giá cổ phiếu lên cao.
DeepSeek giảm giá mạnh mô hình AI chủ lực, cuộc chiến AI Trung Quốc bước vào giai đoạn “siêu cạnh tranh” Vietnet24h - Cuộc đua AI tại Trung Quốc đang bước vào giai đoạn khốc liệt chưa từng có khi DeepSeek — startup AI đang nổi lên mạnh mẽ tại Trung Quốc — quyết định giảm vĩnh viễn tới 75% giá sử dụng mô hình ngôn ngữ lớn V4 Pro, động thái được xem là cú sốc mới đối với toàn ngành AI toàn cầu.
Khủng hoảng chip nhớ siết chặt ngành xe điện Trung Quốc, tham vọng AI mobility đối mặt phép thử lớn Vietnet24h - Sau nhiều năm tăng trưởng bùng nổ và vượt lên dẫn đầu thế giới về xe điện, ngành ô tô Trung Quốc đang đối mặt một thách thức mới mang tính chiến lược: thiếu hụt chip nhớ phục vụ các hệ thống AI trên xe thông minh.
Washington bật đèn xanh cho chip H200 của Nvidia vào Trung Quốc Vietnet24h - NVIDIA vừa giành được bước đột phá quan trọng tại thị trường Trung Quốc khi chính quyền Mỹ cho phép bán chip AI H200 cho 10 doanh nghiệp Trung Quốc.
NVIDIA và tham vọng kiểm soát toàn bộ hệ sinh thái AI toàn cầu Vietnet24h - NVIDIA đang tái định nghĩa vai trò của một công ty chip AI toàn cầu: không chỉ bán GPU, mà trở thành “kiến trúc sư tài chính” của toàn bộ hệ sinh thái AI.
Robot AI vật lý do Hàn Quốc sản xuất được ứng dụng trong chăm sóc tim mạch Vietnet24h - Trung tâm Y tế Asan sử dụng robot hỗ trợ can thiệp mạch vành qua da để điều trị bệnh nhân.
Cuộc đua robot hình người: “bàn tay” mới là chiến trường quyết định, không phải trí tuệ Vietnet24h - Thế giới đang bị cuốn vào cuộc cạnh tranh phát triển robot hình người với trọng tâm là AI và năng lực xử lý.
Mô hình AI dự đoán hương vị kim chi và mức độ lên men Vietnet24h - Viện nghiên cứu kim chi hàng đầu của Hàn Quốc đã phát triển một mô hình trí tuệ nhân tạo (AI) mới có thể dự đoán hương vị của kim chi dựa trên các điều kiện lên men, bao gồm nhiệt độ và vi khuẩn hiện diện.
Samsung Display giới thiệu các khái niệm AI và OLED thế hệ tiếp theo Vietnet24h - Samsung Display đã giới thiệu các sản phẩm concept cho các thiết bị trí tuệ nhân tạo (AI) thế hệ tiếp theo sử dụng công nghệ OLED tại một sự kiện truyền thông hôm thứ Hai (giờ địa phương) trước thềm CES 2026.
Từ “robot trình diễn” đến nền tảng mở: Unitree và bước ngoặt mới của ngành robot tiêu dùng Vietnet24h - Việc Unitree Robotics công bố nền tảng cho phép người dùng điều khiển robot thông qua smartphone không đơn thuần là một cải tiến giao diện người dùng.
Tàu vũ trụ thương mại đầu tiên của Hàn Quốc dự kiến ​​phóng vào ngày 22 tháng 11 tại Brazil Vietnet24h - HANBIT-Nano, tên lửa đẩy thương mại đầu tiên của Hàn Quốc do Innospace phát triển, sẽ được phóng vào lúc 3 giờ chiều ngày 22 tháng 11 tại Brazil (giờ địa phương), công ty cho biết hôm thứ Sáu (7/11).
Tương Lai Robot Hình Người: Từ “CMO” Đến Người Bạn Đồng Hành Của Nhân Loại Vietnet24h - Boston, ngày 3/10/2025 – Trong một động thái gây chấn động, robot hình người Uri – từng là Unitree G1 – vừa được bổ nhiệm làm Giám đốc Marketing (CMO) cho Series, nền tảng mạng xã hội cạnh tranh trực tiếp với LinkedIn.
PCIM Asia Shanghai 2025: Cuộc Cách Mạng Công Nghệ Điện Tử Công Suất – Phỏng Vấn Độc Quyền Với CEO EPC Về Tương Lai GaN Và AI Vietnet24h - Phóng viên Vietnet24h đã có cơ hội phỏng vấn độc quyền ông Alexander Lidow, Tiến sĩ khoa học, Tổng Giám đốc điều hành EPC (Efficient Power Conversion) – một trong những nhà tiên phong về công nghệ Gallium Nitride (GaN).
Triển Lãm Robot Tại Thượng Hải 2025: Đa Robot, Đa Nhiệm Vụ Và Tương Lai Việc Làm Tự Động Hóa Vietnet24h - Thượng Hải, Trung Quốc, ngày 27/9/2025 – Trong khuôn khổ China International Industry Fair (CIIF) 2025, Triển lãm Robot (Robot Show) đang diễn ra sôi nổi từ ngày 23 đến 27/9 tại Trung tâm Triển lãm và Hội nghị Quốc gia (National Exhibition and Convention Center, địa chỉ: 333 Songze Avenue, Quận Thanh Phổ, Thượng Hải).
Mark Zuckerberg ra mắt kính Meta Ray-Ban Display giá 799 đô la Vietnet24h - Hôm thứ Tư, Mark Zuckerberg đã ra mắt chiếc kính Meta Ray-Ban Display trị giá 799 đô la, chiếc kính thông minh đầu tiên của công ty truyền thông xã hội này dành cho người tiêu dùng với màn hình tích hợp.