Tiêu dùng thông minh
Câu chuyện từ chương trình Singer 2024: AI gặp lỗi khi làm bài toán đơn giản
Phan Khôi - Thứ Sáu, 19/07/2024 7:00 CH
Vietnet24h - Trong bối cảnh AI đang dần trở thành công cụ hữu ích giúp con người xử lý nhiều công việc phức tạp, một tình huống bất ngờ xảy ra khi các mô hình trí tuệ nhân tạo gặp khó khăn với một bài toán đơn giản: so sánh 9,9 và 9,11.
Theo SCMP, câu chuyện bắt đầu từ chương trình truyền hình thực tế Singer 2024 do Đài truyền hình Hồ Nam sản xuất và phát sóng cuối tuần trước ở Trung Quốc. Trong chương trình, thí sinh Sun Nan nhận được 13,8% lượt bình chọn trực tuyến, vượt qua thí sinh người Mỹ Chanté Moore với 13,11% phiếu bầu. Tuy nhiên, điều này đã gây ra một làn sóng chỉ trích trên mạng xã hội khi nhiều người cho rằng "11 phải lớn hơn 8", ý nói thí sinh Moore biểu diễn tốt hơn nhưng lại thua.
 
Sự việc trở nên thú vị hơn khi một số người dùng thử hỏi các mô hình AI phổ biến về vấn đề này và nhận được kết quả bất ngờ. Hai chatbot phổ biến tại Trung Quốc là Kimi của Moonshot AI và Baixiaoying của Baichuan đều trả lời sai rằng 9,11 lớn hơn 9,9. Điều này đã dẫn đến một loạt phàn nàn từ người dùng, buộc các nhà phát triển phải sửa thuật toán và đưa ra lời xin lỗi.
 
Nguyên nhân của sai sót này được giải thích là do phương pháp "chuỗi suy nghĩ" mà các AI sử dụng. Cụ thể, khi tách số sau dấu phẩy, AI so sánh 11 với 9 và kết luận rằng 11 lớn hơn, dẫn đến khẳng định sai lầm rằng 9,11 lớn hơn 9,9. Một số mô hình AI như Qwen LLM của Alibaba phải sử dụng Python Code Interpreter để tính toán câu trả lời, trong khi Ernie Bot của Baidu phải thực hiện một quá trình diễn giải phức tạp mới đưa ra đáp án đúng.
 
Trái ngược, một số AI khác lại trả lời chính xác khá nhanh. Doubao LLM của ByteDance đưa ra ví dụ dễ hiểu: "Nếu bạn có 9,90 đô la Mỹ và 9,11 đô la Mỹ, rõ ràng 9,90 nhiều hơn".
 
Tại Việt Nam, người dùng cũng thử nghiệm với các mô hình AI phổ biến và nhận được kết quả tương tự. ChatGPT chạy GPT-3.5 và GPT4-o đều phản hồi sai rằng 9,9 bé hơn. Các mô hình khác như Claude 3.5, Sonnet và Mistral AI cũng trả lời không chính xác, trong khi Gemini của Google đưa ra đáp án đúng.
Theo Wu Yiquan, nhà nghiên cứu khoa học máy tính tại Đại học Chiết Giang, việc AI không giỏi toán rất phổ biến do các mô hình ngôn ngữ lớn (LLM) không sở hữu khả năng toán học thực sự. Chúng dự đoán câu trả lời dựa trên dữ liệu đào tạo mà không hiểu sâu về toán học. "Một số LLM hoạt động tốt trong bài kiểm tra toán có thể là do 'nhiễm dữ liệu', nghĩa là thuật toán đã ghi nhớ câu trả lời vì các câu hỏi tương tự đã có trong dữ liệu đào tạo của nó", Yiquan giải thích.
 
Trước đó, trên mạng xã hội X, nhà nghiên cứu Bill Yuchen Lin của Allen Institute và kỹ sư Riley Goodside của Scale AI cũng đã nêu ra những thiếu sót cơ bản về toán học của LLM. Cả hai cho rằng người dùng không nên tin tưởng hoàn toàn vào các mô hình AI, bởi chúng nhiều lần bị phát hiện trả lời sai hoặc gặp tình trạng "ảo giác", tức là bịa ra câu trả lời sao cho nghe có vẻ thuyết phục nhất.
Trí tuệ nhân tạo thúc đẩy làn sóng đầu tư mạo hiểm tại Mỹ Vietnet24h - Lĩnh vực trí tuệ nhân tạo đang làm nên cơn sốt đầu tư tại Mỹ, khi dòng vốn mạo hiểm đổ vào công nghệ này đạt mức cao nhất trong hai năm qua. Sự phục hồi ấn tượng này không chỉ phản ánh niềm tin của các nhà đầu tư mà còn mở ra triển vọng tăng trưởng đầy hứa hẹn cho ngành công nghiệp AI.
Tin khác cùng chuyên mục
Tin đọc nhiều
Apple phát hành bản xem trước mới của AI, bao gồm tích hợp ChatGPT Vietnet24h - Hôm thứ Tư, Apple đã phát hành phiên bản beta của một loạt tính năng Apple Intelligence, bao gồm cả tính năng tích hợp ChatGPT được mong đợi từ lâu.
Microsoft cải thiện Windows Update: thời gian cài đặt giảm tới 45% Vietnet24h - Windows 11 24H2 được tinh chỉnh để tối ưu hóa hiệu suất hệ thống, với quy trình cập nhật nhanh và ít tiêu tốn tài nguyên hơn, ngay cả trên các thiết bị cũ kỹ.
SKT ra mắt phiên bản PC của dịch vụ AI cung cấp quyền truy cập vào nhiều mô hình ngôn ngữ lớn (LLM) Vietnet24h - Phiên bản PC cho phép người dùng so sánh các LLM khác nhau mà không cần quá trình sao chép và dán, đồng thời cung cấp khả năng chuyển đổi giữa các mô hình liền mạch để phản ánh bối cảnh của các cuộc đối thoại với mô hình trước đó khi tiếp tục các cuộc trò chuyện với một mô hình khác.
Oura ra mắt nhẫn thông minh mới với thiết kế được cập nhật và cảm biến mới với giá 349 đô la Vietnet24h - Theo thông cáo báo chí, chiếc nhẫn thông minh mới có công nghệ cảm biến chính xác hơn, thiết kế đẹp hơn và thời lượng pin lên đến tám ngày.
Tương lai bền vững: Smartphone sạc pin từ ánh sáng mặt trời Vietnet24h - Một nhóm nghiên cứu tại UNIST đã phát triển thành công pin mặt trời trong suốt có khả năng sạc smartphone chỉ bằng ánh sáng mặt trời. Phát minh này không chỉ nâng cao hiệu suất của các thiết bị điện tử mà còn mở ra kỷ nguyên mới cho năng lượng tái tạo trong cuộc sống hằng ngày.
Huawei dự kiến phát hành Mate XT gập ba quốc tế trong quý i/2025 Vietnet24h - Huawei chuẩn bị ra mắt dòng điện thoại gập ba Mate XT trên thị trường quốc tế, sau khi gây chú ý tại Trung Quốc.
Galaxy Watch thể hiện mức độ tương quan mạnh mẽ với các thiết bị khoa học lâm sàng và thể thao Vietnet24h - Theo các nghiên cứu của Đại học Michigan, các tính năng theo dõi thể chất của Galaxy Watch đã được đánh giá toàn diện thông qua bài kiểm định với nhóm vận động viên chạy bộ hàng đầu để xác thực mức độ chính xác.
Samsung ra mắt tại Việt Nam máy giặt sấy Samsung Bespoke AI Heatpump tích hợp sấy bơm nhiệt Vietnet24h - Máy giặt sấy Samsung Bespoke AI Heatpump tích hợp công nghệ sấy bơm nhiệt tiên tiến bảo vệ sợi vải tối ưu, giặt sấy siêu tốc chỉ 98 phút cùng nhiều tính năng AI giúp nâng tầm trải nghiệm người dùng.
Huawei chuẩn bị ra mắt smartphone gập ba đầu tiên trên thế giới mang tên Mate XT Vietnet24h - Ngày 10/9 tới, Huawei sẽ chính thức ra mắt mẫu smartphone gập ba đầu tiên trên thế giới với tên gọi Mate XT, đánh dấu một bước tiến đột phá trong thiết kế điện thoại thông minh. Thông tin này được công bố thông qua một video ngắn trên mạng xã hội Weibo, làm dậy sóng cộng đồng công nghệ ngay trước thời điểm Apple giới thiệu iPhone 16.
Coway thống trị thị trường máy lọc nước với công nghệ filter Vietnet24h - Nhà sản xuất thiết bị gia dụng Hàn Quốc Coway ghi nhận vị thế dẫn đầu trong ba thập kỷ trên thị trường máy lọc nước Hàn Quốc là nhờ công nghệ filter tiên tiến của mình.
Giới chức Mỹ kiện TikTok vì lo ngại thanh thiếu niên bị ảnh hưởng bởi nghiện mạng xã hội Vietnet24h - TikTok, nền tảng video nổi tiếng, đã trở thành mục tiêu của các vụ kiện từ 13 bang ở Mỹ, với cáo buộc gây nghiện cho thanh thiếu niên và làm tổn hại đến sức khỏe tâm thần của họ thông qua những thuật toán được thiết kế để tăng thời gian sử dụng.
Cách sử dụng ChatGPT vừa ra mắt chế độ giọng nói nâng cao cho trò chuyện âm thanh của OpenAI Vietnet24h - Mặc dù công cụ này phản hồi nhanh và có thể nói bằng nhiều giọng khác nhau, nhưng bạn có thể gặp phải giới hạn về tốc độ nếu sử dụng nhiều lần trong một ngày.
Đánh giá sơ bộ về iPhone 16 mới ra lò của Apple Vietnet24h - iPhone 16 Pro Max có thời lượng pin tốt hơn và camera tuyệt vời, nhưng Apple Intelligence vẫn chưa xuất hiện
Apple Watch Series 10 chỉ có những nâng cấp nhỏ, nhưng điểm cộng lớn là sạc nhanh hơn Vietnet24h - Apple Watch là một phần của bộ phận Thiết bị đeo, Gia đình và Phụ kiện của công ty, đã báo cáo doanh thu 8,1 tỷ đô la trong quý tài chính thứ ba, giảm 2% so với một năm trước.
Apple phát hành iOS 18 cho iPhone, nhưng không bao gồm Apple Intelligence Vietnet24h - Đây là bản cập nhật iPhone lớn nhất trong năm của Apple, nhưng bản cập nhật này không bao gồm Apple Intelligence, hệ thống AI sắp ra mắt của công ty.
Lý do nhiều người không ưa chuộng smartphone màn hình gập Vietnet24h - Đã nhiều năm trôi qua kể từ khi smartphone màn hình gập lần đầu tiên xuất hiện, nhưng doanh số của thiết bị đầy sáng tạo này vẫn chưa thể cạnh tranh với smartphone thông thường. Dù các thương hiệu liên tục thúc đẩy sản phẩm ra thị trường, nhiều người vẫn tỏ ra không mặn mà với dòng sản phẩm này. Vậy điều gì khiến smartphone màn hình gập chưa thể đạt được thành công mong đợi? Hãy cùng khám phá.
Liệu trẻ em có nên dùng Apple Watch? Vietnet24h - Apple vừa tung ra một trang web tiếp thị mới, quảng cáo Apple Watch như một cách để các bậc cha mẹ giữ liên lạc với con cái của họ.
Đánh giá sơ bộ về máy tính bảng Surface Pro của Microsoft Vietnet24h - Phiên bản thứ 11 của máy tính bảng chuyển đổi Surface Pro của Microsoft dựa trên chip Qualcomm tiêu thụ năng lượng, dẫn đến thời lượng pin hơn 8 giờ trong các thử nghiệm ban đầu.
Cảnh báo: mạng lưới lừa đảo với chiêu thức giả mạo ứng dụng bảo hiểm xã hội số Vietnet24h - Trong bối cảnh không gian mạng ngày càng trở nên phức tạp, Cục An toàn thông tin, thuộc Bộ Thông tin và Truyền thông, đã phát đi một thông báo khẩn cấp về những chiêu trò lừa đảo mới mẻ, đặc biệt là các vụ việc giả mạo ứng dụng VssID - Bảo hiểm xã hội số.
Cổng tiếp nhận phản ánh lạm dụng tên miền: Hỗ trợ người dùng bảo vệ quyền lợi Vietnet24h - Cổng tiếp nhận phản ánh lạm dụng tên miền hỗ trợ người dùng bảo vệ quyền lợi và chống lại hành vi vi phạm.