Tư vấn tiêu dùng
Apple: AI chưa đủ thông minh như mọi người vẫn nghĩ
Phan Khôi - Thứ Ba, 22/10/2024 10:39 CH
Vietnet24h - Bài kiểm tra GSM-Symbolic từ Apple đã cho thấy rằng các mô hình AI như GPT-4 dễ gặp sai sót khi gặp dữ liệu mới. Kết quả này làm dấy lên câu hỏi về khả năng suy luận của AI trong thực tế.
Mới đây, nghiên cứu của Apple đã chỉ ra rằng các mô hình ngôn ngữ lớn (LLM) phổ biến hiện nay không sở hữu khả năng suy luận như nhiều người lo ngại. Thay vì thực sự thông minh, các LLM từ những tên tuổi lớn như OpenAI, Google và Meta chỉ đơn thuần là những hệ thống "khớp mẫu tinh vi" mà không đạt được mức độ suy luận logic thực thụ.
 
Mặc dù các LLM như GPT-4 của OpenAI được ca ngợi có khả năng tương tác tự nhiên và lập luận, nhóm nghiên cứu của Apple đã phát hiện ra rằng chúng thực sự không thể hiện sự hiểu biết sâu sắc về nội dung mà chúng xử lý. Các mô hình này chỉ đơn giản là phản hồi dựa trên mẫu đã được học mà không có khả năng tư duy hay phân tích thực sự.
 
Theo báo cáo, GSM8K hiện là bài kiểm tra phổ biến nhất để đánh giá kỹ năng suy luận của LLM. Tuy nhiên, do sự phổ biến này, nó có thể "nhiễm" dữ liệu, dẫn đến tình huống mà các LLM biết trước đáp án nhờ vào việc huấn luyện từ những dữ liệu đó. Để khắc phục vấn đề này, nhóm nghiên cứu đã phát triển tiêu chuẩn mới mang tên GSM-Symbolic, điều chỉnh các biến số trong câu hỏi nhưng giữ nguyên bản chất vấn đề.
 
Thông qua thử nghiệm trên 20 mô hình LLM nổi bật như GPT-4, OpenAI o1, Google Gemma 2 và Meta Llama 3, Apple đã nhận thấy "sự mong manh đáng ngạc nhiên" trong hiệu suất của các mô hình này. Mỗi khi biến số trong bài toán được thay đổi, độ chính xác của mô hình giảm vài phần trăm. Dù OpenAI o1 Preview có kết quả tốt nhất, mức độ chính xác của nó vẫn giảm đến 17,5%, trong khi LLM Phi 3 của Microsoft chứng kiến mức giảm lên đến 65%.
Một ví dụ điển hình được nhóm nghiên cứu sử dụng để kiểm tra là bài toán về số quả kiwi. Các LLM đã xử lý thông tin bằng cách trừ đi số lượng quả kiwi nhỏ hơn mà không nhận ra rằng kích thước không liên quan đến phép toán cần giải quyết. Điều này cho thấy các mô hình đang chuyển đổi câu nói thành phép toán mà không thực sự hiểu rõ ý nghĩa của chúng.
 
Nghiên cứu của Apple đã chỉ ra rằng có một "điểm yếu nghiêm trọng" trong khả năng hiểu khái niệm toán học cũng như phân biệt thông tin liên quan trong việc giải quyết vấn đề của các LLM. Mặc dù các mô hình AI đã bắt đầu hình thành khả năng tự suy luận, nhưng mức độ đó vẫn ở mức thấp và thực tế có thể đang bị cường điệu hóa về nguy cơ mà AI gây ra.
 
Hiện tại, các công ty liên quan như OpenAI, Google và Meta chưa đưa ra phản hồi nào về kết quả nghiên cứu của Apple, nhưng những phát hiện này có thể dẫn đến những thay đổi trong cách các nhà phát triển đánh giá và cải thiện khả năng của các mô hình AI trong tương lai.
Samsung giảm, Apple tăng: Thị phần smartphone tương đối cân bằng Vietnet24h - Sự tăng trưởng của Apple cùng với sự sụt giảm nhẹ từ Samsung đã đưa cả hai ông lớn này ngang bằng nhau với 18% thị phần trong quý III/2024. Cuộc chiến thị trường vẫn chưa ngã ngũ khi các hãng đang chuẩn bị cho mùa mua sắm cuối năm.
Tin khác cùng chuyên mục
Tin đọc nhiều
Apple ra mắt iPhone 17e giá rẻ hơn và iPad Air mới trang bị chip M4 của hãng Vietnet24h - Sáng thứ Hai, Apple đã mở màn tuần lễ ra mắt sản phẩm mới với một chiếc iPhone giá rẻ được nâng cấp và một chiếc iPad Air nhanh hơn.
Galaxy S26 ra mắt với tư cách là điện thoại thông minh AI đa tác nhân Vietnet24h - Giá tăng tới 20% trong bối cảnh bùng nổ thị trường bộ nhớ; màn hình bảo mật được bổ sung.
Samsung ra mắt Galaxy S26, tăng giá bán trong nỗ lực thúc đẩy trí tuệ nhân tạo Vietnet24h - Đây là lần tăng giá đầu tiên sau ba năm khi Samsung tập trung mạnh vào trí tuệ nhân tạo chủ động và tính năng bảo mật tích hợp.
Sony hé lộ màu sắc mới cho tai nghe WH-1000XM6: Liệu màu hồng cát có phải là xu hướng tiếp theo? Vietnet24h - Những tuần gần đây, Sony đã có một lịch trình dày đặc, với việc ra mắt LinkBuds Clip vào tháng trước, một đoạn teaser cho sự ra mắt được mong đợi của tai nghe cao cấp và những đồn đoán đầu tiên về điện thoại thông minh Xperia 1 VIII và Xperia 10 VIII.
Samsung nhắm đến Roborock với robot hút bụi mới tích hợp trí tuệ nhân tạo Vietnet24h - Số liệu ngành cho thấy Roborock hiện đang thống trị thị trường robot hút bụi Hàn Quốc, nắm giữ hơn 50% thị phần.
Samsung muốn nói gì về "trí tuệ nhân tạo tác nhân" trong dòng Galaxy S26 sắp ra mắt? Vietnet24h - Tháng trước, Samsung Electronics đã ăn mừng lợi nhuận quý IV kỷ lục, phần lớn nhờ nhu cầu chip nhớ tăng mạnh, nhưng bức tranh lại không mấy khả quan đối với bộ phận điện thoại thông minh của hãng.
Apple 2026: Giai đoạn “đa chiều hoá sản phẩm” và củng cố hệ sinh thái Vietnet24h - Apple đang chuẩn bị cho một năm 2026 năng động với loạt sản phẩm mới, phản ánh định hướng chiến lược rõ rệt: đa dạng hoá danh mục thiết bị, cân bằng giữa dòng cao cấp và phổ thông, và củng cố trải nghiệm hệ sinh thái xuyên suốt.
Dyson thiết kế robot hút bụi phù hợp với thói quen lau nhà bằng khăn ướt của người Hàn Quốc Vietnet24h - Dyson đã gia nhập thị trường máy hút bụi robot đầy cạnh tranh của Hàn Quốc với một sản phẩm hứa hẹn sẽ chủ động loại bỏ vết bẩn và liên tục kiểm tra xem việc loại bỏ đã thành công hay chưa.
Samsung Galaxy S26 Plus sẽ sở hữu màn hình 6,66 inch Vietnet24h - Mẫu điện thoại sắp ra mắt của Samsung, Galaxy S26 Plus, thuộc dòng Galaxy S26 mới, sẽ sở hữu màn hình 6,66 inch, giống như Galaxy S25 Plus.
Dự án máy sấy quần áo thế hệ tiếp theo của Samsung sẽ nhận được sự hỗ trợ từ Bộ Năng lượng Hoa Kỳ (DOE) Vietnet24h - Dự án nghiên cứu máy sấy quần áo thế hệ tiếp theo của Samsung Electronics sẽ nhận được sự hỗ trợ từ Bộ Năng lượng Hoa Kỳ (DOE), công ty cho biết hôm thứ Năm.
Samsung tổ chức sự kiện ra mắt Galaxy S26 series tại Việt Nam Vietnet24h - Công ty Điện tử Samsung Việt Nam chính thức tổ chức sự kiện ra mắt thế hệ Galaxy S26 series mới tại Thiskyhall Sala (TP.HCM). Sự kiện thu hút sự tham gia của hơn 600 khách mời, bao gồm các đối tác, đại diện cơ quan báo chí – truyền thông, chuyên gia công nghệ và nhà sáng tạo nội dung.
OnePlus 15R – LỰA CHỌN HÀI HOÀ GIỮA MÀN HÌNH 165 HZ VÀ PIN LỚN Vietnet24h - Điểm nổi bật nhất của 15R là màn hình 165 Hz và viên pin dung lượng lớn, hai yếu tố tạo nên trải nghiệm hàng ngày vượt trội so với số đông smartphone cùng phân khúc.
iPhone Air sau 4 tháng: có đáng mua ở thời điểm này? Vietnet24h - Apple từng kỳ vọng iPhone Air — chiếc iPhone mỏng nhất và nhẹ nhất từ trước đến nay — sẽ mở ra một phân khúc mới giữa các mẫu iPhone truyền thống.
Indonesia tạm thời chặn truy cập vào Grok vì nội dung khiêu dâm Vietnet24h - Hôm thứ Bảy, Indonesia đã tạm thời chặn chatbot Grok của Elon Musk do lo ngại về nội dung khiêu dâm do trí tuệ nhân tạo tạo ra, trở thành quốc gia đầu tiên từ chối quyền truy cập vào công cụ AI này.
MacBook Pro 14-inch và chiến lược “ổn định hóa đỉnh cao” của Apple trong kỷ nguyên Apple Silicon Vietnet24h - MacBook Pro 14-inch không mang đến cuộc cách mạng về thiết kế. Tuy nhiên, chính sự “không đổi” này lại phản ánh một thông điệp rõ ràng: Apple đã đạt đến độ chín của nền tảng phần cứng.
Đánh giá iPhone Air: Thiết kế siêu mỏng có đáng để đánh đổi không? Vietnet24h - Apple lần đầu tiên trình làng iPhone Air với thiết kế siêu mỏng chỉ 5,6 mm — điểm nhấn lớn về mặt thẩm mỹ và cảm giác cầm. Tuy nhiên, mức độ mỏng này đi kèm với một số “hy sinh” đáng kể so với dòng Pro của hãng.
EVA Air cấm ký gửi tai nghe Bluetooth Vietnet24h - Theo hãng hàng không, các thiết bị điện tử như tai nghe Bluetooth phải được để trong hành lý xách tay.
Oppo Find X9 Pro: Siêu phẩm “điên rồ” nhất 2025, pin 7.500 mAh, camera 200 MP, giá gần 42 triệu đồng Vietnet24h - Siêu phẩm Trung Quốc này mang đến pin 7.500 mAh trong thân máy mỏng 8 mm, màn hình sáng 3.600 nits, camera tele 200 MP cùng hiệu năng “khủng” từ chip MediaTek Dimensity 9500.
Đánh giá iPad Pro 13 inch (M5): Siêu mạnh, siêu thừa, siêu đắt! Vietnet24h - Apple lại tiếp tục “đốt tiền” vào chip khủng cho thiết bị bị… kìm hãm bởi hệ điều hành. iPad Pro 13 inch (M5) chính là minh chứng rõ nhất.
Google Pixel Watch 4: Kẻ Thay Đổi Cuộc Chơi Trong Ngành Đồng Hồ Thông Minh Vietnet24h - Google Pixel Watch 4 đánh dấu bước đột phá, khắc phục các hạn chế của các phiên bản trước, mang đến trải nghiệm đồng hồ thông minh hoàn chỉnh.