Tiêu dùng
Apple: AI chưa đủ thông minh như mọi người vẫn nghĩ
Phan Khôi - Thứ Ba, 22/10/2024 10:39 CH
Vietnet24h - Bài kiểm tra GSM-Symbolic từ Apple đã cho thấy rằng các mô hình AI như GPT-4 dễ gặp sai sót khi gặp dữ liệu mới. Kết quả này làm dấy lên câu hỏi về khả năng suy luận của AI trong thực tế.
Mới đây, nghiên cứu của Apple đã chỉ ra rằng các mô hình ngôn ngữ lớn (LLM) phổ biến hiện nay không sở hữu khả năng suy luận như nhiều người lo ngại. Thay vì thực sự thông minh, các LLM từ những tên tuổi lớn như OpenAI, Google và Meta chỉ đơn thuần là những hệ thống "khớp mẫu tinh vi" mà không đạt được mức độ suy luận logic thực thụ.
 
Mặc dù các LLM như GPT-4 của OpenAI được ca ngợi có khả năng tương tác tự nhiên và lập luận, nhóm nghiên cứu của Apple đã phát hiện ra rằng chúng thực sự không thể hiện sự hiểu biết sâu sắc về nội dung mà chúng xử lý. Các mô hình này chỉ đơn giản là phản hồi dựa trên mẫu đã được học mà không có khả năng tư duy hay phân tích thực sự.
 
Theo báo cáo, GSM8K hiện là bài kiểm tra phổ biến nhất để đánh giá kỹ năng suy luận của LLM. Tuy nhiên, do sự phổ biến này, nó có thể "nhiễm" dữ liệu, dẫn đến tình huống mà các LLM biết trước đáp án nhờ vào việc huấn luyện từ những dữ liệu đó. Để khắc phục vấn đề này, nhóm nghiên cứu đã phát triển tiêu chuẩn mới mang tên GSM-Symbolic, điều chỉnh các biến số trong câu hỏi nhưng giữ nguyên bản chất vấn đề.
 
Thông qua thử nghiệm trên 20 mô hình LLM nổi bật như GPT-4, OpenAI o1, Google Gemma 2 và Meta Llama 3, Apple đã nhận thấy "sự mong manh đáng ngạc nhiên" trong hiệu suất của các mô hình này. Mỗi khi biến số trong bài toán được thay đổi, độ chính xác của mô hình giảm vài phần trăm. Dù OpenAI o1 Preview có kết quả tốt nhất, mức độ chính xác của nó vẫn giảm đến 17,5%, trong khi LLM Phi 3 của Microsoft chứng kiến mức giảm lên đến 65%.
Một ví dụ điển hình được nhóm nghiên cứu sử dụng để kiểm tra là bài toán về số quả kiwi. Các LLM đã xử lý thông tin bằng cách trừ đi số lượng quả kiwi nhỏ hơn mà không nhận ra rằng kích thước không liên quan đến phép toán cần giải quyết. Điều này cho thấy các mô hình đang chuyển đổi câu nói thành phép toán mà không thực sự hiểu rõ ý nghĩa của chúng.
 
Nghiên cứu của Apple đã chỉ ra rằng có một "điểm yếu nghiêm trọng" trong khả năng hiểu khái niệm toán học cũng như phân biệt thông tin liên quan trong việc giải quyết vấn đề của các LLM. Mặc dù các mô hình AI đã bắt đầu hình thành khả năng tự suy luận, nhưng mức độ đó vẫn ở mức thấp và thực tế có thể đang bị cường điệu hóa về nguy cơ mà AI gây ra.
 
Hiện tại, các công ty liên quan như OpenAI, Google và Meta chưa đưa ra phản hồi nào về kết quả nghiên cứu của Apple, nhưng những phát hiện này có thể dẫn đến những thay đổi trong cách các nhà phát triển đánh giá và cải thiện khả năng của các mô hình AI trong tương lai.
Samsung giảm, Apple tăng: Thị phần smartphone tương đối cân bằng Vietnet24h - Sự tăng trưởng của Apple cùng với sự sụt giảm nhẹ từ Samsung đã đưa cả hai ông lớn này ngang bằng nhau với 18% thị phần trong quý III/2024. Cuộc chiến thị trường vẫn chưa ngã ngũ khi các hãng đang chuẩn bị cho mùa mua sắm cuối năm.
Tin khác cùng chuyên mục
Tin đọc nhiều
AI Đang Thay Đổi Cuộc Chơi Tìm Việc: Từ Sơ Yếu Lý Lịch Đến Ảnh Chân Dung Vietnet24h - Công nghệ trí tuệ nhân tạo (AI) đang làm thay đổi cách chúng ta tiếp cận thị trường lao động.
Microsoft mang “Copilot + Manus” lên Windows 11, đưa AI vào trung tâm trải nghiệm người dùng Vietnet24h - Microsoft vừa công bố một loạt tính năng AI mới dành cho Windows 11, trong đó nổi bật là việc thử nghiệm “Copilot Manus” — một bước tiến nhằm biến mọi máy tính Windows 11 thành trung tâm AI cá nhân.
Anthropic ra mắt Claude Haiku 4.5, một mô hình AI nhỏ hơn và rẻ hơn Vietnet24h - Anthropic đã công bố Claude Haiku 4.5, một mô hình trí tuệ nhân tạo nhỏ hơn, rẻ hơn và dành cho tất cả người dùng.
Đánh Giá iPhone 17: Lựa Chọn Hoàn Hảo Nhất Của Apple Năm 2025 Vietnet24h - Apple đã chính thức ra mắt dòng iPhone 17 vào ngày 19/9/2025, sau đợt đặt trước từ 12/9, mang đến một thiết bị cân bằng hoàn hảo giữa giá cả và hiệu năng.
Apple sắp mở rộng việc sử dụng modem 5G độc quyền cho dòng iPhone 18: Một sự thay đổi mang tính chiến lược Vietnet24h - Apple được biết đến là hãng sử dụng modem 5G C1X độc quyền của mình trên iPhone Air, trong khi vẫn sử dụng modem Qualcomm cho iPhone 17 và iPhone 17 Pro.
Amazon ra mắt máy bán thuốc theo toa tại các phòng khám One Medical ở Los Angeles Vietnet24h - Amazon đang triển khai các ki-ốt bán thuốc theo toa tại một số phòng khám One Medical ở khu vực Los Angeles.
Ứng dụng tạo video chỉ dành cho người được mời Sora của OpenAI đứng đầu App Store của Apple Vietnet24h - Ứng dụng Sora mới của OpenAI đã giành được vị trí hàng đầu trên App Store của Apple, vượt qua Google Gemini và ChatGPT của chính công ty khởi nghiệp này.
OpenAI’s Sora 2: Thách thức giới hạn an toàn và kiểm duyệt với những video chân thực đến kinh ngạc Vietnet24h - OpenAI, gã khổng lồ công nghệ đứng sau ChatGPT, vừa khuấy động làng công nghệ toàn cầu với ứng dụng video TikTok-style mới, được cung cấp bởi mô hình AI tiên tiến Sora 2. Với khả năng tạo ra những video dài hơn, chân thực hơn và sống động đến mức khó tin.
Amazon Ra Mắt Loạt Thiết Bị Echo Mới Tích Hợp Alexa+ Giá Chỉ Từ 99 USD Vietnet24h - Amazon chính thức giới thiệu dòng thiết bị loa thông minh và màn hình kích hoạt bằng giọng nói mới, được nâng cấp với trợ lý ảo Alexa+ tích hợp trí tuệ nhân tạo thế hệ mới (Generative AI).
iPhone 18 Sẵn Sàng Định Nghĩa Lại Kết Nối Vietnet24h - Apple Tăng Tốc: Dòng iPhone 18 Sẽ Sử Dụng Modem 5G Tự Phát Triển Trong Bước Chuyển Hướng Chiến Lược
Google Pixel Watch 4: Kẻ Thay Đổi Cuộc Chơi Trong Ngành Đồng Hồ Thông Minh Vietnet24h - Google Pixel Watch 4 đánh dấu bước đột phá, khắc phục các hạn chế của các phiên bản trước, mang đến trải nghiệm đồng hồ thông minh hoàn chỉnh.
Apple Watch Series 11 Đối Đầu Series 10: Bước Tiến Nhỏ, Hiệu Quả Lớn Vietnet24h - Apple tiếp tục giữ đúng nhịp độ ra mắt thường niên với Apple Watch Series 11, đã trình làng vào tháng 9 vừa qua.
Samsung Galaxy S24 Plus Giảm Sốc 10 Triệu: Flagship Cao Cấp Giá Tầm Trung, Dùng Tốt Đến 2031! Vietnet24h - Hà Nội, ngày 3/10/2025 – Với mức giá giảm từ 27 triệu xuống chỉ còn 16 triệu đồng, Samsung Galaxy S24 Plus đang gây bão tại Việt Nam, trở thành “ngôi sao” flagship giá rẻ, ngang ngửa máy tầm trung nhưng hiệu năng và trải nghiệm vượt xa.
Phong trào toàn cầu bảo vệ trẻ em trực tuyến thúc đẩy làn sóng công nghệ an toàn AI Vietnet24h - Một phong trào toàn cầu nhằm bảo vệ trẻ em an toàn trực tuyến đang ngày càng phát triển, với các quy định mới nghiêm ngặt được đưa ra tại Vương quốc Anh và Hoa Kỳ.
Galaxy Watch8 series trở thành trợ thủ công nghệ mới của các tín đồ biohacking Vietnet24h - Biohacking hay ‘hack tuổi sinh học’ là việc biến dữ liệu sức khỏe cá nhân thành những thay đổi nhỏ mỗi ngày nhằm cải thiện thể chất và kéo dài tuổi thọ.
Apple cân nhắc khôi phục dịch vụ sửa chữa iPad tại cửa hàng vào cuối năm Vietnet24h - Apple đang đẩy mạnh dịch vụ khách hàng bằng cách có thể thay đổi cách thức xử lý việc sửa chữa iPad tại Hoa Kỳ.
Galaxy S26 Pro tỏa sáng trong báo cáo về pin, trong khi S26 Edge gặp nhiều thách thức Vietnet24h - Tin đồn đang lan truyền rằng dòng Galaxy S26 sắp ra mắt có thể sẽ giới thiệu bốn mẫu máy ấn tượng, phá vỡ bộ ba truyền thống.
Chỉ vài phút sau động đất, thế giới đã biết liệu có sóng thần hay không Vietnet24h - Cảnh báo sớm sóng thần từng là điều xa xỉ, nhưng ngày nay các nhà khoa học chỉ mất vài phút để phát tín hiệu giúp hàng triệu người có cơ hội sống sót – nhờ hệ thống quan sát đáy biển, dữ liệu vệ tinh và AI.
Mua Motorola Razr+ (2025) tại Amazon ngay hôm nay với mức giá tốt thứ hai từ trước đến nay Vietnet24h - Motorola Razr+ (2025) đã trở thành tâm điểm chú ý trong thế giới điện thoại thông minh, và hiện tại, nó đang thu hút sự chú ý vì tất cả những lý do chính đáng.
Hơn 1.200 website giả mạo bị phát hiện mỗi ngày: Tội phạm mạng chuyển hướng tấn công người dùng cá nhân Vietnet24h - Số liệu từ các tổ chức giám sát an ninh mạng cho thấy, mỗi ngày có hàng nghìn tên miền giả mạo được đăng ký nhằm mục đích đánh cắp dữ liệu người dùng. Đáng chú ý, các website “nhái” thường sao chép hoàn toàn giao diện của ngân hàng, dịch vụ đặt phòng, trang mua sắm, khiến nạn nhân dễ dàng sập bẫy nếu không kiểm tra kỹ.