Tiêu dùng thông minh
Apple: AI chưa đủ thông minh như mọi người vẫn nghĩ
Phan Khôi - Thứ Ba, 22/10/2024 10:39 CH
Vietnet24h - Bài kiểm tra GSM-Symbolic từ Apple đã cho thấy rằng các mô hình AI như GPT-4 dễ gặp sai sót khi gặp dữ liệu mới. Kết quả này làm dấy lên câu hỏi về khả năng suy luận của AI trong thực tế.
Mới đây, nghiên cứu của Apple đã chỉ ra rằng các mô hình ngôn ngữ lớn (LLM) phổ biến hiện nay không sở hữu khả năng suy luận như nhiều người lo ngại. Thay vì thực sự thông minh, các LLM từ những tên tuổi lớn như OpenAI, Google và Meta chỉ đơn thuần là những hệ thống "khớp mẫu tinh vi" mà không đạt được mức độ suy luận logic thực thụ.
 
Mặc dù các LLM như GPT-4 của OpenAI được ca ngợi có khả năng tương tác tự nhiên và lập luận, nhóm nghiên cứu của Apple đã phát hiện ra rằng chúng thực sự không thể hiện sự hiểu biết sâu sắc về nội dung mà chúng xử lý. Các mô hình này chỉ đơn giản là phản hồi dựa trên mẫu đã được học mà không có khả năng tư duy hay phân tích thực sự.
 
Theo báo cáo, GSM8K hiện là bài kiểm tra phổ biến nhất để đánh giá kỹ năng suy luận của LLM. Tuy nhiên, do sự phổ biến này, nó có thể "nhiễm" dữ liệu, dẫn đến tình huống mà các LLM biết trước đáp án nhờ vào việc huấn luyện từ những dữ liệu đó. Để khắc phục vấn đề này, nhóm nghiên cứu đã phát triển tiêu chuẩn mới mang tên GSM-Symbolic, điều chỉnh các biến số trong câu hỏi nhưng giữ nguyên bản chất vấn đề.
 
Thông qua thử nghiệm trên 20 mô hình LLM nổi bật như GPT-4, OpenAI o1, Google Gemma 2 và Meta Llama 3, Apple đã nhận thấy "sự mong manh đáng ngạc nhiên" trong hiệu suất của các mô hình này. Mỗi khi biến số trong bài toán được thay đổi, độ chính xác của mô hình giảm vài phần trăm. Dù OpenAI o1 Preview có kết quả tốt nhất, mức độ chính xác của nó vẫn giảm đến 17,5%, trong khi LLM Phi 3 của Microsoft chứng kiến mức giảm lên đến 65%.
Một ví dụ điển hình được nhóm nghiên cứu sử dụng để kiểm tra là bài toán về số quả kiwi. Các LLM đã xử lý thông tin bằng cách trừ đi số lượng quả kiwi nhỏ hơn mà không nhận ra rằng kích thước không liên quan đến phép toán cần giải quyết. Điều này cho thấy các mô hình đang chuyển đổi câu nói thành phép toán mà không thực sự hiểu rõ ý nghĩa của chúng.
 
Nghiên cứu của Apple đã chỉ ra rằng có một "điểm yếu nghiêm trọng" trong khả năng hiểu khái niệm toán học cũng như phân biệt thông tin liên quan trong việc giải quyết vấn đề của các LLM. Mặc dù các mô hình AI đã bắt đầu hình thành khả năng tự suy luận, nhưng mức độ đó vẫn ở mức thấp và thực tế có thể đang bị cường điệu hóa về nguy cơ mà AI gây ra.
 
Hiện tại, các công ty liên quan như OpenAI, Google và Meta chưa đưa ra phản hồi nào về kết quả nghiên cứu của Apple, nhưng những phát hiện này có thể dẫn đến những thay đổi trong cách các nhà phát triển đánh giá và cải thiện khả năng của các mô hình AI trong tương lai.
Samsung giảm, Apple tăng: Thị phần smartphone tương đối cân bằng Vietnet24h - Sự tăng trưởng của Apple cùng với sự sụt giảm nhẹ từ Samsung đã đưa cả hai ông lớn này ngang bằng nhau với 18% thị phần trong quý III/2024. Cuộc chiến thị trường vẫn chưa ngã ngũ khi các hãng đang chuẩn bị cho mùa mua sắm cuối năm.
Tin khác cùng chuyên mục
Tin đọc nhiều
Google đang triển khai các tính năng Gemini AI trên Gmail Vietnet24h - Google đang bổ sung các tính năng của Gemini AI vào Gmail, ứng dụng hiện có hơn 3 tỷ người dùng.
OpenAI ra mắt ChatGPT Health, công nghệ kết nối hồ sơ y tế người dùng và các ứng dụng chăm sóc sức khỏe. Vietnet24h - OpenAI đã công bố một trải nghiệm mới có tên ChatGPT Health, cho phép người dùng kết nối một cách an toàn hồ sơ y tế và các ứng dụng chăm sóc sức khỏe của họ với chatbot.
Samsung ra mắt dòng Galaxy Book 6 với các tính năng AI tiên tiến, thời lượng pin dài hơn. Vietnet24h - Dòng sản phẩm mới trang bị bộ vi xử lý Intel Core Ultra Series 3 mang đến thời gian phát video lên đến 30 giờ, cùng hiệu năng tản nhiệt được cải thiện.
Samsung ra mắt TV Micro RGB 130 inch đầu tiên trên thế giới Vietnet24h - Với hiệu suất hình ảnh vượt trội, TV Micro RGB 130 inch mới thiết lập tiêu chuẩn mới cho dòng màn hình siêu cao cấp
Biến tai nghe của bạn thành máy phiên dịch thời gian thực với công nghệ đột phá mới của Google. Vietnet24h - Google đang nâng tầm khả năng dịch thuật ngôn ngữ của mình với trải nghiệm beta đột phá cho phép người dùng trải nghiệm dịch thuật thời gian thực thông qua tai nghe.
LG Electronics sẽ ra mắt dòng máy tính xách tay LG Gram mới tích hợp công nghệ trí tuệ nhân tạo EXAONE tại CES. Vietnet24h - LG Electronics hôm thứ Năm cho biết họ sẽ ra mắt dòng máy tính xách tay LG Gram mới với mô hình trí tuệ nhân tạo tạo sinh EXAONE tại CES tuần tới.
Google đang triển khai một tính năng mới cho phép người dùng thay đổi địa chỉ Gmail của họ. Vietnet24h - Google đang âm thầm thử nghiệm một cách để thay đổi địa chỉ Gmail mà không làm mất dữ liệu.
Samsung tích hợp trí tuệ nhân tạo Gemini của Google vào tủ lạnh Bespoke. Vietnet24h - Gã khổng lồ công nghệ Hàn Quốc cho biết sẽ trưng bày mẫu tủ lạnh Bespoke AI mới tại sự kiện First Look trước thềm CES, khai mạc vào tháng Giêng tại Las Vegas.
Samsung sẽ ra mắt danh mục không gian sống kết nối AI mới tại CES 2026 Vietnet24h - Các sản phẩm nổi bật gồm tủ chăm sóc quần áo Bespoke AI AirDresser nâng cấp, máy giặt sấy Bespoke AI Laundry Combo, điều hòa WindFree và robot hút bụi Bespoke AI Jet Bot Steam Ultra
Quá mỏng để mua? Tại sao điện thoại siêu mỏng của Samsung và Apple lại không bán chạy? Vietnet24h - Nỗi lo về thời lượng pin, sự đánh đổi về giá cả và lợi ích không rõ ràng đã làm giảm nhu cầu đối với các thiết kế mỏng hơn.
MacBook Pro 14-inch và chiến lược “ổn định hóa đỉnh cao” của Apple trong kỷ nguyên Apple Silicon Vietnet24h - MacBook Pro 14-inch không mang đến cuộc cách mạng về thiết kế. Tuy nhiên, chính sự “không đổi” này lại phản ánh một thông điệp rõ ràng: Apple đã đạt đến độ chín của nền tảng phần cứng.
Đánh giá iPhone Air: Thiết kế siêu mỏng có đáng để đánh đổi không? Vietnet24h - Apple lần đầu tiên trình làng iPhone Air với thiết kế siêu mỏng chỉ 5,6 mm — điểm nhấn lớn về mặt thẩm mỹ và cảm giác cầm. Tuy nhiên, mức độ mỏng này đi kèm với một số “hy sinh” đáng kể so với dòng Pro của hãng.
EVA Air cấm ký gửi tai nghe Bluetooth Vietnet24h - Theo hãng hàng không, các thiết bị điện tử như tai nghe Bluetooth phải được để trong hành lý xách tay.
Oppo Find X9 Pro: Siêu phẩm “điên rồ” nhất 2025, pin 7.500 mAh, camera 200 MP, giá gần 42 triệu đồng Vietnet24h - Siêu phẩm Trung Quốc này mang đến pin 7.500 mAh trong thân máy mỏng 8 mm, màn hình sáng 3.600 nits, camera tele 200 MP cùng hiệu năng “khủng” từ chip MediaTek Dimensity 9500.
Đánh giá iPad Pro 13 inch (M5): Siêu mạnh, siêu thừa, siêu đắt! Vietnet24h - Apple lại tiếp tục “đốt tiền” vào chip khủng cho thiết bị bị… kìm hãm bởi hệ điều hành. iPad Pro 13 inch (M5) chính là minh chứng rõ nhất.
Google Pixel Watch 4: Kẻ Thay Đổi Cuộc Chơi Trong Ngành Đồng Hồ Thông Minh Vietnet24h - Google Pixel Watch 4 đánh dấu bước đột phá, khắc phục các hạn chế của các phiên bản trước, mang đến trải nghiệm đồng hồ thông minh hoàn chỉnh.
Apple Watch Series 11 Đối Đầu Series 10: Bước Tiến Nhỏ, Hiệu Quả Lớn Vietnet24h - Apple tiếp tục giữ đúng nhịp độ ra mắt thường niên với Apple Watch Series 11, đã trình làng vào tháng 9 vừa qua.
Samsung Galaxy S24 Plus Giảm Sốc 10 Triệu: Flagship Cao Cấp Giá Tầm Trung, Dùng Tốt Đến 2031! Vietnet24h - Hà Nội, ngày 3/10/2025 – Với mức giá giảm từ 27 triệu xuống chỉ còn 16 triệu đồng, Samsung Galaxy S24 Plus đang gây bão tại Việt Nam, trở thành “ngôi sao” flagship giá rẻ, ngang ngửa máy tầm trung nhưng hiệu năng và trải nghiệm vượt xa.
Phong trào toàn cầu bảo vệ trẻ em trực tuyến thúc đẩy làn sóng công nghệ an toàn AI Vietnet24h - Một phong trào toàn cầu nhằm bảo vệ trẻ em an toàn trực tuyến đang ngày càng phát triển, với các quy định mới nghiêm ngặt được đưa ra tại Vương quốc Anh và Hoa Kỳ.
Galaxy Watch8 series trở thành trợ thủ công nghệ mới của các tín đồ biohacking Vietnet24h - Biohacking hay ‘hack tuổi sinh học’ là việc biến dữ liệu sức khỏe cá nhân thành những thay đổi nhỏ mỗi ngày nhằm cải thiện thể chất và kéo dài tuổi thọ.