Hướng dẫn công nghệ
Rủi ro của việc giảm dần dữ liệu văn bản đối với AI
Mộc Đức - Thứ Hai, 10/06/2024 10:49 SA
Vietnet24h - Việc dữ liệu văn bản do con người tạo ra ngày càng trở nên khan hiếm có thể gây rủi ro lớn đối với khả năng phát triển của công nghệ AI. Thông tin này được thể hiện trong báo cáo mới từ Fortune, với sự lo lắng cao độ về thách thức 'Nút thắt cổ chai' đối với các gã khổng lồ công nghệ.
Trong bối cảnh cuộc đua công nghệ AI đang diễn ra sôi động, một thách thức mới đã xuất hiện trên chân trời: 'Nút thắt cổ chai' đang đặt ra những rủi ro không nhỏ cho các gã khổng lồ công nghệ như Google và Meta. Theo một báo cáo mới từ Fortune, dữ liệu văn bản do con người tạo ra đang dần trở nên khan hiếm, đe dọa đến khả năng phát triển của AI.
 
Nhóm nghiên cứu Epoch, trong báo cáo công bố ngày 6/6, cảnh báo rằng vào khoảng năm 2026-2032, các công ty có thể sẽ đối mặt với tình trạng hết dữ liệu để đào tạo AI. AI tạo sinh (GenAI) đang được coi là "cơn sốt vàng" mới, nhưng cuộc chạy đua khai thác dữ liệu có thể khiến nguồn tài nguyên này cạn kiệt nhanh chóng.
 
Trong ngắn hạn, các công ty như OpenAI và Google đang nỗ lực bảo vệ nguồn dữ liệu của mình, thậm chí không ngần ngại chi trả để tiếp cận dữ liệu chất lượng cao cho việc đào tạo AI. Hình ảnh CEO OpenAI Sam Altman và CEO Microsoft Satya Nadella tại một sự kiện của OpenAI vào tháng 6/2023 là minh chứng cho mối quan hệ hợp tác sâu rộng giữa các công ty hàng đầu trong lĩnh vực này.
 
Tamay Besiroglu, tác giả chính của nghiên cứu, nhấn mạnh rằng trong tương lai, sẽ không còn đủ nguồn dữ liệu mới từ các bài viết, blog, tin tức và bình luận trên mạng xã hội để duy trì đà tăng trưởng của AI. Ông cảnh báo rằng khi thông tin nhạy cảm hoặc riêng tư không thể sử dụng, "nút thắt cổ chai" sẽ ngày càng trở nên rõ ràng.
 
Besiroglu cũng đưa ra quan điểm: "Nếu chúng ta gặp hạn chế về lượng dữ liệu, việc mở rộng các mô hình AI sẽ trở nên bất khả thi." Các nghiên cứu chỉ ra rằng, dữ liệu chất lượng cao dưới dạng văn bản có thể sẽ không đủ để "nuôi" cỗ máy AI vào năm 2026, đặt ra một thách thức lớn cho các công ty như OpenAI, Google, Meta và Microsoft trong cuộc đua AI.
 
Tuy nhiên, không phải tất cả đều đồng tình với quan điểm về "nút thắt cổ chai" trong ngành AI. Nicolas Papernot, phó giáo sư về kỹ thuật máy tính tại Đại học Toronto, cho rằng: "Chúng ta không nhất thiết phải đào tạo các mô hình ngày càng lớn hơn. Có thể phát triển các hệ thống AI chuyên biệt cho từng nhiệm vụ cụ thể." Ông cũng bày tỏ lo ngại rằng việc đào tạo nhiều hệ thống AI trên cùng một kho dữ liệu có thể làm giảm hiệu suất mô hình, thậm chí dẫn đến "sụp đổ mô hình". Ông cảnh báo rằng việc đào tạo AI dựa trên dữ liệu do chính nó tạo ra có thể làm sâu thêm những sai lầm của trí tuệ nhân tạo, như phân biệt chủng tộc và sai lệch thông tin.
Selena Deckelmann, Giám đốc sản phẩm và công nghệ của Wikipedia, nhấn mạnh: "Con người đang tạo ra một dạng tài nguyên mới - dữ liệu. Tại Wikipedia, chúng tôi đặt ra hạn chế đối với cách các công ty sử dụng nội dung do con người biên soạn, nhằm bảo vệ nguồn dữ liệu và khuyến khích tình nguyện viên tiếp tục đóng góp nội dung chất lượng cao." Bà cũng chỉ ra rằng điều quan trọng là làm sao để nội dung do con người tạo ra không chỉ tồn tại mà còn được truy cập một cách công bằng.
 
Nhóm nghiên cứu Epoch cũng đưa ra quan điểm rằng việc các công ty trả tiền cho hàng triệu người tạo văn bản có thể không phải là giải pháp tiết kiệm chi phí. OpenAI đang tiếp cận vấn đề này theo một cách mới: CEO Sam Altman đã tuyên bố sử dụng dữ liệu tổng hợp để đào tạo AI tại một sự kiện của Liên Hợp Quốc. Dữ liệu tổng hợp bao gồm cả nội dung do con người và AI tạo ra, kể cả những nội dung kém chất lượng.
 
Altman không phủ nhận những thách thức liên quan đến việc này. Ông nhấn mạnh rằng các công ty như OpenAI cần phải cân nhắc việc giảm bớt sự phụ thuộc vào dữ liệu và tập trung vào việc cải thiện mô hình AI. "Sẽ có những điều bất ngờ xảy ra nếu chúng ta đào tạo mô hình AI dựa trên kho dữ liệu tổng hợp," Altman nói. "Chưa chắc chắn liệu sáng kiến này có mang lại hiệu quả tốt hay không."

Cuộc đua công nghệ AI đang đối mặt với một nút thắt cổ chai nghiêm trọng - sự khan hiếm dữ liệu văn bản do con người tạo ra. Điều này đặt ra thách thức lớn cho các công ty công nghệ, đặc biệt là các gã khổng lồ như Google và Meta, khi họ phụ thuộc vào dữ liệu chất lượng cao để phát triển AI. Để vượt qua nút thắt này, các công ty cần phải sáng tạo trong việc thu thập, xử lý và sử dụng dữ liệu. Điều này có thể bao gồm việc đầu tư vào công nghệ tổng hợp dữ liệu, hợp tác với các tổ chức phi lợi nhuận để thu thập dữ liệu cộng đồng, hoặc phát triển các giải pháp AI có khả năng học hiệu quả với lượng dữ liệu nhỏ hơn. Ngoài ra, cần phải chú trọng đến việc đảm bảo quyền riêng tư và bảo mật dữ liệu, đồng thời thúc đẩy sự phát triển của các tiêu chuẩn đạo đức trong lĩnh vực AI.
OPPO công bố cam kết giúp mọi người có thể sử dụng điện thoại AI, mang các tính năng AI sáng tạo đến khoảng 50 triệu người dùng vào năm 2024 Vietnet24h - Được thúc đẩy bởi niềm tin rằng điện thoại thông minh là thiết bị AI cá nhân quan trọng nhất, OPPO đang đưa AI tổng hợp vào tất cả các dòng sản phẩm điện thoại thông minh OPPO khi hãng cam kết mang điện thoại AI đến với mọi người.
Sự thật đằng sau AI: một cảnh báo từ những người trong cuộc Vietnet24h - Trong bối cảnh công nghệ AI đang phát triển với tốc độ chóng mặt, một nhóm gồm 13 chuyên gia và cựu chuyên gia đến từ OpenAI và Google DeepMind đã lên tiếng, bày tỏ quan ngại sâu sắc về việc các công ty hàng đầu trong lĩnh vực này đang giữ kín thông tin quan trọng liên quan đến những rủi ro tiềm ẩn của AI.
Tin khác cùng chuyên mục
Tin đọc nhiều
Google Maps nên lo lắng: Apple Maps giờ thông minh hơn và... nhớ cả bạn thích đi đâu! Vietnet24h - Apple vừa tung bản cập nhật iOS 26 khiến cộng đồng công nghệ xôn xao. Apple Maps không chỉ dẫn đường mà còn ghi nhớ thói quen di chuyển, gợi ý theo sở thích cá nhân và bảo mật tuyệt đối. Đây chính là điều mà Google Maps – với mọi dữ liệu khổng lồ – vẫn chưa thể làm được.
Apple và cuộc "đại tu hệ điều hành" tại WWDC 2025: Khi con số không chỉ là ký hiệu Vietnet24h - Tại WWDC 2025, Apple không đơn thuần giới thiệu các phiên bản phần mềm kế tiếp mà đang vẽ lại cả triết lý định danh sản phẩm và trải nghiệm người dùng. Việc chuyển từ iOS 19 sang iOS 26 không phải chỉ là đổi số, mà là tín hiệu của một chiến lược hợp nhất, đồng bộ và hướng tới tương lai của toàn hệ sinh thái Apple.
Sony FE PZ 16-35mm F4 G – Khi sự tinh gọn gặp sức mạnh quang học Vietnet24h - Trong thế giới nhiếp ảnh và quay phim hiện đại, nơi tính linh hoạt và hiệu suất thường phải đánh đổi lẫn nhau, Sony một lần nữa chứng minh họ có thể phá vỡ quy luật ấy bằng việc ra mắt ống kính zoom điện góc rộng FE PZ 16-35mm F4 G – một minh chứng cho hướng đi ngày càng rõ ràng của hãng: tối ưu trải nghiệm sáng tạo nội dung trên hệ máy mirrorless full-frame mà không thỏa hiệp về chất lượng.
Vì sao màn hình kép và AI khiến Yoga Book 9i trở nên khác biệt? Vietnet24h - Không phải là chiếc laptop đầu tiên có màn hình kép, nhưng Yoga Book 9i kết hợp công nghệ OLED, AI và thiết kế xoay gập linh hoạt theo cách mà rất ít sản phẩm trên thị trường có thể làm được. Đâu là điểm khiến nó trở thành công cụ mơ ước cho người làm sáng tạo?
Muốn dùng AI không cần mạng? Google đã có giải pháp mới cho bạn Vietnet24h - Không cần Wi-Fi, không cần 4G, bạn vẫn có thể tạo ảnh, viết code hay tóm tắt văn bản nhờ AI. Với AI Edge Gallery, Google mang trải nghiệm trí tuệ nhân tạo về ngay trong túi áo của bạn – gọn nhẹ, bảo mật và sẵn sàng mọi lúc.
Thiết kế siêu mỏng "đòi hỏi" đánh đổi – iPhone 17 Air và bài toán năng lượng Vietnet24h - Việc Apple chuẩn bị trình làng iPhone 17 Air với thiết kế siêu mỏng chỉ 5,5 mm, theo tiết lộ mới nhất từ tài khoản yeux1122 trên Naver, đang tạo ra nhiều kỳ vọng về mặt thẩm mỹ – nhưng cũng đồng thời đặt ra những dấu hỏi lớn về hiệu suất pin và trải nghiệm người dùng trong thực tế.
MediaTek ra mắt bộ xử lý AI cho Chromebook Plus Vietnet24h - MediaTek Inc., nhà thiết kế IC lớn nhất tại Đài Loan, đã giới thiệu bộ xử lý mới -- Kompanio Ultra -- vào thứ Hai, công ty mô tả đây là cột mốc mới nhất trong Chromebook hiệu suất cao, chạy bằng trí tuệ nhân tạo.
Chuẩn GPMI của Trung Quốc: ‘Một dây cáp cho mọi thiết bị’ Vietnet24h - GPMI được thiết kế để tối giản hóa kết nối số bằng cách gộp cả dữ liệu và điện năng vào một sợi cáp duy nhất. Nếu được phổ biến, đây có thể là bước ngoặt định hình lại hệ sinh thái điện tử trong tương lai.
Rò rỉ cách Apple sẽ làm cho màn hình bên trong của iPhone gập trở nên quen thuộc với người dùng iPad Vietnet24h - Chiếc điện thoại có thể gập đầu tiên của Apple dự kiến ​​sẽ được sản xuất hàng loạt vào cuối năm sau và có thể ra mắt vào quý 4 năm 2026 hoặc quý 1 năm 2027.
Alibaba cung cấp miễn phí mô hình tạo video AI trên toàn cầu Vietnet24h - Gã khổng lồ Trung Quốc cho biết họ đang mở mã nguồn bốn mô hình thuộc dòng Wan2.1, phiên bản mới nhất của mô hình AI nền tảng của công ty, có khả năng tạo hình ảnh và video từ dữ liệu đầu vào là văn bản và hình ảnh.
IBM công bố bộ xử lý lượng tử mới, kế hoạch cho siêu máy tính Starling vào năm 2029 Vietnet24h - Ngày 10/6, IBM đã công bố lộ trình chi tiết để phát triển một máy tính lượng tử có khả năng chịu lỗi quy mô lớn mang tên Quantum Starling.
AMD tiết lộ chip AI thế hệ tiếp theo với CEO của OpenAI Sam Altman Vietnet24h -Hôm thứ Năm, AMD đã tiết lộ thông tin chi tiết mới về chip AI thế hệ tiếp theo, dòng Instinct MI400, sẽ được xuất xưởng vào năm sau. Tổng giám đốc điều hành Lisa Su đã tiết lộ những con chip này tại sự kiện ra mắt ở San Jose, California.
CEO của Nvidia cho biết điện toán lượng tử đang đạt đến 'điểm uốn' Vietnet24h - “Điện toán lượng tử đang đạt đến điểm uốn”, CEO của Nvidia, Jensen Huang cho biết trong bài phát biểu quan trọng của mình tại hội nghị dành cho nhà phát triển GTC Paris của hãng sản xuất chip này.
Samsung Display giới thiệu sự đổi mới của OLEDoS tại Triển lãm AWE USA 2025 Vietnet24h - Samsung Display đang giới thiệu công nghệ OLED trên Silicon (OLEDoS) mới nhất của mình tại Triển lãm Thế giới Tăng cường (AWE USA 2025) ở Long Beach, California, đánh dấu lần đầu tiên công nghệ này xuất hiện tại triển lãm lớn nhất thế giới tập trung vào thực tế mở rộng (XR).
Từ iOS 26 đến "Liquid Glass": Apple giới thiệu hệ điều hành đột phá tại WWDC 2025 Vietnet24h - Tại WWDC 2025, Apple đã ra mắt iOS 26, mở đầu cho một kỷ nguyên mới trong hệ sinh thái thiết bị của hãng. Với giao diện "Liquid Glass" được thiết kế lại từ nền tảng, Apple không chỉ cải thiện tính năng mà còn đem đến một diện mạo mới cho tất cả các hệ điều hành của mình, hứa hẹn sẽ mang lại trải nghiệm người dùng hoàn toàn khác biệt so với trước đây.
Khai trương trung tâm Nghiên cứu và phát triển AI Việt Nam của Qualcomm Vietnet24h - Ngày 10/6, tại Hà Nội, Qualcomm đã ra mắt Trung tâm nghiên cứu và phát triển (R&D) về trí tuệ nhân tạo (AI) tại Việt Nam.
Huang của Nvidia cho biết lập trình AI hiện nay giống như đào tạo một người Vietnet24h - Huang cho biết: “Cách bạn lập trình máy tính ngày nay, yêu cầu máy tính làm điều gì đó cho bạn, thậm chí là viết chương trình, tạo hình ảnh, viết thơ — chỉ cần yêu cầu nó một cách nhẹ nhàng”.
Samsung Electronics hé lộ điện thoại thông minh có thể gập lại mới trước sự kiện ra mắt vào tháng 7 Vietnet24h - Samsung dự kiến ​​sẽ ra mắt các mẫu mới nhất trong dòng sản phẩm có thể gập lại của mình -- Galaxy Z Fold 7 và Galaxy Z Flip 7 -- tại sự kiện Galaxy Unpacked vào mùa hè, dự kiến ​​diễn ra vào tháng 7 tại New York.
Dữ liệu mới cho thấy chip Nvidia đạt được tiến bộ trong việc đào tạo các hệ thống AI lớn nhất Vietnet24h - Trong kết quả nhanh nhất cho chip mới của Nvidia, 2.496 chip Blackwell đã hoàn thành bài kiểm tra đào tạo trong 27 phút.
iPhone 17: Khi Apple buộc phải lắng nghe người dùng Vietnet24h - Từ màn hình lớn hơn đến tốc độ làm mới 120Hz, dòng iPhone 17 cho thấy Apple đang phá bỏ ranh giới giữa tiêu chuẩn và cao cấp. Đặc biệt, phiên bản iPhone 17 Air có thể là quân bài chiến lược để đối đầu trực tiếp với Samsung trong cuộc đua thiết kế mỏng nhẹ.
Otto Aviation trình làng máy bay không cửa sổ Phantom 3500, bay thử từ 2027 Vietnet24h - Mẫu máy bay Phantom 3500 do Otto Aviation phát triển đang gây chú ý với thiết kế không cửa sổ nhằm tăng hiệu suất khí động học. Công ty dự kiến sẽ cho cất cánh thử nghiệm vào cuối năm 2027, mở ra chương mới cho hàng không thương mại cận âm.
LG Innotek ra mắt mô-đun xe truyền thông vệ tinh 5G đầu tiên trên thế giới Vietnet24h - Mô-đun mới nhất hỗ trợ 5G NR-NTN, một mạng truyền thông di động hoạt động trên các vệ tinh quỹ đạo Trái đất thấp, cho phép truyền dữ liệu khối lượng lớn theo thời gian thực.
Công nghệ như phim viễn tưởng: Đeo kính áp tròng, nhắm mắt vẫn thấy rõ! Vietnet24h - Ngỡ chỉ có trong phim Marvel, nhưng loại kính áp tròng siêu nhỏ gọn vừa ra đời tại Trung Quốc lại có thể giúp người dùng nhìn thấy trong đêm tối mà không cần mở mắt. Chuyện thật như đùa, nhưng khoa học đã chứng minh điều đó là khả thi.
Google, Samsung sẽ ra mắt kính thông minh XR trong năm nay Vietnet24h - Samsung bước lên vị trí dẫn đầu về phần cứng trong sự trở lại của kính thông minh Google, mở rộng vai trò trong hệ sinh thái XR đang phát triển
Neuralink: cấy chip não, biên tập video và đăng YouTube bằng suy nghĩ Vietnet24h - Trong một bước đột phá ấn tượng, Bradford Smith, người mắc bệnh ALS, đã chứng minh khả năng tuyệt vời của công nghệ giao diện não-máy tính (BCI) khi có thể biên tập video và đăng tải lên YouTube chỉ bằng suy nghĩ, mà không cần sự trợ giúp từ bất kỳ thiết bị hay người khác. Đây không chỉ là sự tiến bộ trong lĩnh vực công nghệ mà còn mang lại hy vọng mới cho những người khuyết tật vận động.
LG Display công bố màn hình OLED màu xanh huỳnh quang thương mại đầu tiên trên thế giới Vietnet24h - LG Display đã xác minh thành công hiệu suất sản xuất của tấm nền điốt phát quang hữu cơ phát quang màu xanh lam (OLED) cho dây chuyền sản xuất hàng loạt lần đầu tiên trên thế giới, công ty cho biết hôm thứ Năm (1/5).
Người Trung Quốc chuẩn bị bay như Iron Man! Vietnet24h - Một thiết bị bay cá nhân vừa được trình diễn tại Hàng Châu khiến nhiều người liên tưởng đến các bộ phim siêu anh hùng. Nhưng lần này, không phải Hollywood mà chính các nhà khoa học Trung Quốc mới là người hiện thực hóa giấc mơ bay cá nhân.
Công nghệ cấy ghép não được FDA chấp thuận cho Precision Neuroscience Vietnet24h - Precision Neuroscience thông báo rằng một thành phần cốt lõi của hệ thống cấy ghép não đã được Cục Quản lý Thực phẩm và Dược phẩm Hoa Kỳ chấp thuận.
Từ ghi hình kép đến UX sáng tạo: iPhone 17 Pro có thể mở ra chương mới trong thiết kế trải nghiệm Vietnet24h - Không chỉ là tính năng mới, ghi hình kép trên iPhone 17 Pro là phép thử đầu tiên cho cách Apple xây dựng trải nghiệm người dùng kiểu mới – nơi cảm xúc, phản ứng và câu chuyện của người quay trở thành trung tâm của mọi khung hình.
Kim loại lỏng: Apple đang thử nghiệm cho iPhone gập, bền hơn titan 2,5 lần Vietnet24h - Công nghệ bản lề kim loại lỏng có thể giúp iPhone gập không chỉ bền hơn mà còn có thiết kế sang trọng hơn. Liệu đây có phải là bước tiến lớn trong công nghệ smartphone gập?