Tầm nhìn
Rủi ro của việc giảm dần dữ liệu văn bản đối với AI
Mộc Đức - Thứ Hai, 10/06/2024 10:49 SA
Vietnet24h - Việc dữ liệu văn bản do con người tạo ra ngày càng trở nên khan hiếm có thể gây rủi ro lớn đối với khả năng phát triển của công nghệ AI. Thông tin này được thể hiện trong báo cáo mới từ Fortune, với sự lo lắng cao độ về thách thức 'Nút thắt cổ chai' đối với các gã khổng lồ công nghệ.
Trong bối cảnh cuộc đua công nghệ AI đang diễn ra sôi động, một thách thức mới đã xuất hiện trên chân trời: 'Nút thắt cổ chai' đang đặt ra những rủi ro không nhỏ cho các gã khổng lồ công nghệ như Google và Meta. Theo một báo cáo mới từ Fortune, dữ liệu văn bản do con người tạo ra đang dần trở nên khan hiếm, đe dọa đến khả năng phát triển của AI.
 
Nhóm nghiên cứu Epoch, trong báo cáo công bố ngày 6/6, cảnh báo rằng vào khoảng năm 2026-2032, các công ty có thể sẽ đối mặt với tình trạng hết dữ liệu để đào tạo AI. AI tạo sinh (GenAI) đang được coi là "cơn sốt vàng" mới, nhưng cuộc chạy đua khai thác dữ liệu có thể khiến nguồn tài nguyên này cạn kiệt nhanh chóng.
 
Trong ngắn hạn, các công ty như OpenAI và Google đang nỗ lực bảo vệ nguồn dữ liệu của mình, thậm chí không ngần ngại chi trả để tiếp cận dữ liệu chất lượng cao cho việc đào tạo AI. Hình ảnh CEO OpenAI Sam Altman và CEO Microsoft Satya Nadella tại một sự kiện của OpenAI vào tháng 6/2023 là minh chứng cho mối quan hệ hợp tác sâu rộng giữa các công ty hàng đầu trong lĩnh vực này.
 
Tamay Besiroglu, tác giả chính của nghiên cứu, nhấn mạnh rằng trong tương lai, sẽ không còn đủ nguồn dữ liệu mới từ các bài viết, blog, tin tức và bình luận trên mạng xã hội để duy trì đà tăng trưởng của AI. Ông cảnh báo rằng khi thông tin nhạy cảm hoặc riêng tư không thể sử dụng, "nút thắt cổ chai" sẽ ngày càng trở nên rõ ràng.
 
Besiroglu cũng đưa ra quan điểm: "Nếu chúng ta gặp hạn chế về lượng dữ liệu, việc mở rộng các mô hình AI sẽ trở nên bất khả thi." Các nghiên cứu chỉ ra rằng, dữ liệu chất lượng cao dưới dạng văn bản có thể sẽ không đủ để "nuôi" cỗ máy AI vào năm 2026, đặt ra một thách thức lớn cho các công ty như OpenAI, Google, Meta và Microsoft trong cuộc đua AI.
 
Tuy nhiên, không phải tất cả đều đồng tình với quan điểm về "nút thắt cổ chai" trong ngành AI. Nicolas Papernot, phó giáo sư về kỹ thuật máy tính tại Đại học Toronto, cho rằng: "Chúng ta không nhất thiết phải đào tạo các mô hình ngày càng lớn hơn. Có thể phát triển các hệ thống AI chuyên biệt cho từng nhiệm vụ cụ thể." Ông cũng bày tỏ lo ngại rằng việc đào tạo nhiều hệ thống AI trên cùng một kho dữ liệu có thể làm giảm hiệu suất mô hình, thậm chí dẫn đến "sụp đổ mô hình". Ông cảnh báo rằng việc đào tạo AI dựa trên dữ liệu do chính nó tạo ra có thể làm sâu thêm những sai lầm của trí tuệ nhân tạo, như phân biệt chủng tộc và sai lệch thông tin.
Selena Deckelmann, Giám đốc sản phẩm và công nghệ của Wikipedia, nhấn mạnh: "Con người đang tạo ra một dạng tài nguyên mới - dữ liệu. Tại Wikipedia, chúng tôi đặt ra hạn chế đối với cách các công ty sử dụng nội dung do con người biên soạn, nhằm bảo vệ nguồn dữ liệu và khuyến khích tình nguyện viên tiếp tục đóng góp nội dung chất lượng cao." Bà cũng chỉ ra rằng điều quan trọng là làm sao để nội dung do con người tạo ra không chỉ tồn tại mà còn được truy cập một cách công bằng.
 
Nhóm nghiên cứu Epoch cũng đưa ra quan điểm rằng việc các công ty trả tiền cho hàng triệu người tạo văn bản có thể không phải là giải pháp tiết kiệm chi phí. OpenAI đang tiếp cận vấn đề này theo một cách mới: CEO Sam Altman đã tuyên bố sử dụng dữ liệu tổng hợp để đào tạo AI tại một sự kiện của Liên Hợp Quốc. Dữ liệu tổng hợp bao gồm cả nội dung do con người và AI tạo ra, kể cả những nội dung kém chất lượng.
 
Altman không phủ nhận những thách thức liên quan đến việc này. Ông nhấn mạnh rằng các công ty như OpenAI cần phải cân nhắc việc giảm bớt sự phụ thuộc vào dữ liệu và tập trung vào việc cải thiện mô hình AI. "Sẽ có những điều bất ngờ xảy ra nếu chúng ta đào tạo mô hình AI dựa trên kho dữ liệu tổng hợp," Altman nói. "Chưa chắc chắn liệu sáng kiến này có mang lại hiệu quả tốt hay không."

Cuộc đua công nghệ AI đang đối mặt với một nút thắt cổ chai nghiêm trọng - sự khan hiếm dữ liệu văn bản do con người tạo ra. Điều này đặt ra thách thức lớn cho các công ty công nghệ, đặc biệt là các gã khổng lồ như Google và Meta, khi họ phụ thuộc vào dữ liệu chất lượng cao để phát triển AI. Để vượt qua nút thắt này, các công ty cần phải sáng tạo trong việc thu thập, xử lý và sử dụng dữ liệu. Điều này có thể bao gồm việc đầu tư vào công nghệ tổng hợp dữ liệu, hợp tác với các tổ chức phi lợi nhuận để thu thập dữ liệu cộng đồng, hoặc phát triển các giải pháp AI có khả năng học hiệu quả với lượng dữ liệu nhỏ hơn. Ngoài ra, cần phải chú trọng đến việc đảm bảo quyền riêng tư và bảo mật dữ liệu, đồng thời thúc đẩy sự phát triển của các tiêu chuẩn đạo đức trong lĩnh vực AI.
OPPO công bố cam kết giúp mọi người có thể sử dụng điện thoại AI, mang các tính năng AI sáng tạo đến khoảng 50 triệu người dùng vào năm 2024 Vietnet24h - Được thúc đẩy bởi niềm tin rằng điện thoại thông minh là thiết bị AI cá nhân quan trọng nhất, OPPO đang đưa AI tổng hợp vào tất cả các dòng sản phẩm điện thoại thông minh OPPO khi hãng cam kết mang điện thoại AI đến với mọi người.
Sự thật đằng sau AI: một cảnh báo từ những người trong cuộc Vietnet24h - Trong bối cảnh công nghệ AI đang phát triển với tốc độ chóng mặt, một nhóm gồm 13 chuyên gia và cựu chuyên gia đến từ OpenAI và Google DeepMind đã lên tiếng, bày tỏ quan ngại sâu sắc về việc các công ty hàng đầu trong lĩnh vực này đang giữ kín thông tin quan trọng liên quan đến những rủi ro tiềm ẩn của AI.
Tin khác cùng chuyên mục
Tin đọc nhiều
Thủ tướng Modi và Ishiba thăm nhà máy Tokyo Electron để tăng cường quan hệ hợp tác bán dẫn Vietnet24h - Các nhà phân tích nhận định rằng sự hợp tác sâu rộng hơn trong lĩnh vực bán dẫn giữa Ấn Độ và Nhật Bản là một chiến lược mang lại lợi ích đôi bên, đặc biệt khi bán dẫn ngày càng quan trọng trong sản xuất ô tô, thiết bị viễn thông và sản phẩm điện tử.
Hoa Kỳ yêu cầu Samsung, SK Hynix phải xin giấy phép để xuất khẩu công cụ sản xuất chip của Hoa Kỳ sang Trung Quốc Vietnet24h - Bộ Thương mại Hoa Kỳ hôm thứ Sáu (29/8) đã công bố kế hoạch tước tư cách "người dùng cuối đã được xác thực (VEU)" của các công ty công nghệ Hàn Quốc là Samsung Electronics và SK hynix Inc.
Đài Loan truy tố ba người vì cáo buộc đánh cắp bí mật thương mại 2-nm của TSMC Vietnet24h - Vụ việc liên quan đến cựu nhân viên của nhà sản xuất thiết bị chip hàng đầu Nhật Bản Tokyo Electron.
Tổng thống Hoa Kỳ Đe Dọa Áp Thuế Cao và Hạn Chế Xuất Khẩu Chip Đối Với Các Nước Thu Thuế Kỹ Thuật Số Vietnet24h - Tổng thống Hoa Kỳ Donald Trump cam kết sẽ áp đặt các mức thuế “đáng kể” và hạn chế xuất khẩu chip công nghệ cao đối với các quốc gia không dỡ bỏ thuế dịch vụ kỹ thuật số (DST) và các quy định liên quan.
Samsung, TSMC đối mặt với tình thế tiến thoái lưỡng nan khi phải đổi cổ phiếu lấy trợ cấp theo kế hoạch của Trump Vietnet24h - Các nhà phê bình cho rằng yêu cầu về vốn chủ sở hữu của Trump không phải là trợ cấp mà là nỗ lực sở hữu các công ty tư nhân
Apple vừa giành được chiến thắng quan trọng trong cuộc chiến mã hóa toàn cầu Vietnet24h - Chính phủ Hoa Kỳ hôm thứ Hai tuyên bố Vương quốc Anh sẽ hủy yêu cầu Apple cung cấp "cửa sau" để truy cập dữ liệu người dùng.
Chính phủ Hoa Kỳ đang thảo luận về việc mua cổ phần của Intel Vietnet24h - Chính phủ Hoa Kỳ đang đàm phán với Intel về việc mua cổ phần của công ty này, Bloomberg đưa tin.
Trump được các Thượng nghị sĩ Dân chủ hàng đầu cảnh báo nên xem xét lại việc bán chip AI tiên tiến cho Trung Quốc Vietnet24h - Các Thượng nghị sĩ Dân chủ hàng đầu đã viết một bức thư ngỏ yêu cầu Tổng thống Donald Trump xem xét lại quyết định cho phép bán chip trí tuệ nhân tạo cho Trung Quốc.
Màn hình OLED của Trung Quốc bị cấm tại Hoa Kỳ trong 15 năm Vietnet24h - ITC đã chặn mọi hoạt động tiếp thị, quảng cáo và bán hàng của trụ sở chính BOE và các công ty con tại Hoa Kỳ.
Trump cho biết Hoa Kỳ có thể công bố mức thuế đối với mặt hàng bán dẫn vào tuần tới Vietnet24h - Ông Trump đưa ra phát biểu này trong cuộc họp với các phóng viên trên chuyên cơ Không lực Một, khi ông đang trên đường đến Alaska để hội đàm với Tổng thống Nga Vladimir Putin.
Microsoft công bố tầm nhìn AI đa phương thức đầy tham vọng cho trải nghiệm Windows 2030 Vietnet24h - Tầm nhìn Windows 2030 đầy tham vọng của Microsoft hé lộ một tương lai nơi trí tuệ nhân tạo (AI) được tích hợp vào từng cấu trúc của hệ điều hành, định hình lại đáng kể trải nghiệm người dùng.
Các giám đốc Samsung, SK, Nvidia trong cuộc họp ba bên hiếm hoi về tương lai AI Vietnet24h - Tại Hội nghị Bàn tròn Kinh doanh Hàn Quốc - Hoa Kỳ hôm thứ Hai đầu tuần (25/8), Chủ tịch Samsung Electronics Lee Jae-yong, Chủ tịch SK Group Chey Tae-won và Giám đốc điều hành Nvidia Jensen Huang đã có một cuộc họp ba bên hiếm hoi, thúc đẩy kỳ vọng về sự hợp tác sâu rộng hơn trong lĩnh vực chip AI.
Nvidia đối mặt với kỳ vọng cao của Phố Wall sau hai năm bùng nổ AI Vietnet24h - Hoạt động kinh doanh của Nvidia bắt đầu chuyển đổi từ hai năm trước với sự bùng nổ của trí tuệ nhân tạo, được thúc đẩy bởi ChatGPT của OpenAI.
Qualcomm đồng hành cùng Việt Nam trong phát triển nhân tài AI Vietnet24h - Chiều 12/8, Thủ tướng Phạm Minh Chính tiếp ông Cristiano Amon, Chủ tịch kiêm Tổng Giám đốc điều hành tập đoàn Qualcomm và đoàn công tác của tập đoàn đến thăm, làm việc tại Việt Nam.
Ai kiểm soát không gian mạng Việt Nam? VSTN hé mở một lời đáp Vietnet24h - Giữa những bất ổn liên tục từ các tuyến cáp biển quốc tế, câu hỏi về quyền kiểm soát và tự chủ dữ liệu ngày càng trở nên bức thiết. Việc vận hành tuyến cáp đất liền VSTN do người Việt làm chủ 100% không chỉ là giải pháp kỹ thuật, mà là một bước đi chính trị - kinh tế về chủ quyền không gian mạng.
Máy bay điện vượt biển: Trung Quốc đặt cược tương lai logistics ngoài khơi vào eVTOL Vietnet24h - Chuyến bay đầu tiên của chiếc eVTOL V2000CG CarryAll ra giàn khoan dầu ngoài khơi không chỉ là một thử nghiệm kỹ thuật, mà còn là bước đi chiến lược trong tham vọng chuyển đổi logistics và năng lượng của Trung Quốc. Khi nền kinh tế tầm thấp trở thành động lực tăng trưởng mới, công nghệ bay cự ly ngắn đang dần định hình lại hạ tầng công nghiệp quốc gia.
Drone phát sóng – “phao cứu sinh” công nghệ trong vùng lũ và bài toán chủ quyền số Vietnet24h - Trong bối cảnh thiên tai ngày càng khốc liệt và bất thường do biến đổi khí hậu, việc đảm bảo hạ tầng thông tin liên lạc trong vùng bị cô lập không chỉ là bài toán kỹ thuật, mà còn là một thách thức chiến lược về năng lực ứng phó khẩn cấp và an ninh mạng quốc gia. Giải pháp drone phát sóng của Viettel – với khả năng phủ sóng 4G trong bán kính 6 km – đang mở ra một hướng đi mới, nơi công nghệ bay không người lái trở thành cầu nối sống còn giữa con người và hệ thống cứu hộ trong tình huống đứt gãy liên lạc.
HỘI NGHỊ THƯỢNG ĐỈNH BÁN DẪN ASEAN 2025 (ASEMIS): VIỆT NAM ĐÓNG VAI TRÒ QUAN TRỌNG TRONG VIỆC TĂNG CƯỜNG CHUỖI CUNG ỨNG BÁN DẪN ĐÔNG NAM Á Vietnet24h - Hội nghị Thượng đỉnh Bán dẫn ASEAN 2025 (ASEMIS), được tổ chức bởi Hiệp hội Công nghiệp Bán dẫn Malaysia (MSIA) vào ngày 24 tháng 7 năm 2025 tại khách sạn One World, Kuala Lumpur, đã đánh dấu một cột mốc quan trọng trong việc định hình tương lai của ngành công nghiệp bán dẫn tại Đông Nam Á.
Khám phá những điều hấp dẫn ở Galaxy Watch Ultra của Samsung Vietnet24h - Galaxy Watch Ultra của Samsung, chiếc đồng hồ thông minh bền bỉ tiên phong được ra mắt chỉ một năm trước với One UI Watch 6, đã bắt đầu nhận được bản cập nhật phần mềm lớn đầu tiên rất được mong đợi.
Xu hướng "tạm dừng" bùng nổ trung tâm dữ liệu AI tại các công ty công nghệ lớn Vietnet24h - Quyết định ngừng hoạt động của một trung tâm dữ liệu ở Ohio của Microsoft và báo cáo của Phố Wall cho biết AWS của Amazon đang tạm dừng một số hợp đồng thuê đã làm gia tăng lo ngại của thị trường về sự sụp đổ của một trung tâm dữ liệu AI.
Hon Hai và Mitsubishi Fuso hợp tác phát triển xe buýt ZEV Vietnet24h - Tập đoàn Công nghệ Hon Hai, gã khổng lồ sản xuất Đài Loan, đã ký biên bản ghi nhớ (MOU) với nhà sản xuất ô tô Mitsubishi Fuso Truck and Bus Corp. (MFTBC) của Nhật Bản để cùng phát triển xe buýt không phát thải (ZEV).
Sony kêu gọi sử dụng 100% năng lượng tái tạo từ các nhà cung cấp bán cho tập đoàn Vietnet24h - Tập đoàn Sony sẽ khuyến khích các nhà cung cấp lớn sử dụng 100% năng lượng tái tạo để sản xuất các linh kiện cung cấp cho các công ty trong tập đoàn vào năm tài chính 2030.
Những chú robot đang thay đổi cách xây dựng các trang trại năng lượng mặt trời, giúp tiết kiệm thời gian và tiền bạc Vietnet24h - CivDot là một robot bốn bánh có thể đánh dấu tới 3.000 điểm bố trí mỗi ngày và có độ chính xác trong vòng 8 mm.
Trump nói rằng Hoa Kỳ sẽ không chấp thuận các dự án năng lượng mặt trời hoặc năng lượng gió Vietnet24h - Tổng thống Donald Trump cho biết Hoa Kỳ sẽ không chấp thuận các dự án điện gió hoặc điện mặt trời.
Tuvalu – Quốc gia đầu tiên phải di cư vì khí hậu, và hồi chuông cảnh tỉnh cho thế giới Vietnet24h - Khi Tuvalu – một quốc đảo nhỏ bé ở Thái Bình Dương – lên kế hoạch di cư dân số sang Australia do nước biển dâng, đó không còn là một câu chuyện viễn tưởng u ám về tương lai, mà là thực tại đầu tiên của một thế giới đang bước vào kỷ nguyên di cư vì khí hậu.
Nhiệt hạch và dữ liệu: Microsoft đặt cược vào giấc mơ điện mặt trời nhân tạo Vietnet24h - Với thỏa thuận lịch sử cùng Helion Energy, Microsoft không chỉ mua điện, mà đang đầu tư vào một tương lai nơi năng lượng nhiệt hạch trở thành chìa khóa cho sự sống còn của các trung tâm dữ liệu AI. Nhưng liệu họ có đang đặt cược vào điều chưa từng thành công?
SK Chemicals đặt cược vào tái chế nhựa để vượt qua suy thoái ngành Vietnet24h - Đầu năm nay, SK Chemicals đã tái cấu trúc thành hai bộ phận để tập trung chuyên sâu hơn vào lĩnh vực tái chế nhựa của mình
Công nghệ hạt nhân thế hệ 4: Trung Quốc đang phát triển năng lượng sạch hay vũ khí tiềm ẩn? Vietnet24h - Dù được giới thiệu là bước đột phá xanh, lò CFR-1000 của Trung Quốc có thể tạo plutonium-239 – nguyên liệu chế tạo vũ khí hạt nhân. Giới quan sát quốc tế đặt câu hỏi về tính minh bạch và mục tiêu thực sự đằng sau cuộc cách mạng hạt nhân "sạch" của Bắc Kinh.
Bắc Kinh xây đập ở Tây Tạng, New Delhi và Dhaka đứng trước bài toán sống còn Vietnet24h - Trong khi Trung Quốc gọi đây là bước đột phá về năng lượng sạch, thì ở hạ lưu, Ấn Độ và Bangladesh không giấu được lo ngại về một tương lai khan hiếm nước và phụ thuộc chiến lược vào nước láng giềng.
Vì sao tàu chạy 400 km/h của Trung Quốc không tốn thêm điện? Vietnet24h - Tàu CR450 đạt tốc độ 400 km/h nhờ thay đổi cấu trúc khí động học và cải tiến phần phanh, chứ không cần thêm năng lượng. Đây là minh chứng cho việc tăng tốc không nhất thiết đồng nghĩa với tăng tiêu hao – một bài học về thiết kế thông minh trong kỹ thuật hiện đại.