Công nghệ
Rủi ro của việc giảm dần dữ liệu văn bản đối với AI
Mộc Đức - Thứ Hai, 10/06/2024 10:49 SA
Vietnet24h - Việc dữ liệu văn bản do con người tạo ra ngày càng trở nên khan hiếm có thể gây rủi ro lớn đối với khả năng phát triển của công nghệ AI. Thông tin này được thể hiện trong báo cáo mới từ Fortune, với sự lo lắng cao độ về thách thức 'Nút thắt cổ chai' đối với các gã khổng lồ công nghệ.
Trong bối cảnh cuộc đua công nghệ AI đang diễn ra sôi động, một thách thức mới đã xuất hiện trên chân trời: 'Nút thắt cổ chai' đang đặt ra những rủi ro không nhỏ cho các gã khổng lồ công nghệ như Google và Meta. Theo một báo cáo mới từ Fortune, dữ liệu văn bản do con người tạo ra đang dần trở nên khan hiếm, đe dọa đến khả năng phát triển của AI.
 
Nhóm nghiên cứu Epoch, trong báo cáo công bố ngày 6/6, cảnh báo rằng vào khoảng năm 2026-2032, các công ty có thể sẽ đối mặt với tình trạng hết dữ liệu để đào tạo AI. AI tạo sinh (GenAI) đang được coi là "cơn sốt vàng" mới, nhưng cuộc chạy đua khai thác dữ liệu có thể khiến nguồn tài nguyên này cạn kiệt nhanh chóng.
 
Trong ngắn hạn, các công ty như OpenAI và Google đang nỗ lực bảo vệ nguồn dữ liệu của mình, thậm chí không ngần ngại chi trả để tiếp cận dữ liệu chất lượng cao cho việc đào tạo AI. Hình ảnh CEO OpenAI Sam Altman và CEO Microsoft Satya Nadella tại một sự kiện của OpenAI vào tháng 6/2023 là minh chứng cho mối quan hệ hợp tác sâu rộng giữa các công ty hàng đầu trong lĩnh vực này.
 
Tamay Besiroglu, tác giả chính của nghiên cứu, nhấn mạnh rằng trong tương lai, sẽ không còn đủ nguồn dữ liệu mới từ các bài viết, blog, tin tức và bình luận trên mạng xã hội để duy trì đà tăng trưởng của AI. Ông cảnh báo rằng khi thông tin nhạy cảm hoặc riêng tư không thể sử dụng, "nút thắt cổ chai" sẽ ngày càng trở nên rõ ràng.
 
Besiroglu cũng đưa ra quan điểm: "Nếu chúng ta gặp hạn chế về lượng dữ liệu, việc mở rộng các mô hình AI sẽ trở nên bất khả thi." Các nghiên cứu chỉ ra rằng, dữ liệu chất lượng cao dưới dạng văn bản có thể sẽ không đủ để "nuôi" cỗ máy AI vào năm 2026, đặt ra một thách thức lớn cho các công ty như OpenAI, Google, Meta và Microsoft trong cuộc đua AI.
 
Tuy nhiên, không phải tất cả đều đồng tình với quan điểm về "nút thắt cổ chai" trong ngành AI. Nicolas Papernot, phó giáo sư về kỹ thuật máy tính tại Đại học Toronto, cho rằng: "Chúng ta không nhất thiết phải đào tạo các mô hình ngày càng lớn hơn. Có thể phát triển các hệ thống AI chuyên biệt cho từng nhiệm vụ cụ thể." Ông cũng bày tỏ lo ngại rằng việc đào tạo nhiều hệ thống AI trên cùng một kho dữ liệu có thể làm giảm hiệu suất mô hình, thậm chí dẫn đến "sụp đổ mô hình". Ông cảnh báo rằng việc đào tạo AI dựa trên dữ liệu do chính nó tạo ra có thể làm sâu thêm những sai lầm của trí tuệ nhân tạo, như phân biệt chủng tộc và sai lệch thông tin.
Selena Deckelmann, Giám đốc sản phẩm và công nghệ của Wikipedia, nhấn mạnh: "Con người đang tạo ra một dạng tài nguyên mới - dữ liệu. Tại Wikipedia, chúng tôi đặt ra hạn chế đối với cách các công ty sử dụng nội dung do con người biên soạn, nhằm bảo vệ nguồn dữ liệu và khuyến khích tình nguyện viên tiếp tục đóng góp nội dung chất lượng cao." Bà cũng chỉ ra rằng điều quan trọng là làm sao để nội dung do con người tạo ra không chỉ tồn tại mà còn được truy cập một cách công bằng.
 
Nhóm nghiên cứu Epoch cũng đưa ra quan điểm rằng việc các công ty trả tiền cho hàng triệu người tạo văn bản có thể không phải là giải pháp tiết kiệm chi phí. OpenAI đang tiếp cận vấn đề này theo một cách mới: CEO Sam Altman đã tuyên bố sử dụng dữ liệu tổng hợp để đào tạo AI tại một sự kiện của Liên Hợp Quốc. Dữ liệu tổng hợp bao gồm cả nội dung do con người và AI tạo ra, kể cả những nội dung kém chất lượng.
 
Altman không phủ nhận những thách thức liên quan đến việc này. Ông nhấn mạnh rằng các công ty như OpenAI cần phải cân nhắc việc giảm bớt sự phụ thuộc vào dữ liệu và tập trung vào việc cải thiện mô hình AI. "Sẽ có những điều bất ngờ xảy ra nếu chúng ta đào tạo mô hình AI dựa trên kho dữ liệu tổng hợp," Altman nói. "Chưa chắc chắn liệu sáng kiến này có mang lại hiệu quả tốt hay không."

Cuộc đua công nghệ AI đang đối mặt với một nút thắt cổ chai nghiêm trọng - sự khan hiếm dữ liệu văn bản do con người tạo ra. Điều này đặt ra thách thức lớn cho các công ty công nghệ, đặc biệt là các gã khổng lồ như Google và Meta, khi họ phụ thuộc vào dữ liệu chất lượng cao để phát triển AI. Để vượt qua nút thắt này, các công ty cần phải sáng tạo trong việc thu thập, xử lý và sử dụng dữ liệu. Điều này có thể bao gồm việc đầu tư vào công nghệ tổng hợp dữ liệu, hợp tác với các tổ chức phi lợi nhuận để thu thập dữ liệu cộng đồng, hoặc phát triển các giải pháp AI có khả năng học hiệu quả với lượng dữ liệu nhỏ hơn. Ngoài ra, cần phải chú trọng đến việc đảm bảo quyền riêng tư và bảo mật dữ liệu, đồng thời thúc đẩy sự phát triển của các tiêu chuẩn đạo đức trong lĩnh vực AI.
OPPO công bố cam kết giúp mọi người có thể sử dụng điện thoại AI, mang các tính năng AI sáng tạo đến khoảng 50 triệu người dùng vào năm 2024 Vietnet24h - Được thúc đẩy bởi niềm tin rằng điện thoại thông minh là thiết bị AI cá nhân quan trọng nhất, OPPO đang đưa AI tổng hợp vào tất cả các dòng sản phẩm điện thoại thông minh OPPO khi hãng cam kết mang điện thoại AI đến với mọi người.
Sự thật đằng sau AI: một cảnh báo từ những người trong cuộc Vietnet24h - Trong bối cảnh công nghệ AI đang phát triển với tốc độ chóng mặt, một nhóm gồm 13 chuyên gia và cựu chuyên gia đến từ OpenAI và Google DeepMind đã lên tiếng, bày tỏ quan ngại sâu sắc về việc các công ty hàng đầu trong lĩnh vực này đang giữ kín thông tin quan trọng liên quan đến những rủi ro tiềm ẩn của AI.
Tin khác cùng chuyên mục
Tin đọc nhiều
Từ Gmail đến Word, cài đặt quyền riêng tư và AI của bạn đang bước vào một mối quan hệ mới Vietnet24h - Các chương trình như Gmail, Microsoft và Facebook đã tồn tại trong nhiều năm qua đã âm thầm kích hoạt và tích hợp các tính năng AI.
AI trong Gmail, Word: Tiện ích hay mối đe dọa quyền riêng tư? Vietnet24h - AI đang dần xâm nhập vào mọi ngóc ngách của cuộc sống số, từ email đến sổ sách kế toán. Tuy nhiên, sự thiếu rõ ràng trong chính sách bảo mật khiến nhiều chuyên gia cảnh báo về nguy cơ dữ liệu cá nhân bị lạm dụng.
OpenAI bật mí 5 mẹo dùng ChatGPT mà bạn chưa biết Vietnet24h - Nick Turley, chuyên gia của OpenAI, tiết lộ các tính năng như tải tập tin, tạo GPT tùy chỉnh và sử dụng giọng nói, hứa hẹn thay đổi cách người dùng tương tác với ChatGPT.
Ghi âm cuộc gọi và cải tiến camera: Những điểm nổi bật trong iOS 18.1 của Apple Vietnet24h - Vào tối 28 tháng 10, Apple phát hành phiên bản iOS 18.1, mang đến tính năng ghi âm cuộc gọi lần đầu tiên cho người dùng iPhone. Cùng với đó là những cải tiến cho camera và giao diện, hứa hẹn sẽ nâng cao trải nghiệm người dùng trên các thiết bị mới.
Orion sắp ra mắt: OpenAI mở ra chương mới cho trí tuệ nhân tạo Vietnet24h - Với việc ra mắt mô hình AI mới mang tên Orion vào tháng 12/2024, OpenAI đang tạo ra những bước tiến mạnh mẽ trong lĩnh vực công nghệ. Orion được kỳ vọng sẽ có sức mạnh vượt trội gấp 100 lần GPT-4, đánh dấu một cột mốc quan trọng trong hành trình phát triển trí tuệ nhân tạo tổng quát.
Chỉnh sửa ảnh thông minh với Microsoft Paint nhờ AI Vietnet24h - Microsoft Paint không ngừng cải tiến với sự ra mắt của Generative Fill và Generative Erase. Hai tính năng mới này giúp người dùng dễ dàng thêm hoặc xóa các chi tiết trong ảnh, mang lại trải nghiệm chỉnh sửa ảnh phong phú và trực quan hơn bao giờ hết.
Nút bấm mới trên iPhone 17 Pro: Tích hợp âm lượng và Action Vietnet24h - Thông tin từ các nguồn đáng tin cậy cho thấy iPhone 17 Pro có thể ra mắt với nút bấm đa năng, thay thế cho nút Action và âm lượng riêng biệt, hứa hẹn mang lại trải nghiệm người dùng mới lạ.
Phiên bản iPhone nào đủ sức chạy Apple Intelligence? Vietnet24h - Apple vừa đưa ra thông tin về dung lượng bộ nhớ mà các mẫu iPhone cần để hỗ trợ tính năng Apple Intelligence, cho biết tối thiểu 4 GB dung lượng trống là cần thiết và dự kiến sẽ tăng lên trong tương lai. Điều này được đề cập trong tài liệu hướng dẫn mới nhất của hãng dành cho bản cập nhật iOS 18.1 Developer Beta 5.
Liệu Apple Intelligence có lợi thế hơn Galaxy AI không? Vietnet24h - Tại Hội nghị các nhà phát triển toàn cầu hôm thứ Hai, Apple đã giới thiệu Apple Intelligence, hệ thống AI sẽ được tích hợp trên các sản phẩm từ iPhone đến Macbook.
Apple Intelligence trên iPhone của bạn có thể yêu cầu nâng cấp Vietnet24h - Apple cuối cùng đã lao đầu vào lĩnh vực trí tuệ nhân tạo vào thứ Hai với thông báo về Apple Intelligence.
Merck giới thiệu các giải pháp vật liệu cho kiến ​​trúc chip mới tại Triển lãm SEMICON Hàn Quốc Vietnet24h - Merck, một công ty hàng đầu thế giới về khoa học và công nghệ, đã giới thiệu các giải pháp vật liệu do trí tuệ nhân tạo (AI) thúc đẩy và khả năng số hóa thông qua nền tảng trí tuệ vật liệu của mình tại hội chợ công nghệ SEMICON Korea 2025.
xAI của Elon Musk phát hành mô hình trí tuệ nhân tạo Grok 3, tuyên bố hiệu suất tốt hơn so với các đối thủ Vietnet24h - Công ty khởi nghiệp AI của Elon Musk vừa công bố mô hình AI mới nhất của mình, Grok 3, mà theo họ là vượt trội hơn các mô hình tiên tiến của đối thủ cạnh tranh.
Đài Loan đặt mục tiêu tăng sức mạnh tính toán lên hơn bảy lần vào năm 2029 Vietnet24h - Đài Loan có kế hoạch tăng cường sức mạnh tính toán quốc gia từ mức 160 petaflop hiện tại lên khoảng 1.200 petaflop vào năm 2029, tăng gấp 7,5 lần trong bốn năm tới, Hội đồng Khoa học và Công nghệ Quốc gia (NSTC) cho biết hôm thứ Năm.
Apple sẽ tích hợp AI của Alibaba vào iPhone tại Trung Quốc Vietnet24h - Chủ tịch Tập đoàn Alibaba Joe Tsai đã xác nhận quan hệ đối tác AI của công ty mình với Apple khi phát biểu tại Hội nghị thượng đỉnh các chính phủ thế giới ở Dubai vào thứ Năm (13/2).
FuriosaAI thu hút sự chú ý về khả năng vượt mặt Meta Vietnet24h - Meta đang thảo luận để mua lại FuriosaAI và các cuộc đàm phán có thể kết thúc sớm nhất là trong tháng này.
Cải cách giờ làm việc cho các nhà sản xuất chip: Linh hoạt trong R&D hay bóc lột công nhân? Vietnet24h - Hàn Quốc - quê hương của các nhà sản xuất chip hàng đầu Samsung Electronics và SK hynix - đang áp dụng tuần làm việc 52 giờ, bao gồm 40 giờ làm việc bình thường và tối đa 12 giờ làm thêm (nếu có sự đồng ý của nhân viên).
Hội nghị thượng đỉnh AI Paris thu hút các nhà lãnh đạo và CEO thế giới háo hức đón làn sóng công nghệ Vietnet24h - Các nhà lãnh đạo thế giới và giám đốc điều hành công nghệ sẽ đến Paris vào thứ Hai để thảo luận về cách áp dụng trí tuệ nhân tạo một cách an toàn vào thời điểm ngày càng có nhiều sự phản đối đối với thủ tục hành chính rườm rà mà các doanh nghiệp cho rằng kìm hãm sự đổi mới.
Cuộc chiến pháp lý kéo dài hàng thập kỷ của người đứng đầu Samsung đã kết thúc Vietnet24h - Chủ tịch Samsung Electronics Lee Jae-yong đã thoát khỏi nhiều năm đấu tranh pháp lý vào thứ Hai (3/2), sau khi tòa phúc thẩm tuyên bố ông không phạm tội gian lận chứng khoán và kế toán liên quan đến vụ sáp nhập các công ty liên kết của Samsung năm 2015.
Tổng thống Hoa Kỳ Donald Trump gặp gỡ CEO Nvidia để thảo luận về DeepSeek, xuất khẩu chip AI Vietnet24h - Cuộc họp vào chiều thứ Sáu (1/2) diễn ra khi chính phủ Hoa Kỳ chuẩn bị hạn chế hơn nữa việc xuất khẩu chip AI vào mùa xuân này để đảm bảo sức mạnh điện toán tiên tiến vẫn ở lại Hoa Kỳ và các đồng minh của mình, đồng thời tìm kiếm nhiều cách hơn để ngăn chặn sự tiếp cận của Trung Quốc.
Diễn đàn công nghệ Galaxy: Tái định nghĩa mô hình trải nghiệm di động Vietnet24h - Vào ngày 23 tháng 1, Samsung đã tổ chức Diễn đàn công nghệ Galaxy tại San Jose, California. Các phiên thảo luận đã cung cấp thông tin chuyên sâu về những đột phá công nghệ AI của Samsung và thách thức mà chúng giải quyết trong bốn lĩnh vực chính — Phát triển bền vững, Health AI, Galaxy AI và Home AI. Trong phiên thảo luận về Galaxy AI, các chuyên gia đã đáng giá tiềm năng của các tác nhân AI và vai trò của chúng trong việc định hình tương lai.
Smartphone gập ba: Samsung chạm đỉnh công nghệ, người dùng chạm đáy túi tiền Vietnet24h - Với tham vọng thay đổi cách người dùng trải nghiệm thiết bị di động, Samsung sắp ra mắt điện thoại gập ba. Dù mang thiết kế tiên phong, giá bán lên đến 2.800 USD sẽ là rào cản lớn để sản phẩm đến tay người dùng đại chúng.
Samsung Display sẽ ra mắt màn hình gập 18,1 inch tại CES Vietnet24h - Samsung Display cho biết hôm Chủ Nhật rằng họ sẽ ra mắt màn hình OLED có thể gập 18,1 inch đầu tiên trên thế giới tại CES 2025, dự kiến ​​sẽ khai mạc vào thứ Ba (7/1) tại Las Vegas.
Khí quyển của TRAPPIST-1: một phát hiện thú vị về sự tồn tại sự sống ngoài trái đất Vietnet24h - TRAPPIST-1b, hành tinh cách Trái đất 40 năm ánh sáng, đã gây bất ngờ khi các nhà khoa học phát hiện rằng nó có khí quyển dày đặc và một lớp sương mù đặc biệt, mở ra triển vọng mới trong nghiên cứu sự sống ngoài hành tinh.
Elon Musk biến Texas thành trung tâm không gian mới: Starbase và những giấc mơ vũ trụ Vietnet24h - Elon Musk đang làm một điều chưa từng có: biến một vùng đất xa xôi tại Texas thành một thị trấn vũ trụ mang tên Starbase. Với dự án này, ông không chỉ mong muốn tạo ra một cộng đồng phục vụ cho SpaceX mà còn muốn mở ra một kỷ nguyên mới cho ngành công nghiệp không gian, với tầm nhìn đưa con người lên Sao Hỏa.
Parker Solar Probe: Tàu vũ trụ “siêu tốc” của NASA chính thức đến gần mặt trời nhất Vietnet24h - NASA vừa thực hiện một bước tiến quan trọng trong sứ mệnh khám phá vũ trụ, khi tàu thăm dò Parker Solar Probe đã tiến gần mặt trời hơn bao giờ hết. Cùng với đó, tàu vũ trụ này cũng lập kỷ lục mới về tốc độ, giúp giải quyết nhiều câu hỏi lâu dài về nguồn gốc gió mặt trời và vầng nhật hoa.
Các nhà nghiên cứu Đài Loan phát triển kính hiển vi 4D để quét não nhanh hơn và rõ hơn Vietnet24h - Tại một cuộc họp báo, nhóm các nhà nghiên cứu từ Đại học Quốc gia Đài Loan (NTU) và Đại học Quốc gia Thanh Hoa cho biết kính hiển vi mới cung cấp hình ảnh nhanh hơn hàng nghìn lần so với kính hiển vi truyền thống.
Nhóm nghiên cứu Hàn Quốc phát triển robot ‘Iron Man’ giúp người liệt nửa người đi lại Vietnet24h - Các nhà nghiên cứu Hàn Quốc đã phát triển một robot đeo nhẹ có thể đi đến gần người bị liệt nửa người và gắn chặt người dùng vào thiết bị, cho phép họ đi bộ, vượt chướng ngại vật và leo cầu thang.
LG Innotek phát triển mô-đun camera trong cabin tiên tiến Vietnet24h - LG Innotek đã công bố hôm thứ Ba về việc phát triển một mô-đun camera trong cabin hiệu suất cao dành cho xe được trang bị cảm biến kép RGB-IR năm megapixel. RGB là viết tắt của đỏ, xanh lá cây và xanh lam, trong khi IR là hồng ngoại.
LG Display ra mắt màn hình có thể kéo giãn lên đến 50% Vietnet24h - LG Display đã ra mắt sản phẩm mà họ tuyên bố là màn hình có khả năng kéo dài đầu tiên trên thế giới, có thể kéo dài tới 50% tại Công viên Khoa học LG ở Seoul.
LG Electronics hợp tác với nhà sản xuất chip AI của Hoa Kỳ để phát triển công nghệ cảm biến trong cabin Vietnet24h - Thứ Năm tuần này (5/12), LG Electronics cho biết rằng, họ sẽ hợp tác với nhà sản xuất chip trí tuệ nhân tạo (AI) của Hoa Kỳ là Ambarella để triển khai giải pháp cảm biến trong cabin tiên tiến, theo dõi trạng thái của người lái xe và cabin xe.