Công nghệ
Rủi ro của việc giảm dần dữ liệu văn bản đối với AI
Mộc Đức - Thứ Hai, 10/06/2024 10:49 SA
Vietnet24h - Việc dữ liệu văn bản do con người tạo ra ngày càng trở nên khan hiếm có thể gây rủi ro lớn đối với khả năng phát triển của công nghệ AI. Thông tin này được thể hiện trong báo cáo mới từ Fortune, với sự lo lắng cao độ về thách thức 'Nút thắt cổ chai' đối với các gã khổng lồ công nghệ.
Trong bối cảnh cuộc đua công nghệ AI đang diễn ra sôi động, một thách thức mới đã xuất hiện trên chân trời: 'Nút thắt cổ chai' đang đặt ra những rủi ro không nhỏ cho các gã khổng lồ công nghệ như Google và Meta. Theo một báo cáo mới từ Fortune, dữ liệu văn bản do con người tạo ra đang dần trở nên khan hiếm, đe dọa đến khả năng phát triển của AI.
 
Nhóm nghiên cứu Epoch, trong báo cáo công bố ngày 6/6, cảnh báo rằng vào khoảng năm 2026-2032, các công ty có thể sẽ đối mặt với tình trạng hết dữ liệu để đào tạo AI. AI tạo sinh (GenAI) đang được coi là "cơn sốt vàng" mới, nhưng cuộc chạy đua khai thác dữ liệu có thể khiến nguồn tài nguyên này cạn kiệt nhanh chóng.
 
Trong ngắn hạn, các công ty như OpenAI và Google đang nỗ lực bảo vệ nguồn dữ liệu của mình, thậm chí không ngần ngại chi trả để tiếp cận dữ liệu chất lượng cao cho việc đào tạo AI. Hình ảnh CEO OpenAI Sam Altman và CEO Microsoft Satya Nadella tại một sự kiện của OpenAI vào tháng 6/2023 là minh chứng cho mối quan hệ hợp tác sâu rộng giữa các công ty hàng đầu trong lĩnh vực này.
 
Tamay Besiroglu, tác giả chính của nghiên cứu, nhấn mạnh rằng trong tương lai, sẽ không còn đủ nguồn dữ liệu mới từ các bài viết, blog, tin tức và bình luận trên mạng xã hội để duy trì đà tăng trưởng của AI. Ông cảnh báo rằng khi thông tin nhạy cảm hoặc riêng tư không thể sử dụng, "nút thắt cổ chai" sẽ ngày càng trở nên rõ ràng.
 
Besiroglu cũng đưa ra quan điểm: "Nếu chúng ta gặp hạn chế về lượng dữ liệu, việc mở rộng các mô hình AI sẽ trở nên bất khả thi." Các nghiên cứu chỉ ra rằng, dữ liệu chất lượng cao dưới dạng văn bản có thể sẽ không đủ để "nuôi" cỗ máy AI vào năm 2026, đặt ra một thách thức lớn cho các công ty như OpenAI, Google, Meta và Microsoft trong cuộc đua AI.
 
Tuy nhiên, không phải tất cả đều đồng tình với quan điểm về "nút thắt cổ chai" trong ngành AI. Nicolas Papernot, phó giáo sư về kỹ thuật máy tính tại Đại học Toronto, cho rằng: "Chúng ta không nhất thiết phải đào tạo các mô hình ngày càng lớn hơn. Có thể phát triển các hệ thống AI chuyên biệt cho từng nhiệm vụ cụ thể." Ông cũng bày tỏ lo ngại rằng việc đào tạo nhiều hệ thống AI trên cùng một kho dữ liệu có thể làm giảm hiệu suất mô hình, thậm chí dẫn đến "sụp đổ mô hình". Ông cảnh báo rằng việc đào tạo AI dựa trên dữ liệu do chính nó tạo ra có thể làm sâu thêm những sai lầm của trí tuệ nhân tạo, như phân biệt chủng tộc và sai lệch thông tin.
Selena Deckelmann, Giám đốc sản phẩm và công nghệ của Wikipedia, nhấn mạnh: "Con người đang tạo ra một dạng tài nguyên mới - dữ liệu. Tại Wikipedia, chúng tôi đặt ra hạn chế đối với cách các công ty sử dụng nội dung do con người biên soạn, nhằm bảo vệ nguồn dữ liệu và khuyến khích tình nguyện viên tiếp tục đóng góp nội dung chất lượng cao." Bà cũng chỉ ra rằng điều quan trọng là làm sao để nội dung do con người tạo ra không chỉ tồn tại mà còn được truy cập một cách công bằng.
 
Nhóm nghiên cứu Epoch cũng đưa ra quan điểm rằng việc các công ty trả tiền cho hàng triệu người tạo văn bản có thể không phải là giải pháp tiết kiệm chi phí. OpenAI đang tiếp cận vấn đề này theo một cách mới: CEO Sam Altman đã tuyên bố sử dụng dữ liệu tổng hợp để đào tạo AI tại một sự kiện của Liên Hợp Quốc. Dữ liệu tổng hợp bao gồm cả nội dung do con người và AI tạo ra, kể cả những nội dung kém chất lượng.
 
Altman không phủ nhận những thách thức liên quan đến việc này. Ông nhấn mạnh rằng các công ty như OpenAI cần phải cân nhắc việc giảm bớt sự phụ thuộc vào dữ liệu và tập trung vào việc cải thiện mô hình AI. "Sẽ có những điều bất ngờ xảy ra nếu chúng ta đào tạo mô hình AI dựa trên kho dữ liệu tổng hợp," Altman nói. "Chưa chắc chắn liệu sáng kiến này có mang lại hiệu quả tốt hay không."

Cuộc đua công nghệ AI đang đối mặt với một nút thắt cổ chai nghiêm trọng - sự khan hiếm dữ liệu văn bản do con người tạo ra. Điều này đặt ra thách thức lớn cho các công ty công nghệ, đặc biệt là các gã khổng lồ như Google và Meta, khi họ phụ thuộc vào dữ liệu chất lượng cao để phát triển AI. Để vượt qua nút thắt này, các công ty cần phải sáng tạo trong việc thu thập, xử lý và sử dụng dữ liệu. Điều này có thể bao gồm việc đầu tư vào công nghệ tổng hợp dữ liệu, hợp tác với các tổ chức phi lợi nhuận để thu thập dữ liệu cộng đồng, hoặc phát triển các giải pháp AI có khả năng học hiệu quả với lượng dữ liệu nhỏ hơn. Ngoài ra, cần phải chú trọng đến việc đảm bảo quyền riêng tư và bảo mật dữ liệu, đồng thời thúc đẩy sự phát triển của các tiêu chuẩn đạo đức trong lĩnh vực AI.
OPPO công bố cam kết giúp mọi người có thể sử dụng điện thoại AI, mang các tính năng AI sáng tạo đến khoảng 50 triệu người dùng vào năm 2024 Vietnet24h - Được thúc đẩy bởi niềm tin rằng điện thoại thông minh là thiết bị AI cá nhân quan trọng nhất, OPPO đang đưa AI tổng hợp vào tất cả các dòng sản phẩm điện thoại thông minh OPPO khi hãng cam kết mang điện thoại AI đến với mọi người.
Sự thật đằng sau AI: một cảnh báo từ những người trong cuộc Vietnet24h - Trong bối cảnh công nghệ AI đang phát triển với tốc độ chóng mặt, một nhóm gồm 13 chuyên gia và cựu chuyên gia đến từ OpenAI và Google DeepMind đã lên tiếng, bày tỏ quan ngại sâu sắc về việc các công ty hàng đầu trong lĩnh vực này đang giữ kín thông tin quan trọng liên quan đến những rủi ro tiềm ẩn của AI.
Tin khác cùng chuyên mục
Tin đọc nhiều
Rò rỉ cách Apple sẽ làm cho màn hình bên trong của iPhone gập trở nên quen thuộc với người dùng iPad Vietnet24h - Chiếc điện thoại có thể gập đầu tiên của Apple dự kiến ​​sẽ được sản xuất hàng loạt vào cuối năm sau và có thể ra mắt vào quý 4 năm 2026 hoặc quý 1 năm 2027.
Alibaba cung cấp miễn phí mô hình tạo video AI trên toàn cầu Vietnet24h - Gã khổng lồ Trung Quốc cho biết họ đang mở mã nguồn bốn mô hình thuộc dòng Wan2.1, phiên bản mới nhất của mô hình AI nền tảng của công ty, có khả năng tạo hình ảnh và video từ dữ liệu đầu vào là văn bản và hình ảnh.
Từ Gmail đến Word, cài đặt quyền riêng tư và AI của bạn đang bước vào một mối quan hệ mới Vietnet24h - Các chương trình như Gmail, Microsoft và Facebook đã tồn tại trong nhiều năm qua đã âm thầm kích hoạt và tích hợp các tính năng AI.
AI trong Gmail, Word: Tiện ích hay mối đe dọa quyền riêng tư? Vietnet24h - AI đang dần xâm nhập vào mọi ngóc ngách của cuộc sống số, từ email đến sổ sách kế toán. Tuy nhiên, sự thiếu rõ ràng trong chính sách bảo mật khiến nhiều chuyên gia cảnh báo về nguy cơ dữ liệu cá nhân bị lạm dụng.
OpenAI bật mí 5 mẹo dùng ChatGPT mà bạn chưa biết Vietnet24h - Nick Turley, chuyên gia của OpenAI, tiết lộ các tính năng như tải tập tin, tạo GPT tùy chỉnh và sử dụng giọng nói, hứa hẹn thay đổi cách người dùng tương tác với ChatGPT.
Ghi âm cuộc gọi và cải tiến camera: Những điểm nổi bật trong iOS 18.1 của Apple Vietnet24h - Vào tối 28 tháng 10, Apple phát hành phiên bản iOS 18.1, mang đến tính năng ghi âm cuộc gọi lần đầu tiên cho người dùng iPhone. Cùng với đó là những cải tiến cho camera và giao diện, hứa hẹn sẽ nâng cao trải nghiệm người dùng trên các thiết bị mới.
Orion sắp ra mắt: OpenAI mở ra chương mới cho trí tuệ nhân tạo Vietnet24h - Với việc ra mắt mô hình AI mới mang tên Orion vào tháng 12/2024, OpenAI đang tạo ra những bước tiến mạnh mẽ trong lĩnh vực công nghệ. Orion được kỳ vọng sẽ có sức mạnh vượt trội gấp 100 lần GPT-4, đánh dấu một cột mốc quan trọng trong hành trình phát triển trí tuệ nhân tạo tổng quát.
Chỉnh sửa ảnh thông minh với Microsoft Paint nhờ AI Vietnet24h - Microsoft Paint không ngừng cải tiến với sự ra mắt của Generative Fill và Generative Erase. Hai tính năng mới này giúp người dùng dễ dàng thêm hoặc xóa các chi tiết trong ảnh, mang lại trải nghiệm chỉnh sửa ảnh phong phú và trực quan hơn bao giờ hết.
Nút bấm mới trên iPhone 17 Pro: Tích hợp âm lượng và Action Vietnet24h - Thông tin từ các nguồn đáng tin cậy cho thấy iPhone 17 Pro có thể ra mắt với nút bấm đa năng, thay thế cho nút Action và âm lượng riêng biệt, hứa hẹn mang lại trải nghiệm người dùng mới lạ.
Phiên bản iPhone nào đủ sức chạy Apple Intelligence? Vietnet24h - Apple vừa đưa ra thông tin về dung lượng bộ nhớ mà các mẫu iPhone cần để hỗ trợ tính năng Apple Intelligence, cho biết tối thiểu 4 GB dung lượng trống là cần thiết và dự kiến sẽ tăng lên trong tương lai. Điều này được đề cập trong tài liệu hướng dẫn mới nhất của hãng dành cho bản cập nhật iOS 18.1 Developer Beta 5.
Meta phát hành mô hình AI mới Llama 4 Vietnet24h - Meta Platforms đã phát hành phiên bản mới nhất của mô hình ngôn ngữ lớn (LLM) Llama vào thứ Bảy, được gọi là Llama 4 Scout và Llama 4 Maverick.
Cerebras Systems, Ranovus giành được hợp đồng quân sự trị giá 45 triệu đô la của Hoa Kỳ để đẩy nhanh kết nối chip Vietnet24h - Cerebras Systems, một công ty chip AI có trụ sở tại Thung lũng Silicon và công ty khởi nghiệp chip Canada Ranovus cho biết hôm thứ Ba (1/4) rằng, họ đã được quân đội Hoa Kỳ trao hợp đồng trị giá 45 triệu đô la để tăng tốc kết nối giữa các chip điện toán.
iOS 19 lộ diện tại WWDC 2025: Bản cập nhật quan trọng nhất của iPhone Vietnet24h - WWDC 2025 sẽ là nơi Apple chính thức công bố iOS 19 – phiên bản hứa hẹn sẽ thay đổi cách người dùng tương tác với iPhone, với thiết kế trong suốt và tinh tế hơn bao giờ hết.
Alibaba ra mắt mô hình AI nguồn mở mới cho 'các tác nhân AI tiết kiệm chi phí' Vietnet24h - Công ty cho biết “Qwen2.5-Omni-7B” mới là một mô hình đa phương thức có thể xử lý văn bản, hình ảnh, âm thanh và video, đồng thời tạo ra văn bản thời gian thực và phản hồi giọng nói tự nhiên.
Việt Nam cho phép sử dụng dịch vụ internet vệ tinh Starlink của SpaceX Vietnet24h - Chính phủ Việt Nam cho biết sẽ cho phép SpaceX triển khai dịch vụ internet vệ tinh Starlink của mình trên cơ sở thử nghiệm tại nước ta.
TSMC giới thiệu liên doanh đúc Intel với Nvidia, AMD và Broadcom Vietnet24h - TSMC đã chào hàng các nhà thiết kế chip của Hoa Kỳ là Nvidia, Advanced Micro Devices và Broadcom về việc nắm giữ cổ phần trong một liên doanh sẽ vận hành các nhà máy của Intel, theo bốn nguồn tin quen thuộc với vấn đề này.
Microsoft phát triển các mô hình lý luận AI để cạnh tranh với OpenAI Vietnet24h - Microsoft đang phát triển các mô hình lý luận trí tuệ nhân tạo nội bộ để cạnh tranh với OpenAI và có thể bán chúng cho các nhà phát triển.
Nỗ lực phát triển robot của Samsung đạt được thành công với sự chấp thuận cuối cùng cho Rainbow Robotics Vietnet24h - Samsung Electronics đã nhận được sự chấp thuận cuối cùng từ cơ quan quản lý chống độc quyền của Hàn Quốc để mua lại Rainbow Robotics, mở đường cho gã khổng lồ công nghệ mở rộng hoạt động kinh doanh robot sang robot hình người.
Từ Galaxy AI đến hệ sinh thái phần mềm thông minh: Samsung khẳng định vị thế dẫn đầu tại MWC 2025 Vietnet24h - Tại Đại hội Thế giới Di động (MWC) 2025 ở Bacelona, Samsung giới thiệu những đột phá mới nhất về Galaxy AI và các giải pháp phần mềm toàn diện, trao quyền cho các nhà mạng khai thác tối đa lợi ích từ công nghệ AI.
Cổ phiếu Alibaba tăng vọt sau khi gã khổng lồ công nghệ Trung Quốc ra mắt đối thủ mới của DeepSeek Vietnet24h - Gã khổng lồ công nghệ Trung Quốc Alibaba cho biết mô hình suy luận AI mới nhất của họ, QwQ-32B, "có thể sánh ngang với mô hình suy luận tiên tiến, ví dụ như DeepSeek-R1".
Kim loại lỏng: Apple đang thử nghiệm cho iPhone gập, bền hơn titan 2,5 lần Vietnet24h - Công nghệ bản lề kim loại lỏng có thể giúp iPhone gập không chỉ bền hơn mà còn có thiết kế sang trọng hơn. Liệu đây có phải là bước tiến lớn trong công nghệ smartphone gập?
Apple áp dụng kim loại lỏng cho iPhone gập, mở ra kỷ nguyên mới Vietnet24h - Apple được cho là sẽ sử dụng kim loại lỏng để chế tạo bản lề cho iPhone gập, giúp tăng độ bền và hạn chế nếp gấp màn hình. Công nghệ này có thể tạo ra bước đột phá trên thị trường smartphone gập.
Amazon sẽ mang công nghệ quét lòng bàn tay đến các cơ sở y tế NYU Langone Vietnet24h - Bệnh nhân của NYU Langone Health sẽ có thể đăng ký lịch hẹn bằng Amazon One, công nghệ quét lòng bàn tay của công ty.
Lenovo hé lộ máy tính xách tay màn hình gập chạy bằng năng lượng mặt trời trong khái niệm mới nhất Vietnet24h - Lenovo đã tiết lộ khái niệm Lenovo ThinkBook ‘flip’, một chiếc máy tính xách tay có màn hình có thể gập lại. Khi mở hoàn toàn, toàn màn hình có kích thước 18 inch.
Meta công bố kính thông minh nghiên cứu thử nghiệm Aria Gen 2 Vietnet24h - Meta đã tiết lộ phiên bản mới nhất của loại kính thử nghiệm nhằm hỗ trợ nghiên cứu về trí tuệ nhân tạo, robot và nhận thức của máy móc.
Smartphone gập ba: Samsung chạm đỉnh công nghệ, người dùng chạm đáy túi tiền Vietnet24h - Với tham vọng thay đổi cách người dùng trải nghiệm thiết bị di động, Samsung sắp ra mắt điện thoại gập ba. Dù mang thiết kế tiên phong, giá bán lên đến 2.800 USD sẽ là rào cản lớn để sản phẩm đến tay người dùng đại chúng.
Samsung Display sẽ ra mắt màn hình gập 18,1 inch tại CES Vietnet24h - Samsung Display cho biết hôm Chủ Nhật rằng họ sẽ ra mắt màn hình OLED có thể gập 18,1 inch đầu tiên trên thế giới tại CES 2025, dự kiến ​​sẽ khai mạc vào thứ Ba (7/1) tại Las Vegas.
Khí quyển của TRAPPIST-1: một phát hiện thú vị về sự tồn tại sự sống ngoài trái đất Vietnet24h - TRAPPIST-1b, hành tinh cách Trái đất 40 năm ánh sáng, đã gây bất ngờ khi các nhà khoa học phát hiện rằng nó có khí quyển dày đặc và một lớp sương mù đặc biệt, mở ra triển vọng mới trong nghiên cứu sự sống ngoài hành tinh.
Elon Musk biến Texas thành trung tâm không gian mới: Starbase và những giấc mơ vũ trụ Vietnet24h - Elon Musk đang làm một điều chưa từng có: biến một vùng đất xa xôi tại Texas thành một thị trấn vũ trụ mang tên Starbase. Với dự án này, ông không chỉ mong muốn tạo ra một cộng đồng phục vụ cho SpaceX mà còn muốn mở ra một kỷ nguyên mới cho ngành công nghiệp không gian, với tầm nhìn đưa con người lên Sao Hỏa.
Parker Solar Probe: Tàu vũ trụ “siêu tốc” của NASA chính thức đến gần mặt trời nhất Vietnet24h - NASA vừa thực hiện một bước tiến quan trọng trong sứ mệnh khám phá vũ trụ, khi tàu thăm dò Parker Solar Probe đã tiến gần mặt trời hơn bao giờ hết. Cùng với đó, tàu vũ trụ này cũng lập kỷ lục mới về tốc độ, giúp giải quyết nhiều câu hỏi lâu dài về nguồn gốc gió mặt trời và vầng nhật hoa.