Kinh tế
Rủi ro của việc giảm dần dữ liệu văn bản đối với AI
Mộc Đức - Thứ Hai, 10/06/2024 10:49 SA
Vietnet24h - Việc dữ liệu văn bản do con người tạo ra ngày càng trở nên khan hiếm có thể gây rủi ro lớn đối với khả năng phát triển của công nghệ AI. Thông tin này được thể hiện trong báo cáo mới từ Fortune, với sự lo lắng cao độ về thách thức 'Nút thắt cổ chai' đối với các gã khổng lồ công nghệ.
Trong bối cảnh cuộc đua công nghệ AI đang diễn ra sôi động, một thách thức mới đã xuất hiện trên chân trời: 'Nút thắt cổ chai' đang đặt ra những rủi ro không nhỏ cho các gã khổng lồ công nghệ như Google và Meta. Theo một báo cáo mới từ Fortune, dữ liệu văn bản do con người tạo ra đang dần trở nên khan hiếm, đe dọa đến khả năng phát triển của AI.
 
Nhóm nghiên cứu Epoch, trong báo cáo công bố ngày 6/6, cảnh báo rằng vào khoảng năm 2026-2032, các công ty có thể sẽ đối mặt với tình trạng hết dữ liệu để đào tạo AI. AI tạo sinh (GenAI) đang được coi là "cơn sốt vàng" mới, nhưng cuộc chạy đua khai thác dữ liệu có thể khiến nguồn tài nguyên này cạn kiệt nhanh chóng.
 
Trong ngắn hạn, các công ty như OpenAI và Google đang nỗ lực bảo vệ nguồn dữ liệu của mình, thậm chí không ngần ngại chi trả để tiếp cận dữ liệu chất lượng cao cho việc đào tạo AI. Hình ảnh CEO OpenAI Sam Altman và CEO Microsoft Satya Nadella tại một sự kiện của OpenAI vào tháng 6/2023 là minh chứng cho mối quan hệ hợp tác sâu rộng giữa các công ty hàng đầu trong lĩnh vực này.
 
Tamay Besiroglu, tác giả chính của nghiên cứu, nhấn mạnh rằng trong tương lai, sẽ không còn đủ nguồn dữ liệu mới từ các bài viết, blog, tin tức và bình luận trên mạng xã hội để duy trì đà tăng trưởng của AI. Ông cảnh báo rằng khi thông tin nhạy cảm hoặc riêng tư không thể sử dụng, "nút thắt cổ chai" sẽ ngày càng trở nên rõ ràng.
 
Besiroglu cũng đưa ra quan điểm: "Nếu chúng ta gặp hạn chế về lượng dữ liệu, việc mở rộng các mô hình AI sẽ trở nên bất khả thi." Các nghiên cứu chỉ ra rằng, dữ liệu chất lượng cao dưới dạng văn bản có thể sẽ không đủ để "nuôi" cỗ máy AI vào năm 2026, đặt ra một thách thức lớn cho các công ty như OpenAI, Google, Meta và Microsoft trong cuộc đua AI.
 
Tuy nhiên, không phải tất cả đều đồng tình với quan điểm về "nút thắt cổ chai" trong ngành AI. Nicolas Papernot, phó giáo sư về kỹ thuật máy tính tại Đại học Toronto, cho rằng: "Chúng ta không nhất thiết phải đào tạo các mô hình ngày càng lớn hơn. Có thể phát triển các hệ thống AI chuyên biệt cho từng nhiệm vụ cụ thể." Ông cũng bày tỏ lo ngại rằng việc đào tạo nhiều hệ thống AI trên cùng một kho dữ liệu có thể làm giảm hiệu suất mô hình, thậm chí dẫn đến "sụp đổ mô hình". Ông cảnh báo rằng việc đào tạo AI dựa trên dữ liệu do chính nó tạo ra có thể làm sâu thêm những sai lầm của trí tuệ nhân tạo, như phân biệt chủng tộc và sai lệch thông tin.
Selena Deckelmann, Giám đốc sản phẩm và công nghệ của Wikipedia, nhấn mạnh: "Con người đang tạo ra một dạng tài nguyên mới - dữ liệu. Tại Wikipedia, chúng tôi đặt ra hạn chế đối với cách các công ty sử dụng nội dung do con người biên soạn, nhằm bảo vệ nguồn dữ liệu và khuyến khích tình nguyện viên tiếp tục đóng góp nội dung chất lượng cao." Bà cũng chỉ ra rằng điều quan trọng là làm sao để nội dung do con người tạo ra không chỉ tồn tại mà còn được truy cập một cách công bằng.
 
Nhóm nghiên cứu Epoch cũng đưa ra quan điểm rằng việc các công ty trả tiền cho hàng triệu người tạo văn bản có thể không phải là giải pháp tiết kiệm chi phí. OpenAI đang tiếp cận vấn đề này theo một cách mới: CEO Sam Altman đã tuyên bố sử dụng dữ liệu tổng hợp để đào tạo AI tại một sự kiện của Liên Hợp Quốc. Dữ liệu tổng hợp bao gồm cả nội dung do con người và AI tạo ra, kể cả những nội dung kém chất lượng.
 
Altman không phủ nhận những thách thức liên quan đến việc này. Ông nhấn mạnh rằng các công ty như OpenAI cần phải cân nhắc việc giảm bớt sự phụ thuộc vào dữ liệu và tập trung vào việc cải thiện mô hình AI. "Sẽ có những điều bất ngờ xảy ra nếu chúng ta đào tạo mô hình AI dựa trên kho dữ liệu tổng hợp," Altman nói. "Chưa chắc chắn liệu sáng kiến này có mang lại hiệu quả tốt hay không."

Cuộc đua công nghệ AI đang đối mặt với một nút thắt cổ chai nghiêm trọng - sự khan hiếm dữ liệu văn bản do con người tạo ra. Điều này đặt ra thách thức lớn cho các công ty công nghệ, đặc biệt là các gã khổng lồ như Google và Meta, khi họ phụ thuộc vào dữ liệu chất lượng cao để phát triển AI. Để vượt qua nút thắt này, các công ty cần phải sáng tạo trong việc thu thập, xử lý và sử dụng dữ liệu. Điều này có thể bao gồm việc đầu tư vào công nghệ tổng hợp dữ liệu, hợp tác với các tổ chức phi lợi nhuận để thu thập dữ liệu cộng đồng, hoặc phát triển các giải pháp AI có khả năng học hiệu quả với lượng dữ liệu nhỏ hơn. Ngoài ra, cần phải chú trọng đến việc đảm bảo quyền riêng tư và bảo mật dữ liệu, đồng thời thúc đẩy sự phát triển của các tiêu chuẩn đạo đức trong lĩnh vực AI.
OPPO công bố cam kết giúp mọi người có thể sử dụng điện thoại AI, mang các tính năng AI sáng tạo đến khoảng 50 triệu người dùng vào năm 2024 Vietnet24h - Được thúc đẩy bởi niềm tin rằng điện thoại thông minh là thiết bị AI cá nhân quan trọng nhất, OPPO đang đưa AI tổng hợp vào tất cả các dòng sản phẩm điện thoại thông minh OPPO khi hãng cam kết mang điện thoại AI đến với mọi người.
Sự thật đằng sau AI: một cảnh báo từ những người trong cuộc Vietnet24h - Trong bối cảnh công nghệ AI đang phát triển với tốc độ chóng mặt, một nhóm gồm 13 chuyên gia và cựu chuyên gia đến từ OpenAI và Google DeepMind đã lên tiếng, bày tỏ quan ngại sâu sắc về việc các công ty hàng đầu trong lĩnh vực này đang giữ kín thông tin quan trọng liên quan đến những rủi ro tiềm ẩn của AI.
Tin khác cùng chuyên mục
Tin đọc nhiều
Cổ phiếu Tesla tăng 22% vào tháng 5 khi Elon Musk kết thúc thời gian với DOGE của Trump Vietnet24h - Cổ phiếu của hãng sản xuất ô tô Tesla do Elon Musk đứng đầu đã tăng giá vào tháng 5 mặc dù doanh số bán ô tô của công ty tại Trung Quốc và Châu Âu không mấy khả quan.
Apple, Huawei, Xiaomi dẫn đầu bảng xếp hạng 500 thương hiệu tiêu dùng hàng đầu của Trung Quốc Vietnet24h - Theo báo cáo của Đại học Bắc Kinh, bảng xếp hạng này dựa trên hành vi mua sắm trực tuyến của người tiêu dùng trong nước
Cổ phiếu Sony tăng trong phiên giao dịch đầy biến động khi nhà sản xuất PlayStation công bố mua lại cổ phiếu trị giá 1,7 tỷ đô la Vietnet24h - Thu nhập hoạt động trong ba tháng cuối năm tài chính đạt 203,6 tỷ yên, vượt qua ước tính trung bình của các nhà phân tích là 192,2 tỷ yên, mặc dù giảm 11% so với cùng kỳ năm ngoái.
Cổ phiếu Nvidia tăng sau báo cáo Trump sẽ chấm dứt lệnh hạn chế xuất khẩu chip Vietnet24h - Cổ phiếu Nvidia tăng sau báo cáo cho biết chính quyền Trump có kế hoạch sửa đổi một loạt các hạn chế về thương mại chip được gọi là quy tắc “khuyến khích AI”.
Cổ phiếu Arm giảm do dự báo yếu Vietnet24h - Arm đạt được doanh thu và lợi nhuận cao nhưng lại đưa ra dự báo đáng thất vọng trong báo cáo quý vào thứ Tư (7/5).
CEO Tim Cook cho biết thuế quan của Trump có thể khiến Apple mất 900 triệu đô la trong quý này Vietnet24h - Thuế quan có thể làm tăng thêm 900 triệu đô la vào chi phí của Apple trong quý này, CEO Apple Tim Cook cho biết hôm thứ Năm (1/5), khi ông tiết lộ rằng gã khổng lồ công nghệ này đang chuyển hoạt động sản xuất iPhone được bán tại Hoa Kỳ từ Trung Quốc sang Ấn Độ.
Cổ phiếu Meta tăng nhờ doanh thu quý đầu tiên cao hơn dự kiến Vietnet24h - Cổ phiếu Meta tăng tới 5% sau khi công ty báo cáo doanh thu trong quý đầu tiên cao hơn dự kiến.
Intel dự báo tăng trưởng yếu và sẽ cắt giảm chi phí trong năm nay Vietnet24h - Intel báo cáo thu nhập quý đầu tiên vượt kỳ vọng ở cả doanh thu và lợi nhuận, nhưng công ty đã đưa ra hướng dẫn đáng thất vọng.
Những nhà lãnh đạo công nghệ này đã quyên góp cho Trump và bây giờ họ mất hàng tỷ đô la Vietnet24h - Các nhà lãnh đạo Thung lũng Silicon đã quyên góp cho chiến dịch tranh cử hoặc quỹ nhậm chức của Tổng thống Donald Trump.
TSMC giữ nguyên dự báo doanh thu sau khi lợi nhuận vượt ước tính bất chấp lo ngại về thuế quan của Trump Vietnet24h - Công ty đang phải đối mặt với những bất lợi từ chính sách thương mại của Tổng thống Hoa Kỳ Donald Trump, người đã áp đặt mức thuế quan thương mại rộng rãi đối với Đài Loan và kiểm soát xuất khẩu chặt chẽ hơn đối với các khách hàng của TSMC là Nvidia và AMD.
Trung Quốc và cuộc cách mạng thú cưng AI: Công nghệ đang lấp đầy khoảng trống cảm xúc Vietnet24h - Khi robot không còn chỉ là công cụ lao động mà trở thành bạn đồng hành, Trung Quốc đang chứng kiến sự trỗi dậy mạnh mẽ của thú cưng AI – từ đồ chơi tinh vi cho giới trẻ đến trợ thủ đắc lực cho người già và trẻ nhỏ. Xu hướng này không chỉ phản ánh nhu cầu gắn kết trong xã hội hiện đại mà còn mở ra một tương lai nơi cảm xúc được số hóa và công nghệ trở thành liệu pháp tâm lý.
Trung Quốc phản bác cáo buộc của Trump về việc vi phạm thỏa thuận thương mại Geneva Vietnet24h - Trung Quốc đã phản bác lại lời cáo buộc của Washington rằng nước này đã vi phạm thỏa thuận Geneva.
Chủ tịch nước Lương Cường chủ trì lễ đón Tổng thống Cộng hòa Pháp Emmanuel Macron Vietnet24h - Sáng 26/5, tại Phủ Chủ tịch, Chủ tịch nước Lương Cường và Phu nhân đã chủ trì Lễ đón Tổng thống Emmanuel Macron và Phu nhân thăm cấp Nhà nước tới Việt Nam.
Trí tuệ nhân tạo chưa giúp tăng năng suất hay lương thưởng – lỗi tại công nghệ hay tại cách dùng? Vietnet24h - Việc ứng dụng AI trong doanh nghiệp đang tăng nhanh, nhưng hiệu quả ghi nhận vẫn khiêm tốn. Nhiều chuyên gia cho rằng vấn đề không nằm ở khả năng của AI, mà ở cách doanh nghiệp phân bổ lại giá trị gia tăng do công nghệ tạo ra.
Việt Nam thành “mặt trận nóng” trong chiến tranh mạng kiểu mới: Brute-force, RDP và mối đe dọa ẩn danh Vietnet24h - Số vụ tấn công vét cạn vào các hệ thống doanh nghiệp tại Việt Nam đã vượt 19,8 triệu – cao nhất Đông Nam Á. Đây không chỉ là dấu hiệu về sự quan tâm của tin tặc quốc tế, mà còn phản ánh khoảng trống đáng báo động trong hệ thống phòng thủ mạng hiện tại, đặc biệt khi các công cụ tấn công ngày càng “tiến hóa” nhờ trí tuệ nhân tạo.
Seoul, Washington sẽ nối lại đàm phán thuế quan trước thời hạn tháng 7 Vietnet24h - Hàn Quốc và Hoa Kỳ đã tổ chức một cuộc họp thương mại song phương vào thứ Sáu để theo dõi các cuộc đàm phán thuế quan gần đây, thảo luận về các bước tiếp theo hướng tới một gói thương mại chung mà cả hai bên đều đặt mục tiêu hoàn tất vào ngày 8 tháng 7.
Google sẽ trả cho Texas 1,4 tỷ đô la để giải quyết vấn đề bảo mật dữ liệu Vietnet24h - Google đã đồng ý trả gần 1,4 tỷ đô la cho tiểu bang Texas để giải quyết các cáo buộc vi phạm quyền riêng tư dữ liệu của cư dân tiểu bang, Tổng chưởng lý Texas Ken Paxton cho biết.
Các quan chức của Trump sẽ gặp Trung Quốc, báo hiệu sự cởi mở trong đàm phán thương mại Vietnet24h - Hai quan chức cấp cao của chính quyền Trump dự kiến ​​sẽ họp vào cuối tuần này với các đại diện Trung Quốc về các vấn đề thương mại và kinh tế.
Đằng sau 30 triệu dữ liệu cá nhân bị xâm phạm: Ai đang đứng sau những cuộc gọi rác? Vietnet24h - Tưởng chừng là những tin nhắn quảng cáo vô hại, song phía sau hàng triệu cuộc gọi rác mỗi ngày là một hệ sinh thái thu thập, buôn bán dữ liệu cá nhân đã tồn tại âm thầm nhiều năm. Việc xóa 30 triệu dữ liệu chỉ là phần nổi của tảng băng chìm.
Phó Thủ tướng kiêm Bộ trưởng Giáo dục Lee Ju-ho đã trở thành tổng thống tạm quyền mới của Hàn Quốc Vietnet24h - Bắt đầu từ hôm nay, thứ Sáu (2/5), Phó Thủ tướng kiêm Bộ trưởng Giáo dục Lee Ju-ho đã trở thành tổng thống tạm quyền mới của Hàn Quốc
Meta tìm đến trọng tài để ngăn chặn người tố giác quảng bá cuốn sách tiết lộ tất cả Vietnet24h - Meta đang tìm cách ngăn chặn việc quảng bá cuốn hồi ký mới của một cựu nhân viên có nội dung mô tả công ty theo hướng không hay, bao gồm cả cáo buộc quấy rối tình dục của giám đốc chính sách công ty.
KT kết hợp AI với thể thao, K-pop tại Đại hội Thế giới Di động (MWC) 2025 Vietnet24h - K-Stadium được thiết kế để tăng cường sự tương tác của người hâm mộ bằng AI. Một trong những tính năng chính của nó là hệ thống dịch phụ đề thời gian thực do AI hỗ trợ.
Amazon sẽ giành quyền kiểm soát sáng tạo cho loạt phim James Bond từ gia đình Broccoli Vietnet24h - Amazon sắp giành được quyền sáng tạo đối với loạt phim James Bond béo bở.
Squid Game mùa 2: Cơn sốt hay bẫy lừa đảo tiền số? Vietnet24h - Với sự phổ biến của Squid Game mùa hai, các token liên quan đến bộ phim này đã thu hút hàng triệu USD. Tuy nhiên, không ít nhà đầu tư đã mất trắng khi các token này bị sụt giảm giá trị chỉ trong thời gian ngắn, báo hiệu một làn sóng lừa đảo "rút thảm" trên thị trường tiền số.
Lễ chùa thời công nghệ: Nhật Bản số hóa nghi lễ đầu năm Vietnet24h - Chùa Zojoji, biểu tượng Phật giáo tại Tokyo, đang tiên phong tích hợp công nghệ thanh toán QR cho nghi lễ Saisen, vừa tiện lợi vừa giữ nguyên tinh thần truyền thống.
TikTok gặp rắc rối tại Nga: bị phạt vì không gỡ nội dung cấm Vietnet24h - Vừa qua, TikTok bị phạt gần 30.000 USD tại Nga vì vi phạm các quy định pháp lý về nội dung. Quyết định này cho thấy Nga đang quyết liệt hơn trong việc kiểm soát các nền tảng mạng xã hội.
Hoàn thiện hạ tầng viễn thông tại làng Nủ sau thảm họa lũ quét Vietnet24h - Vừa qua, nhà mạng VNPT đã chính thức khởi công lắp đặt trạm phát sóng di động (BTS) tại khu vực xây dựng bản tái định cư mới cho người dân thôn Làng Nủ, huyện Bảo Yên, tỉnh Lào Cai.
Thành công rực rỡ: Black Myth - Wukong thu về gần 1 tỷ USD Vietnet24h - Black Myth: Wukong, tựa game hành động nhập vai của Game Science, đã ghi dấu ấn mạnh mẽ trên thị trường game quốc tế, với doanh thu gần chạm ngưỡng 1 tỷ USD chỉ sau hai tuần ra mắt.
Trải nghiệm âm nhạc kết hợp công nghệ đỉnh cao của Galaxy AI Immersive Vietnet24h - Sự kiện hoành tráng chào đón thế hệ điện thoại gập mới Galaxy Z Fold6 và Galaxy Z Flip6 - nơi âm nhạc và công nghệ hội tụ, thể hiện vị thế tiên phong dẫn đầu kỷ nguyên AI mới đã bùng nổ với 50.000 người tham gia.
Tùng Tán Lâm - Vẻ đẹp thiêng liêng giữa lòng Shangri-La Vietnet24h - Đối với những tín đồ đam mê du lịch tâm linh, tu viện Tùng Tán Lâm (Songzanlin) là một điểm đến không thể bỏ qua. Những người từng đặt chân đến Shangri-la đều khẳng định đây là một trong những tu viện đáng ghé thăm nhất trên thế giới.