Tài chính, Kinh doanh
Rủi ro của việc giảm dần dữ liệu văn bản đối với AI
Mộc Đức - Thứ Hai, 10/06/2024 10:49 SA
Vietnet24h - Việc dữ liệu văn bản do con người tạo ra ngày càng trở nên khan hiếm có thể gây rủi ro lớn đối với khả năng phát triển của công nghệ AI. Thông tin này được thể hiện trong báo cáo mới từ Fortune, với sự lo lắng cao độ về thách thức 'Nút thắt cổ chai' đối với các gã khổng lồ công nghệ.
Trong bối cảnh cuộc đua công nghệ AI đang diễn ra sôi động, một thách thức mới đã xuất hiện trên chân trời: 'Nút thắt cổ chai' đang đặt ra những rủi ro không nhỏ cho các gã khổng lồ công nghệ như Google và Meta. Theo một báo cáo mới từ Fortune, dữ liệu văn bản do con người tạo ra đang dần trở nên khan hiếm, đe dọa đến khả năng phát triển của AI.
 
Nhóm nghiên cứu Epoch, trong báo cáo công bố ngày 6/6, cảnh báo rằng vào khoảng năm 2026-2032, các công ty có thể sẽ đối mặt với tình trạng hết dữ liệu để đào tạo AI. AI tạo sinh (GenAI) đang được coi là "cơn sốt vàng" mới, nhưng cuộc chạy đua khai thác dữ liệu có thể khiến nguồn tài nguyên này cạn kiệt nhanh chóng.
 
Trong ngắn hạn, các công ty như OpenAI và Google đang nỗ lực bảo vệ nguồn dữ liệu của mình, thậm chí không ngần ngại chi trả để tiếp cận dữ liệu chất lượng cao cho việc đào tạo AI. Hình ảnh CEO OpenAI Sam Altman và CEO Microsoft Satya Nadella tại một sự kiện của OpenAI vào tháng 6/2023 là minh chứng cho mối quan hệ hợp tác sâu rộng giữa các công ty hàng đầu trong lĩnh vực này.
 
Tamay Besiroglu, tác giả chính của nghiên cứu, nhấn mạnh rằng trong tương lai, sẽ không còn đủ nguồn dữ liệu mới từ các bài viết, blog, tin tức và bình luận trên mạng xã hội để duy trì đà tăng trưởng của AI. Ông cảnh báo rằng khi thông tin nhạy cảm hoặc riêng tư không thể sử dụng, "nút thắt cổ chai" sẽ ngày càng trở nên rõ ràng.
 
Besiroglu cũng đưa ra quan điểm: "Nếu chúng ta gặp hạn chế về lượng dữ liệu, việc mở rộng các mô hình AI sẽ trở nên bất khả thi." Các nghiên cứu chỉ ra rằng, dữ liệu chất lượng cao dưới dạng văn bản có thể sẽ không đủ để "nuôi" cỗ máy AI vào năm 2026, đặt ra một thách thức lớn cho các công ty như OpenAI, Google, Meta và Microsoft trong cuộc đua AI.
 
Tuy nhiên, không phải tất cả đều đồng tình với quan điểm về "nút thắt cổ chai" trong ngành AI. Nicolas Papernot, phó giáo sư về kỹ thuật máy tính tại Đại học Toronto, cho rằng: "Chúng ta không nhất thiết phải đào tạo các mô hình ngày càng lớn hơn. Có thể phát triển các hệ thống AI chuyên biệt cho từng nhiệm vụ cụ thể." Ông cũng bày tỏ lo ngại rằng việc đào tạo nhiều hệ thống AI trên cùng một kho dữ liệu có thể làm giảm hiệu suất mô hình, thậm chí dẫn đến "sụp đổ mô hình". Ông cảnh báo rằng việc đào tạo AI dựa trên dữ liệu do chính nó tạo ra có thể làm sâu thêm những sai lầm của trí tuệ nhân tạo, như phân biệt chủng tộc và sai lệch thông tin.
Selena Deckelmann, Giám đốc sản phẩm và công nghệ của Wikipedia, nhấn mạnh: "Con người đang tạo ra một dạng tài nguyên mới - dữ liệu. Tại Wikipedia, chúng tôi đặt ra hạn chế đối với cách các công ty sử dụng nội dung do con người biên soạn, nhằm bảo vệ nguồn dữ liệu và khuyến khích tình nguyện viên tiếp tục đóng góp nội dung chất lượng cao." Bà cũng chỉ ra rằng điều quan trọng là làm sao để nội dung do con người tạo ra không chỉ tồn tại mà còn được truy cập một cách công bằng.
 
Nhóm nghiên cứu Epoch cũng đưa ra quan điểm rằng việc các công ty trả tiền cho hàng triệu người tạo văn bản có thể không phải là giải pháp tiết kiệm chi phí. OpenAI đang tiếp cận vấn đề này theo một cách mới: CEO Sam Altman đã tuyên bố sử dụng dữ liệu tổng hợp để đào tạo AI tại một sự kiện của Liên Hợp Quốc. Dữ liệu tổng hợp bao gồm cả nội dung do con người và AI tạo ra, kể cả những nội dung kém chất lượng.
 
Altman không phủ nhận những thách thức liên quan đến việc này. Ông nhấn mạnh rằng các công ty như OpenAI cần phải cân nhắc việc giảm bớt sự phụ thuộc vào dữ liệu và tập trung vào việc cải thiện mô hình AI. "Sẽ có những điều bất ngờ xảy ra nếu chúng ta đào tạo mô hình AI dựa trên kho dữ liệu tổng hợp," Altman nói. "Chưa chắc chắn liệu sáng kiến này có mang lại hiệu quả tốt hay không."

Cuộc đua công nghệ AI đang đối mặt với một nút thắt cổ chai nghiêm trọng - sự khan hiếm dữ liệu văn bản do con người tạo ra. Điều này đặt ra thách thức lớn cho các công ty công nghệ, đặc biệt là các gã khổng lồ như Google và Meta, khi họ phụ thuộc vào dữ liệu chất lượng cao để phát triển AI. Để vượt qua nút thắt này, các công ty cần phải sáng tạo trong việc thu thập, xử lý và sử dụng dữ liệu. Điều này có thể bao gồm việc đầu tư vào công nghệ tổng hợp dữ liệu, hợp tác với các tổ chức phi lợi nhuận để thu thập dữ liệu cộng đồng, hoặc phát triển các giải pháp AI có khả năng học hiệu quả với lượng dữ liệu nhỏ hơn. Ngoài ra, cần phải chú trọng đến việc đảm bảo quyền riêng tư và bảo mật dữ liệu, đồng thời thúc đẩy sự phát triển của các tiêu chuẩn đạo đức trong lĩnh vực AI.
OPPO công bố cam kết giúp mọi người có thể sử dụng điện thoại AI, mang các tính năng AI sáng tạo đến khoảng 50 triệu người dùng vào năm 2024 Vietnet24h - Được thúc đẩy bởi niềm tin rằng điện thoại thông minh là thiết bị AI cá nhân quan trọng nhất, OPPO đang đưa AI tổng hợp vào tất cả các dòng sản phẩm điện thoại thông minh OPPO khi hãng cam kết mang điện thoại AI đến với mọi người.
Sự thật đằng sau AI: một cảnh báo từ những người trong cuộc Vietnet24h - Trong bối cảnh công nghệ AI đang phát triển với tốc độ chóng mặt, một nhóm gồm 13 chuyên gia và cựu chuyên gia đến từ OpenAI và Google DeepMind đã lên tiếng, bày tỏ quan ngại sâu sắc về việc các công ty hàng đầu trong lĩnh vực này đang giữ kín thông tin quan trọng liên quan đến những rủi ro tiềm ẩn của AI.
Tin khác cùng chuyên mục
Tin đọc nhiều
Samsung dự báo lợi nhuận quý 4 đạt mức kỷ lục nhưng các nhà phân tích dự đoán lợi nhuận từ mảng điện thoại thông minh sẽ thấp hơn. Vietnet24h - Các mảng kinh doanh di động của Samsung Electronics dự kiến ​​sẽ báo cáo lợi nhuận quý IV thấp hơn so với dự kiến ​​trước đó, ngay cả khi lợi nhuận toàn tập đoàn đạt mức cao kỷ lục nhờ chu kỳ tăng trưởng mạnh mẽ của chip nhớ.
LG ghi nhận khoản lỗ hàng quý đầu tiên kể từ năm 2016 bất chấp doanh thu hàng năm đạt kỷ lục Vietnet24h - LG Electronics báo cáo doanh thu cao kỷ lục trong năm 2025 nhưng lại ghi nhận khoản lỗ hoạt động hàng quý đầu tiên trong chín năm, do cạnh tranh giá cả trên thị trường TV cao cấp làm giảm lợi nhuận của mảng màn hình.
Samsung phá kỷ lục lợi nhuận nhờ sự bùng nổ của thị trường bộ nhớ Vietnet24h - Ông lớn ngành chip dự báo lợi nhuận hoạt động quý 4 đạt 20 nghìn tỷ bảng Anh khi cổ phiếu đạt mức cao nhất trong 52 tuần.
Cổ phiếu các công ty liên quan đến hệ thống làm mát trung tâm dữ liệu giảm giá sau phát ngôn của CEO Nvidia Vietnet24h - Cổ phiếu của các công ty liên quan đến hệ thống sưởi, thông gió và điều hòa không khí của Mỹ đã giảm vào thứ Ba sau khi Giám đốc điều hành Nvidia, Jensen Huang, cho biết các chip sắp ra mắt của công ty có thể giảm đáng kể nhu cầu làm mát trong các trung tâm dữ liệu.
Doanh thu quý 4 của Foxconn tăng vọt 22% lên mức cao kỷ lục nhờ nhu cầu về trí tuệ nhân tạo (AI). Vietnet24h - Tập đoàn Foxconn của Đài Loan, nhà sản xuất điện tử theo hợp đồng lớn nhất thế giới, đã báo cáo doanh thu quý IV đạt mức kỷ lục vào thứ Hai (5/1), nhờ nhu cầu mạnh mẽ đối với các sản phẩm trí tuệ nhân tạo.
Cổ phiếu công ty sản xuất chip AI Biren của Trung Quốc tăng vọt trong phiên giao dịch đầu tư trực tuyến tại Hồng Kông Vietnet24h - Cổ phiếu của công ty thiết kế chip trí tuệ nhân tạo Trung Quốc Shanghai Biren Technology đã tăng 76% trong phiên giao dịch đầu tiên tại Hồng Kông vào thứ Sáu (2/1), đây là đợt niêm yết đầu tiên của trung tâm tài chính này trong năm 2026.
Đồng rupee suy yếu: tín hiệu cảnh báo từ một nền kinh tế đang trỗi dậy Vietnet24h - Năm 2025 khép lại với một nghịch lý đáng chú ý của kinh tế Ấn Độ: trong khi quốc gia Nam Á này tiếp tục được ca ngợi là “động cơ tăng trưởng mới của châu Á”, thì đồng tiền quốc gia – rupee – lại trở thành một trong những đồng tiền có diễn biến yếu nhất khu vực.
Cổ phiếu Oracle đang trên đà trải qua quý tồi tệ nhất kể từ năm 2001 khi các CEO mới đối mặt với những lo ngại về việc triển khai trí tuệ nhân tạo (AI). Vietnet24h - Cổ phiếu của Oracle đã giảm 30% trong quý này, hướng tới mức giảm mạnh nhất kể từ quý 3 năm 2001, khi nó giảm gần 34%.
Samsung (Harman) thâu tóm ADAS của ZF: Bước ngoặt chiến lược trong kỷ nguyên ô tô phần mềm Vietnet24h - Reuters công bố hôm 23/12/2025 cho biết Harman International, đơn vị thuộc Samsung Electronics, đã đồng ý mua lại mảng Hệ thống hỗ trợ lái xe tiên tiến (ADAS) của ZF Group (Đức) trị giá khoảng 1,5 tỷ euro (tương đương khoảng 1,8 tỷ USD).
Các hợp đồng thuê mặt bằng của Oracle tăng gần 150% khi công ty mở rộng cơ sở hạ tầng để đáp ứng nhu cầu về trí tuệ nhân tạo (AI). Vietnet24h - Oracle đang đồng thời lên kế hoạch chi tiêu vốn lớn hơn và ký kết các hợp đồng thuê để đáp ứng nhu cầu về cơ sở hạ tầng đám mây cho các khách hàng về trí tuệ nhân tạo như OpenAI.
Walmart hợp tác với Gemini của Google để giúp người mua sắm dễ dàng tìm kiếm và mua sản phẩm hơn. Vietnet24h - Walmart và Google hôm Chủ nhật cho biết hai công ty đang hợp tác để giúp người mua sắm dễ dàng tìm kiếm và mua các mặt hàng thông qua trợ lý trí tuệ nhân tạo Gemini của Google.
Ấn Độ đề xuất buộc các nhà sản xuất điện thoại thông minh phải cung cấp mã nguồn trong kế hoạch cải tổ an ninh Vietnet24h - Ấn Độ đề xuất yêu cầu các nhà sản xuất điện thoại thông minh chia sẻ mã nguồn với chính phủ và thực hiện một số thay đổi phần mềm như một phần của loạt biện pháp an ninh, điều này đã gây ra sự phản đối ngầm từ các gã khổng lồ như Apple và Samsung.
Meta đối mặt với cuộc điều tra của Trung Quốc về thương vụ mua lại công ty khởi nghiệp về trí tuệ nhân tạo Manus. Vietnet24h - Tháng trước, Meta đã mua lại Manus có trụ sở tại Singapore, khi gã khổng lồ công nghệ Mỹ tìm cách tích hợp tự động hóa tiên tiến vào các sản phẩm dành cho người tiêu dùng và doanh nghiệp của mình.
Microsoft được tiết lộ là công ty đứng sau đề xuất xây dựng trung tâm dữ liệu gây tranh cãi tại một thị trấn ở Michigan. Vietnet24h - Microsoft cho biết họ quan tâm đến việc xây dựng một trung tâm dữ liệu trên một khu đất nằm cạnh đường cao tốc liên bang bên ngoài Grand Rapids, Michigan.
Marvell mua lại công ty thiết bị mạng XConn với giá 540 triệu đô la trong bối cảnh thúc đẩy cơ sở hạ tầng trí tuệ nhân tạo (AI). Vietnet24h - Hôm thứ Ba (6/1), Marvell Technology tuyên bố sẽ mua lại nhà cung cấp thiết bị mạng XConn Technologies với giá trị khoảng 540 triệu đô la.
Công ty Starlink của Elon Musk cung cấp truy cập internet miễn phí tại Venezuela sau các cuộc không kích của Mỹ Vietnet24h - Starlink đã cung cấp dịch vụ internet miễn phí tại Venezuela sau cuộc đột kích của Mỹ bắt giữ Maduro.
Nhật Bản sẽ hỗ trợ phát triển robot trí tuệ nhân tạo cho ngành đóng tàu. Vietnet24h - Nhật Bản sẽ bắt đầu hỗ trợ phát triển robot sử dụng trí tuệ nhân tạo (AI) cho ngành đóng tàu trong nước trong năm nay, một phần trong nỗ lực giải quyết tình trạng thiếu lao động trong một ngành công nghiệp quan trọng đối với nền kinh tế quốc gia.
Mỹ cáo buộc luật mạng mới của Hàn Quốc sẽ ảnh hưởng tiêu cực đến hoạt động kinh doanh của các tập đoàn công nghệ lớn của Mỹ Vietnet24h - Những lời chỉ trích về việc sửa đổi luật làm gia tăng rủi ro xung đột thương mại.
Trung Quốc cáo buộc Hà Lan phạm sai lầm trong vụ việc liên quan đến nhà sản xuất chip Nexperia. Vietnet24h - Hôm thứ Tư (31/12), Trung Quốc kêu gọi Hà Lan "ngay lập tức sửa chữa sai lầm" liên quan đến nhà sản xuất chip Nexperia.
Một dự án của Hàn Quốc đặt mục tiêu bắt đầu sản xuất hàng loạt máy bay không người lái nội địa vào năm 2026. Vietnet24h - Công ty Airbility Inc., một doanh nghiệp Hàn Quốc chuyên về công nghệ di chuyển xanh, dự định bắt đầu sản xuất hàng loạt máy bay không người lái do chính mình sản xuất vào năm tới để mở rộng sự hiện diện trong ngành công nghiệp máy bay không người lái.
Khám phá những kiệt tác nổi tiếng của Henri Matisse, Salvador Dalí và Mark Rothko trên Samsung Art Store Vietnet24h - Samsung Electronics công bố bổ sung 15 tác phẩm nghệ thuật mới từ Tate vào Samsung Art Store.
ChatGPT, Claude, Gemini... lần đầu tiên tham dự thi đấu cờ vua Vietnet24h - Không còn là những chuyên gia viết luận hay trả lời phỏng vấn, các chatbot nổi tiếng lần đầu thi đấu cờ vua như những kỳ thủ thực thụ. Nhưng khi “bộ não ngôn ngữ” bước vào bàn cờ chiến thuật, chuyện đi sai luật hay “mắc bẫy ngớ ngẩn” là điều khó tránh khỏi.
Sự trỗi dậy của những “kỹ sư sân cỏ”: Khi chuyển nhượng bóng đá không còn là canh bạc cảm tính Vietnet24h - Trong suốt nhiều thập kỷ, các thương vụ chuyển nhượng cầu thủ thường được định đoạt bởi trực giác, mạng lưới cá nhân của giới tuyển trạch, hay đơn giản chỉ là tên tuổi và phong độ hiện tại của một cầu thủ. Nhưng bóng đá đang chuyển mình mạnh mẽ. Và ở thời điểm mà dữ liệu thống kê, trí tuệ nhân tạo và học máy ngày càng định hình cách chơi và cách mua bán, một “kỹ sư Microsoft” như Sudarshan Gopaladesikan trở thành biểu tượng cho một hình mẫu hoàn toàn mới: chuyên gia phân tích dữ liệu như mắt thần trong bóng tối, người biến canh bạc cảm tính thành chiến lược khoa học.
Bill Gates cho biết việc Trump cắt giảm ngân sách của USAID là vô cùng tàn khốc: 'Vẫn chưa quá muộn để đảo ngược chúng' Vietnet24h - Bill Gates cho biết tác động của việc Tổng thống Donald Trump cắt giảm USAID là "thảm khốc" nhưng có thể ngăn chặn được.
iPhone đang làm tổn thương giới trẻ? Người thiết kế ra nó lên tiếng Vietnet24h - Jony Ive, cha đẻ của iPhone, thừa nhận công nghệ smartphone đã dẫn đến những hậu quả đáng lo cho sức khỏe tâm thần. Cùng bà Powell Jobs, ông đang âm thầm phát triển một thiết bị mới để “sửa sai” cho chính di sản của mình.
Meta tìm đến trọng tài để ngăn chặn người tố giác quảng bá cuốn sách tiết lộ tất cả Vietnet24h - Meta đang tìm cách ngăn chặn việc quảng bá cuốn hồi ký mới của một cựu nhân viên có nội dung mô tả công ty theo hướng không hay, bao gồm cả cáo buộc quấy rối tình dục của giám đốc chính sách công ty.
KT kết hợp AI với thể thao, K-pop tại Đại hội Thế giới Di động (MWC) 2025 Vietnet24h - K-Stadium được thiết kế để tăng cường sự tương tác của người hâm mộ bằng AI. Một trong những tính năng chính của nó là hệ thống dịch phụ đề thời gian thực do AI hỗ trợ.
Amazon sẽ giành quyền kiểm soát sáng tạo cho loạt phim James Bond từ gia đình Broccoli Vietnet24h - Amazon sắp giành được quyền sáng tạo đối với loạt phim James Bond béo bở.
Squid Game mùa 2: Cơn sốt hay bẫy lừa đảo tiền số? Vietnet24h - Với sự phổ biến của Squid Game mùa hai, các token liên quan đến bộ phim này đã thu hút hàng triệu USD. Tuy nhiên, không ít nhà đầu tư đã mất trắng khi các token này bị sụt giảm giá trị chỉ trong thời gian ngắn, báo hiệu một làn sóng lừa đảo "rút thảm" trên thị trường tiền số.
Lễ chùa thời công nghệ: Nhật Bản số hóa nghi lễ đầu năm Vietnet24h - Chùa Zojoji, biểu tượng Phật giáo tại Tokyo, đang tiên phong tích hợp công nghệ thanh toán QR cho nghi lễ Saisen, vừa tiện lợi vừa giữ nguyên tinh thần truyền thống.