Tư vấn tiêu dùng
Công cụ thu thập dữ liệu Web của Meta giúp nâng cấp mô hình AI
Quán Chi - Thứ Năm, 22/08/2024 3:01 CH
Vietnet24h - Meta, gã khổng lồ công nghệ do Mark Zuckerberg sáng lập, đang âm thầm triển khai công cụ thu thập dữ liệu web với tên gọi Meta External Agent nhằm phục vụ việc huấn luyện các mô hình trí tuệ nhân tạo (AI) của mình. Theo nguồn tin từ Fortune, công cụ này bắt đầu hoạt động từ tháng trước và hiện đã thu hút sự chú ý của các chuyên gia công nghệ.
Meta External Agent hoạt động bằng cách sao chép và thu thập dữ liệu công khai từ mọi ngóc ngách của internet, bao gồm các bài viết trên trang tin tức, bình luận trên mạng xã hội, và nội dung từ các diễn đàn trực tuyến. Công cụ này tương tự như GPTBot của OpenAI, một phần mềm cũng được sử dụng để thu thập dữ liệu cho việc đào tạo AI.
Theo Dark Visitors, một công ty chuyên cung cấp công cụ chống bot, Meta External Agent có thể thu thập dữ liệu từ các trang web mà GPTBot bị chặn. Dữ liệu từ Dark Visitors cho thấy khoảng 25% các trang web phổ biến trên thế giới đã chặn GPTBot, trong khi chỉ có 2% trang web chặn Meta External Agent.
 
Dựa trên bản lưu Internet Archive từ cuối tháng 7, Meta đã cập nhật trang web dành cho nhà phát triển của mình, bao gồm thông tin về công cụ thu thập dữ liệu mới. Tuy nhiên, công ty của Zuckerberg vẫn chưa công khai thông tin chi tiết về Meta External Agent.
 
Phát ngôn viên của Meta đã xác nhận sự tồn tại của công cụ thu thập dữ liệu này, nhưng cho biết công cụ có tên gọi chính thức là Facebook External Hit và đã được sử dụng trong nhiều năm qua với nhiều tính năng khác nhau. "Chúng tôi, giống như các công ty khác, sử dụng dữ liệu công khai có sẵn trên mạng để huấn luyện các mô hình AI của mình," đại diện Meta cho biết.
 
Giới chuyên gia nhận định sự ra đời của Meta External Agent là minh chứng cho sự mở rộng không ngừng của kho dữ liệu mà Meta đang có. Công ty đang tích cực nâng cấp các mô hình ngôn ngữ lớn như LLaMA, mới nhất là LLaMA 3.1, đồng thời mở rộng hoạt động Meta AI. Meta dự kiến chi tới 40 tỷ USD trong năm nay cho các hoạt động liên quan đến cơ sở hạ tầng, chip AI, và các chi phí phát triển khác.
 
Sự đầu tư mạnh mẽ của Meta vào việc thu thập dữ liệu và nâng cấp AI cho thấy sự quyết tâm của công ty trong việc duy trì vị thế dẫn đầu trong lĩnh vực công nghệ trí tuệ nhân tạo.
Meta ra mắt AI Studio: Công cụ tự tạo chatbot AI cá nhân cho người dùng Messenger và Instagram Vietnet24h - Ngày 29/7, Meta công bố sự ra mắt của AI Studio, một công cụ sáng tạo cho phép người dùng trên các nền tảng của công ty, bao gồm Messenger và Instagram, tự tạo và thiết kế chatbot AI cá nhân hóa. Đây là một bước đi quan trọng trong việc nâng cao trải nghiệm người dùng và mở rộng khả năng sáng tạo trên mạng xã hội.
Tin khác cùng chuyên mục
Tin đọc nhiều
Samsung, Google, Qualcomm hợp tác để cạnh tranh với Apple trong cuộc đua XR Vietnet24h - Hôm thứ Tư tuần này (22/10), Samsung Electronics đã ra mắt Dự án Moohan, chiếc kính thực tế mở rộng được mong đợi từ lâu, đánh dấu bước tiến táo bạo của hãng vào cuộc đua công nghệ nhập vai đầy rủi ro mà Vision Pro của Apple đang thống trị.
Lần đầu tiên OpenAI “đánh thẳng” vào Google Chrome: trình duyệt AI mới và cơn sóng đầu tư toàn cầu Vietnet24h - OpenAI vừa chính thức phát hành trình duyệt web trên nền tảng trí tuệ nhân tạo mang tên ChatGPT Atlas — một bước đi rõ ràng nhằm thách thức vị thế thống trị của Google Chrome trong thị trường trình duyệt.
Honda Motor Co., Ltd. tung sản phẩm cắt cỏ “phi người lái” tại Mỹ – bước đột phá trong thiết bị cảnh quan chuyên nghiệp Vietnet24h - Hãng Honda vừa công bố sẽ ra mắt toàn cầu dòng máy cắt cỏ ngồi lái sử dụng pin mang tên ProZision tại triển lãm Equip Exposition 2025 diễn ra từ 21‑24/10/2025 tại Louisville, Kentucky (Mỹ).
Apple thách thức Qualcomm với modem nội bộ trong iPad Pro M5 mới Vietnet24h - Chiếc iPad Pro M5 mới nhất của Apple đã được ra mắt, thể hiện một nâng cấp "chip-and-ship" khá nhỏ nhặt mà hầu hết người dùng có thể bỏ qua.
AI Đang Thay Đổi Cuộc Chơi Tìm Việc: Từ Sơ Yếu Lý Lịch Đến Ảnh Chân Dung Vietnet24h - Công nghệ trí tuệ nhân tạo (AI) đang làm thay đổi cách chúng ta tiếp cận thị trường lao động.
Microsoft mang “Copilot + Manus” lên Windows 11, đưa AI vào trung tâm trải nghiệm người dùng Vietnet24h - Microsoft vừa công bố một loạt tính năng AI mới dành cho Windows 11, trong đó nổi bật là việc thử nghiệm “Copilot Manus” — một bước tiến nhằm biến mọi máy tính Windows 11 thành trung tâm AI cá nhân.
Anthropic ra mắt Claude Haiku 4.5, một mô hình AI nhỏ hơn và rẻ hơn Vietnet24h - Anthropic đã công bố Claude Haiku 4.5, một mô hình trí tuệ nhân tạo nhỏ hơn, rẻ hơn và dành cho tất cả người dùng.
Đánh Giá iPhone 17: Lựa Chọn Hoàn Hảo Nhất Của Apple Năm 2025 Vietnet24h - Apple đã chính thức ra mắt dòng iPhone 17 vào ngày 19/9/2025, sau đợt đặt trước từ 12/9, mang đến một thiết bị cân bằng hoàn hảo giữa giá cả và hiệu năng.
Apple sắp mở rộng việc sử dụng modem 5G độc quyền cho dòng iPhone 18: Một sự thay đổi mang tính chiến lược Vietnet24h - Apple được biết đến là hãng sử dụng modem 5G C1X độc quyền của mình trên iPhone Air, trong khi vẫn sử dụng modem Qualcomm cho iPhone 17 và iPhone 17 Pro.
Amazon ra mắt máy bán thuốc theo toa tại các phòng khám One Medical ở Los Angeles Vietnet24h - Amazon đang triển khai các ki-ốt bán thuốc theo toa tại một số phòng khám One Medical ở khu vực Los Angeles.
Google Pixel Watch 4: Kẻ Thay Đổi Cuộc Chơi Trong Ngành Đồng Hồ Thông Minh Vietnet24h - Google Pixel Watch 4 đánh dấu bước đột phá, khắc phục các hạn chế của các phiên bản trước, mang đến trải nghiệm đồng hồ thông minh hoàn chỉnh.
Apple Watch Series 11 Đối Đầu Series 10: Bước Tiến Nhỏ, Hiệu Quả Lớn Vietnet24h - Apple tiếp tục giữ đúng nhịp độ ra mắt thường niên với Apple Watch Series 11, đã trình làng vào tháng 9 vừa qua.
Samsung Galaxy S24 Plus Giảm Sốc 10 Triệu: Flagship Cao Cấp Giá Tầm Trung, Dùng Tốt Đến 2031! Vietnet24h - Hà Nội, ngày 3/10/2025 – Với mức giá giảm từ 27 triệu xuống chỉ còn 16 triệu đồng, Samsung Galaxy S24 Plus đang gây bão tại Việt Nam, trở thành “ngôi sao” flagship giá rẻ, ngang ngửa máy tầm trung nhưng hiệu năng và trải nghiệm vượt xa.
Phong trào toàn cầu bảo vệ trẻ em trực tuyến thúc đẩy làn sóng công nghệ an toàn AI Vietnet24h - Một phong trào toàn cầu nhằm bảo vệ trẻ em an toàn trực tuyến đang ngày càng phát triển, với các quy định mới nghiêm ngặt được đưa ra tại Vương quốc Anh và Hoa Kỳ.
Galaxy Watch8 series trở thành trợ thủ công nghệ mới của các tín đồ biohacking Vietnet24h - Biohacking hay ‘hack tuổi sinh học’ là việc biến dữ liệu sức khỏe cá nhân thành những thay đổi nhỏ mỗi ngày nhằm cải thiện thể chất và kéo dài tuổi thọ.
Apple cân nhắc khôi phục dịch vụ sửa chữa iPad tại cửa hàng vào cuối năm Vietnet24h - Apple đang đẩy mạnh dịch vụ khách hàng bằng cách có thể thay đổi cách thức xử lý việc sửa chữa iPad tại Hoa Kỳ.
Galaxy S26 Pro tỏa sáng trong báo cáo về pin, trong khi S26 Edge gặp nhiều thách thức Vietnet24h - Tin đồn đang lan truyền rằng dòng Galaxy S26 sắp ra mắt có thể sẽ giới thiệu bốn mẫu máy ấn tượng, phá vỡ bộ ba truyền thống.
Chỉ vài phút sau động đất, thế giới đã biết liệu có sóng thần hay không Vietnet24h - Cảnh báo sớm sóng thần từng là điều xa xỉ, nhưng ngày nay các nhà khoa học chỉ mất vài phút để phát tín hiệu giúp hàng triệu người có cơ hội sống sót – nhờ hệ thống quan sát đáy biển, dữ liệu vệ tinh và AI.
Mua Motorola Razr+ (2025) tại Amazon ngay hôm nay với mức giá tốt thứ hai từ trước đến nay Vietnet24h - Motorola Razr+ (2025) đã trở thành tâm điểm chú ý trong thế giới điện thoại thông minh, và hiện tại, nó đang thu hút sự chú ý vì tất cả những lý do chính đáng.
Hơn 1.200 website giả mạo bị phát hiện mỗi ngày: Tội phạm mạng chuyển hướng tấn công người dùng cá nhân Vietnet24h - Số liệu từ các tổ chức giám sát an ninh mạng cho thấy, mỗi ngày có hàng nghìn tên miền giả mạo được đăng ký nhằm mục đích đánh cắp dữ liệu người dùng. Đáng chú ý, các website “nhái” thường sao chép hoàn toàn giao diện của ngân hàng, dịch vụ đặt phòng, trang mua sắm, khiến nạn nhân dễ dàng sập bẫy nếu không kiểm tra kỹ.