Hướng dẫn công nghệ
Công cụ thu thập dữ liệu Web của Meta giúp nâng cấp mô hình AI
Quán Chi - Thứ Năm, 22/08/2024 3:01 CH
Vietnet24h - Meta, gã khổng lồ công nghệ do Mark Zuckerberg sáng lập, đang âm thầm triển khai công cụ thu thập dữ liệu web với tên gọi Meta External Agent nhằm phục vụ việc huấn luyện các mô hình trí tuệ nhân tạo (AI) của mình. Theo nguồn tin từ Fortune, công cụ này bắt đầu hoạt động từ tháng trước và hiện đã thu hút sự chú ý của các chuyên gia công nghệ.
Meta External Agent hoạt động bằng cách sao chép và thu thập dữ liệu công khai từ mọi ngóc ngách của internet, bao gồm các bài viết trên trang tin tức, bình luận trên mạng xã hội, và nội dung từ các diễn đàn trực tuyến. Công cụ này tương tự như GPTBot của OpenAI, một phần mềm cũng được sử dụng để thu thập dữ liệu cho việc đào tạo AI.
Theo Dark Visitors, một công ty chuyên cung cấp công cụ chống bot, Meta External Agent có thể thu thập dữ liệu từ các trang web mà GPTBot bị chặn. Dữ liệu từ Dark Visitors cho thấy khoảng 25% các trang web phổ biến trên thế giới đã chặn GPTBot, trong khi chỉ có 2% trang web chặn Meta External Agent.
 
Dựa trên bản lưu Internet Archive từ cuối tháng 7, Meta đã cập nhật trang web dành cho nhà phát triển của mình, bao gồm thông tin về công cụ thu thập dữ liệu mới. Tuy nhiên, công ty của Zuckerberg vẫn chưa công khai thông tin chi tiết về Meta External Agent.
 
Phát ngôn viên của Meta đã xác nhận sự tồn tại của công cụ thu thập dữ liệu này, nhưng cho biết công cụ có tên gọi chính thức là Facebook External Hit và đã được sử dụng trong nhiều năm qua với nhiều tính năng khác nhau. "Chúng tôi, giống như các công ty khác, sử dụng dữ liệu công khai có sẵn trên mạng để huấn luyện các mô hình AI của mình," đại diện Meta cho biết.
 
Giới chuyên gia nhận định sự ra đời của Meta External Agent là minh chứng cho sự mở rộng không ngừng của kho dữ liệu mà Meta đang có. Công ty đang tích cực nâng cấp các mô hình ngôn ngữ lớn như LLaMA, mới nhất là LLaMA 3.1, đồng thời mở rộng hoạt động Meta AI. Meta dự kiến chi tới 40 tỷ USD trong năm nay cho các hoạt động liên quan đến cơ sở hạ tầng, chip AI, và các chi phí phát triển khác.
 
Sự đầu tư mạnh mẽ của Meta vào việc thu thập dữ liệu và nâng cấp AI cho thấy sự quyết tâm của công ty trong việc duy trì vị thế dẫn đầu trong lĩnh vực công nghệ trí tuệ nhân tạo.
Meta ra mắt AI Studio: Công cụ tự tạo chatbot AI cá nhân cho người dùng Messenger và Instagram Vietnet24h - Ngày 29/7, Meta công bố sự ra mắt của AI Studio, một công cụ sáng tạo cho phép người dùng trên các nền tảng của công ty, bao gồm Messenger và Instagram, tự tạo và thiết kế chatbot AI cá nhân hóa. Đây là một bước đi quan trọng trong việc nâng cao trải nghiệm người dùng và mở rộng khả năng sáng tạo trên mạng xã hội.
Tin khác cùng chuyên mục
Tin đọc nhiều
LG CNS giới thiệu nền tảng nhà máy tích hợp trí tuệ nhân tạo tại triển lãm ở Mỹ Vietnet24h - LG CNS hôm thứ Tư cho biết họ đã giới thiệu các giải pháp nhà máy thông minh dựa trên trí tuệ nhân tạo (AI) tại Triển lãm Công nghệ IoT 2026 ở San Jose, khi công ty đẩy mạnh việc thâm nhập thị trường sản xuất Bắc Mỹ.
Samsung đang nghiên cứu thiết kế TriFold rộng hơn trong hồ sơ bằng sáng chế Vietnet24h - Theo một hồ sơ bằng sáng chế được công bố hôm thứ Tư, Samsung Electronics đã nghiên cứu một phiên bản rộng hơn của chiếc Galaxy Z TriFold.
Hiểu thể nào là đúng về Start Up? Vietnet24h - Không ít người vẫn hiểu sai rằng startup đơn giản chỉ là một công ty mới thành lập hoặc doanh nghiệp nhỏ.
DeepSeek V4 chạy trên chip Huawei: Bước tiến lớn của Trung Quốc trong cuộc đua AI và bán dẫn Vietnet24h - Cuộc cạnh tranh công nghệ toàn cầu đang chứng kiến một bước ngoặt đáng chú ý khi mô hình AI thế hệ mới DeepSeek V4 của Trung Quốc được cho là sẽ vận hành trên chip do Huawei phát triển.
Doanh nghiệp điện tử – bán dẫn cần chuẩn bị gì để đạt Giấy chứng nhận doanh nghiệp khoa học và công nghệ? Vietnet24h - Trong bối cảnh Việt Nam đẩy mạnh chiến lược phát triển công nghiệp công nghệ cao, bán dẫn và AI, Giấy chứng nhận doanh nghiệp khoa học và công nghệ (DN KH&CN) đang trở thành một “tấm vé chiến lược” giúp doanh nghiệp điện tử – bán dẫn bước lên nấc thang cao hơn trong chuỗi giá trị.
Camera sau của Galaxy S26 sẽ có thông số kỹ thuật tương tự như S25. Vietnet24h - Samsung đang lên kế hoạch trang bị camera sau có thông số kỹ thuật tương tự cho mẫu Galaxy S26 tiêu chuẩn ra mắt năm sau với tên gọi Galaxy S25.
Phần mềm mới của Nvidia có thể giúp theo dõi xem các chip AI của hãng được sử dụng đến đâu. Vietnet24h - Dịch vụ tùy chọn mới của Nvidia sẽ cung cấp dữ liệu định vị địa lý, giúp xác định quốc gia mà các GPU cụ thể đang hoạt động.
Digital Twin – “Bản sao số” đang cách mạng hóa công nghiệp và đời sống Việt Nam Vietnet24h - Trong kỷ nguyên Công nghiệp 4.0 và Chuyển đổi số quốc gia, khái niệm Digital Twin (Bản sao số) đang nổi lên như một “vũ khí bí mật” giúp doanh nghiệp tối ưu vận hành, giảm chi phí và dự đoán tương lai với độ chính xác chưa từng có.
SAMSUNG GALAXY Z FLIP 7 “ĐỐI ĐẦU” IPHONE 17 PRO: “SIÊU PHẨM” NÀO XỨNG ĐÁNG 1.099 USD NHẤT NĂM 2025? Vietnet24h - Điện thoại gập không còn là “hàng thử nghiệm” nữa! Chúng đang “chiến đấu sòng phẳng” với các flagship truyền thống.
Meta Connect 2025: Kính thông minh tích hợp AI chiếm vị trí trung tâm Vietnet24h - Meta đã chi hàng tỷ đô la để cố gắng đưa thực tế ảo (VR) trở thành xu hướng với người tiêu dùng. Khi chuyển hướng chiến lược metaverse sang kính thông minh, các nhà đầu tư sẽ theo dõi phản ứng của công chúng.
OpenAI và Broadcom ra mắt chip AI đầu tiên mang tên Jalapeño Vietnet24h - OpenAI vừa công bố Jalapeño – con chip AI đầu tiên do hãng tự thiết kế với sự hỗ trợ của Broadcom. Được tối ưu cho các tác vụ suy luận AI như vận hành ChatGPT, Jalapeño đánh dấu bước tiến quan trọng trong chiến lược xây dựng hạ tầng tính toán riêng và giảm sự phụ thuộc vào các bộ xử lý của Nvidia.
Sự bùng nổ của trí tuệ nhân tạo đã giúp SK Hynix vượt qua Samsung về giá trị thị trường Vietnet24h - Hôm thứ Hai, SK hynix đã vượt qua Samsung Electronics để trở thành công ty niêm yết có giá trị nhất Hàn Quốc, chấm dứt gần 26 năm thống trị của Samsung khi các nhà đầu tư tiếp tục đổ xô vào cổ phiếu liên quan đến trí tuệ nhân tạo.
SK hynix xuất xưởng các mẫu HBM4E, gia nhập cùng Samsung trong cuộc đua bộ nhớ AI thế hệ tiếp theo Vietnet24h - SK hynix cho biết chip 12 lớp của họ cung cấp dung lượng 48 gigabyte và tốc độ truyền dữ liệu lên đến 16 gigabit mỗi giây, đồng thời cải thiện hiệu suất năng lượng hơn 20% so với thế hệ HBM4 trước đó.
AI Trung Quốc giảm phụ thuộc Nvidia: 5 mô hình AI lớn chứng minh sức mạnh của chip nội địa Vietnet24h - Các biện pháp kiểm soát xuất khẩu công nghệ của Mỹ đang tạo ra một sự thay đổi sâu sắc trong hệ sinh thái AI Trung Quốc.
Hansae mở đường cho thị trường thời trang robot hình người Vietnet24h - Khi cuộc đua trí tuệ nhân tạo đang dịch chuyển từ thế giới số sang các ứng dụng vật lý, tập đoàn may mặc Hàn Quốc Hansae đã đưa ra một hướng đi hoàn toàn mới: phát triển quần áo dành cho robot hình người (humanoid).
SpaceX sau IPO lịch sử: Phố Wall chờ phép thử lớn tiếp theo của đế chế Elon Musk Vietnet24h - SpaceX đã hoàn tất đợt IPO với mức định giá thuộc nhóm cao nhất lịch sử đối với một công ty công nghệ và hàng không vũ trụ.
Nvidia bắt đầu chào bán CPU Vera cho khách hàng Trung Quốc, mở rộng cuộc chơi ngoài GPU AI Vietnet24h - Nvidia đang thực hiện bước đi chiến lược mới tại thị trường Trung Quốc khi bắt đầu giới thiệu dòng CPU máy chủ Vera tới các khách hàng lớn
Applied Materials mở rộng đại bản doanh tại Singapore, Nhật Bản định hình mô hình cáp ngầm mới cho kỷ nguyên AI Vietnet24h - Những động thái mới từ Applied Materials tại Singapore và các tập đoàn viễn thông Nhật Bản cho thấy cuộc đua AI không chỉ diễn ra trong các trung tâm dữ liệu hay nhà máy chip, mà còn lan rộng tới toàn bộ hệ sinh thái hạ tầng số toàn cầu.
Samsung Electronics sẽ đưa ChatGPT, Gemini và Claude vào hoạt động Vietnet24h - Samsung Electronics sẽ triển khai ba dịch vụ trí tuệ nhân tạo (AI) tạo sinh hàng đầu thế giới trên toàn bộ hoạt động của mình, nhằm mục đích đẩy nhanh quá trình chuyển đổi AI vượt ra ngoài việc chỉ dựa vào các mô hình và dịch vụ AI nội bộ.
IPO SpaceX có thể bùng nổ hai chữ số ngay ngày đầu niêm yết, cơn sốt lớn nhất Phố Wall năm 2026 đang hình thành Vietnet24h - Trước thềm đợt phát hành cổ phiếu lần đầu ra công chúng (IPO) được xem là lớn nhất lịch sử thị trường tài chính toàn cầu, giới đầu tư đang đặt cược mạnh vào khả năng cổ phiếu SpaceX sẽ tăng trưởng hai chữ số ngay trong phiên giao dịch đầu tiên.
Samsung Display ra mắt màn hình OLEDOS RGB độ sáng cực cao dành cho XR Vietnet24h - Công ty trưng bày các tấm nền OLEDOS RGB 1,3 inch và 0,62 inch với độ sáng 40.000 nit tại triển lãm AWE USA 2026.
Robot AI vật lý do Hàn Quốc sản xuất được ứng dụng trong chăm sóc tim mạch Vietnet24h - Trung tâm Y tế Asan sử dụng robot hỗ trợ can thiệp mạch vành qua da để điều trị bệnh nhân.
Cuộc đua robot hình người: “bàn tay” mới là chiến trường quyết định, không phải trí tuệ Vietnet24h - Thế giới đang bị cuốn vào cuộc cạnh tranh phát triển robot hình người với trọng tâm là AI và năng lực xử lý.
Mô hình AI dự đoán hương vị kim chi và mức độ lên men Vietnet24h - Viện nghiên cứu kim chi hàng đầu của Hàn Quốc đã phát triển một mô hình trí tuệ nhân tạo (AI) mới có thể dự đoán hương vị của kim chi dựa trên các điều kiện lên men, bao gồm nhiệt độ và vi khuẩn hiện diện.
Samsung Display giới thiệu các khái niệm AI và OLED thế hệ tiếp theo Vietnet24h - Samsung Display đã giới thiệu các sản phẩm concept cho các thiết bị trí tuệ nhân tạo (AI) thế hệ tiếp theo sử dụng công nghệ OLED tại một sự kiện truyền thông hôm thứ Hai (giờ địa phương) trước thềm CES 2026.
Từ “robot trình diễn” đến nền tảng mở: Unitree và bước ngoặt mới của ngành robot tiêu dùng Vietnet24h - Việc Unitree Robotics công bố nền tảng cho phép người dùng điều khiển robot thông qua smartphone không đơn thuần là một cải tiến giao diện người dùng.
Tàu vũ trụ thương mại đầu tiên của Hàn Quốc dự kiến ​​phóng vào ngày 22 tháng 11 tại Brazil Vietnet24h - HANBIT-Nano, tên lửa đẩy thương mại đầu tiên của Hàn Quốc do Innospace phát triển, sẽ được phóng vào lúc 3 giờ chiều ngày 22 tháng 11 tại Brazil (giờ địa phương), công ty cho biết hôm thứ Sáu (7/11).
Tương Lai Robot Hình Người: Từ “CMO” Đến Người Bạn Đồng Hành Của Nhân Loại Vietnet24h - Boston, ngày 3/10/2025 – Trong một động thái gây chấn động, robot hình người Uri – từng là Unitree G1 – vừa được bổ nhiệm làm Giám đốc Marketing (CMO) cho Series, nền tảng mạng xã hội cạnh tranh trực tiếp với LinkedIn.
PCIM Asia Shanghai 2025: Cuộc Cách Mạng Công Nghệ Điện Tử Công Suất – Phỏng Vấn Độc Quyền Với CEO EPC Về Tương Lai GaN Và AI Vietnet24h - Phóng viên Vietnet24h đã có cơ hội phỏng vấn độc quyền ông Alexander Lidow, Tiến sĩ khoa học, Tổng Giám đốc điều hành EPC (Efficient Power Conversion) – một trong những nhà tiên phong về công nghệ Gallium Nitride (GaN).
Triển Lãm Robot Tại Thượng Hải 2025: Đa Robot, Đa Nhiệm Vụ Và Tương Lai Việc Làm Tự Động Hóa Vietnet24h - Thượng Hải, Trung Quốc, ngày 27/9/2025 – Trong khuôn khổ China International Industry Fair (CIIF) 2025, Triển lãm Robot (Robot Show) đang diễn ra sôi nổi từ ngày 23 đến 27/9 tại Trung tâm Triển lãm và Hội nghị Quốc gia (National Exhibition and Convention Center, địa chỉ: 333 Songze Avenue, Quận Thanh Phổ, Thượng Hải).