Văn hóa - Thể thao
Cách DeepSeek sử dụng phương pháp chưng cất để đào tạo mô hình trí tuệ nhân tạo
Minh Ngọc - Chủ Nhật, 23/02/2025 8:34 SA
Vietnet24h - Phòng thí nghiệm trí tuệ nhân tạo Trung Quốc DeepSeek đã khuấy động thị trường vào tháng 1, gây ra một đợt bán tháo công nghệ và chất bán dẫn lớn sau khi công bố các mô hình AI mà họ cho là rẻ hơn và hiệu quả hơn so với các mô hình của Mỹ.
Nhưng nỗi sợ hãi và đột phá tiềm ẩn đã thúc đẩy đợt bán tháo này còn sâu sắc hơn nhiều so với một công ty khởi nghiệp AI. Thung lũng Silicon hiện đang tính đến một kỹ thuật trong phát triển AI được gọi là chưng cất, một kỹ thuật có thể đảo ngược bảng xếp hạng AI.
 
Chưng cất là một quá trình trích xuất kiến ​​thức từ một mô hình AI lớn hơn để tạo ra một mô hình nhỏ hơn. Nó có thể cho phép một nhóm nhỏ hầu như không có nguồn lực nào tạo ra một mô hình tiên tiến.
 
Một công ty công nghệ hàng đầu đầu tư nhiều năm và hàng triệu đô la để phát triển một mô hình hàng đầu từ đầu. Sau đó, một nhóm nhỏ hơn như DeepSeek lao vào và đào tạo mô hình chuyên biệt hơn của riêng mình bằng cách đặt câu hỏi cho mô hình "giáo viên" lớn hơn. Quá trình này tạo ra một mô hình mới có khả năng gần như mô hình của công ty lớn nhưng đào tạo nhanh hơn và hiệu quả hơn.
 
“Kỹ thuật chưng cất này cực kỳ mạnh mẽ và cực kỳ rẻ, và nó dành cho bất kỳ ai”, Ali Ghodsi, CEO của Databricks, cho biết, đồng thời nói thêm rằng ông hy vọng sẽ thấy sự đổi mới khi nói đến cách xây dựng các mô hình ngôn ngữ lớn hay LLM. “Chúng ta sẽ thấy rất nhiều sự cạnh tranh cho LLM. Đó là những gì sẽ xảy ra trong kỷ nguyên mới mà chúng ta đang bước vào”.
 
Hiện nay, chưng cất đang cho phép các công ty khởi nghiệp và phòng nghiên cứu ít vốn cạnh tranh ở vị trí tiên tiến nhanh hơn bao giờ hết.
 
Các nhà nghiên cứu tại Berkeley cho biết, sử dụng kỹ thuật này, họ đã tái tạo mô hình lý luận của OpenAI với giá 450 đô la trong 19 giờ vào tháng trước. Ngay sau đó, các nhà nghiên cứu tại Stanford và Đại học Washington đã tạo ra mô hình lý luận của riêng họ chỉ trong 26 phút, sử dụng chưa đến 50 đô la tín dụng tính toán, họ cho biết. Công ty khởi nghiệp Hugging Face đã tái tạo tính năng mới nhất và hấp dẫn nhất của OpenAI, Nghiên cứu sâu, dưới dạng thử thách mã hóa trong 24 giờ.
 
DeepSeek không phát minh ra quá trình chưng cất, nhưng nó đã đánh thức thế giới AI về tiềm năng phá vỡ của nó. Nó cũng mở ra sự trỗi dậy của một trật tự nguồn mở mới — một niềm tin rằng tính minh bạch và khả năng tiếp cận thúc đẩy sự đổi mới nhanh hơn so với nghiên cứu đóng cửa.
 
"Nguồn mở luôn chiến thắng trong ngành công nghệ", Arvind Jain, CEO của Glean, công ty tạo ra công cụ tìm kiếm hỗ trợ AI cho các doanh nghiệp, cho biết. "Bạn không thể đánh bại được động lực mà một dự án nguồn mở thành công thực sự có thể tạo ra".
 
Bản thân OpenAI đã quay lại chiến lược nguồn đóng của mình sau thành tích của DeepSeek.
 
"Cá nhân tôi nghĩ rằng chúng ta đã đi sai hướng trong lịch sử và cần tìm ra một chiến lược nguồn mở khác", CEO của OpenAI Sam Altman đã viết trong một bài đăng trên Reddit vào ngày 31 tháng 1.
 
Sự kết hợp giữa sức hút mới tìm thấy của quá trình chưng cất và sự gia tăng phổ biến của nguồn mở đang hoàn toàn thay đổi động lực cạnh tranh trong AI.
Bắc Kinh áp dụng DeepSeek để dẫn đầu việc áp dụng AI khi tìm kiếm động lực tăng trưởng mới Vietnet24h - DeepSeek cũng đã làm rung chuyển hệ sinh thái AI của Trung Quốc, với các tổ chức nhà nước cũng như các công ty công nghệ lớn, bao gồm cả các đối thủ cạnh tranh, tận dụng kiến ​​trúc nguồn mở của nó.
Mô hình AI của Deepseek, là một tác phẩm tốt nhất của Trung Quốc nhưng hơi quá "cường điệu", Giám đốc điều hành của Google Deepmind nói Vietnet24h - Mô hình AI của Deepseek, có lẽ là tác phẩm hay nhất của Trung Quốc, Demis Hassabis, CEO của Google Deepmind cho biết vào Chủ nhật.
Tin khác cùng chuyên mục
Tin đọc nhiều
Cổ phiếu Tesla lại lao dốc khi các nhà đầu tư tháo chạy khỏi công ty xe điện Vietnet24h - Cổ phiếu Tesla lại giảm vào thứ Hai (10/3) khi niềm tin vào công ty xe điện của Elon Musk tiếp tục tan rã sau "cú hích" sau bầu cử của Trump.
Các công ty công nghệ lớn mất hơn 750 tỷ đô la vốn hóa thị trường trong ngày tồi tệ nhất của Nasdaq kể từ năm 2022 Vietnet24h - Bảy công ty công nghệ có giá trị nhất đã mất hơn 750 tỷ đô la giá trị thị trường vào thứ Hai khi nỗi lo suy thoái làm rung chuyển Phố Wall.
Cổ phiếu Tesla đã giảm hàng tuần kể từ khi Elon Musk đến Washington Vietnet24h - Cổ phiếu Tesla đã mất gần như toàn bộ mức tăng sau bầu cử, giảm trong bảy tuần liên tiếp kỷ lục.
Ông Trump ký lệnh hành pháp thành lập quỹ dự trữ bitcoin chiến lược của Hoa Kỳ Vietnet24h - Tổng thống Donald Trump đã ký một sắc lệnh hành pháp thành lập quỹ dự trữ bitcoin chiến lược.
LG Uplus hướng tới mục tiêu doanh thu 300 triệu đô la từ AI khi hợp tác với Google Vietnet24h - Tổng giám đốc điều hành LG Uplus Hong Bum-shik đã tiết lộ kế hoạch trung hạn của công ty là tạo ra doanh thu 300 triệu đô la thông qua quan hệ đối tác trí tuệ nhân tạo (AI) với Google.
Nvidia bị ra khỏi câu lạc bộ vốn hóa thị trường 3 nghìn tỷ đô la sau khi cổ phiếu giảm hơn 8% Vietnet24h - Cổ phiếu Nvidia giảm hơn 8% vào thứ năm (27/2), một ngày sau khi công ty báo cáo thu nhập, đẩy vốn hóa thị trường của nhà sản xuất chip này xuống dưới 3 nghìn tỷ đô la.
Cổ phiếu Super Micro Computer tăng vọt 16% sau khi nộp báo cáo tài chính chậm trễ so với thời hạn Vietnet24h - Cổ phiếu Super Micro Computer tăng 16% sau khi công ty máy chủ AI này nộp báo cáo tài chính chậm trễ theo thời hạn của Nasdaq.
Cổ phiếu Super Micro tăng 22% sau khi nộp báo cáo tài chính, Vietnet24h - Cổ phiếu Super Micro tăng vọt trong phiên giao dịch mở rộng sau khi công ty báo cáo tình hình tài chính trong năm tài chính gần nhất.
Nvidia sắp báo cáo thu nhập trong bối cảnh chi tiêu cho cơ sở hạ tầng AI với những lo ngại về DeepSeek Vietnet24h - Điều này đặc biệt đáng lo ngại khi những đột phá gần đây về AI ở Trung Quốc cho thấy không cần hàng tỷ đô la GPU Nvidia để đào tạo và sử dụng AI tiên tiến.
Công ty khởi nghiệp AI Baseten huy động được 75 triệu đô la sau khi DeepSeek xuất hiện Vietnet24h - Baseten, một công ty khởi nghiệp chạy các mô hình trí tuệ nhân tạo cho khách hàng trên cơ sở hạ tầng đám mây, đã huy động được 75 triệu đô la tiền tài trợ, công ty cho biết hôm thứ Tư (19/2).
Tại sao nhiều nhân sự cấp cao lại rời khỏi Samsung Electronics? Vietnet24h - Một số giám đốc điều hành cấp cao tại Samsung Electronics gần đây đã rời công ty, mặc dù ban đầu họ gia nhập với kỳ vọng cao về việc củng cố các hoạt động kinh doanh và hoạt động quản lý trong tương lai.
Hàn Quốc nêu vấn đề về khả năng bị Hoa Kỳ chỉ định là 'quốc gia nhạy cảm' Vietnet24h - Nếu bị đưa vào danh sách, các nhà nghiên cứu từ các quốc gia trong danh sách sẽ phải chịu sự giám sát chặt chẽ hơn khi tham gia các cơ sở nghiên cứu hoặc dự án liên kết với bộ này, có khả năng khiến họ khó tham gia vào nghiên cứu của Hoa Kỳ về các công nghệ tiên tiến
Triển lãm Đại hội Thế giới Di động 2025 sẽ giới thiệu nhiều thiết bị telecom AI Vietnet24h - Các công ty viễn thông Hàn Quốc sẽ giới thiệu công nghệ mới nhất và các trường hợp sử dụng trí tuệ nhân tạo (AI) tại Đại hội Thế giới DI động (Mobile World Congress - MWC) 2025 sắp tới, tập trung vào cách kiếm lợi nhuận trong ngành AI đang phát triển nhanh chóng.
Google thông báo sa thải nhân viên trong bộ phận HR và đám mây như một phần của chiến dịch cắt giảm chi phí Vietnet24h - Tuần này, công ty cũng đã sa thải một số nhân viên mảng đám mây và dự định tái đầu tư số tiền tiết kiệm được khi tuyển dụng những vị trí bán hàng và kỹ thuật quan trọng.
Modi muốn Tesla sản xuất ô tô tại Ấn Độ, nhưng việc này không dễ Vietnet24h - Tesla được cho là đang tuyển dụng và tìm kiếm địa điểm mở phòng trưng bày tại Ấn Độ sau cuộc gặp giữa Thủ tướng Ấn Độ Narendra Modi và Giám đốc điều hành Tesla Elon Musk.
Anh ra lệnh cho Apple cung cấp cho họ quyền truy cập vào các tài khoản được mã hóa Vietnet24h - Bộ Nội vụ Anh đã ra lệnh cho Apple vào tháng trước phải tạo ra một "cửa sau" kỹ thuật cho phép các quan chức xem tài liệu được mã hóa được tải lên đám mây.
Boeing đang hợp tác với Elon Musk để giao máy bay thay thế Air Force One sớm Vietnet24h - Tổng thống Donald Trump đã đạt được thỏa thuận về máy bay thay thế trong nhiệm kỳ đầu tiên của mình.
TSMC đánh giá tác động của trận động đất 6,4 độ richter ở Đài Loan lên trung tâm chip Vietnet24h - Taiwan Semiconductor Manufacturing Co. đang đánh giá tác động của trận động đất mạnh 6,4 độ richter lên trung tâm sản xuất chip tiên tiến nhất của mình vào sáng thứ Ba, với các công nhân đã trở lại nơi làm việc của họ vài giờ sau khi trận động đất xảy ra.
TT Trump trở lại Nhà Trắng với lời cam kết mới 'đặt nước Mỹ lên hàng đầu' Vietnet24h - Donald Trump nhậm chức tổng thống thứ 47 của Hoa Kỳ vào thứ Hai, tái khẳng định lời thề "đặt nước Mỹ lên hàng đầu" và đánh thuế các nước ngoài để làm giàu cho người Mỹ, đồng thời thể hiện ý định kiềm chế sự can dự quân sự vào các cuộc xung đột ở nước ngoài.
Hoa Kỳ ủng hộ lập luận của Musk trong vụ kiện OpenAI Vietnet24h - FTC đang xem xét riêng các quan hệ đối tác trong lĩnh vực AI, bao gồm giữa Microsoft và OpenAI, điều tra hành vi có khả năng chống cạnh tranh tại Microsoft và điều tra xem OpenAI có vi phạm luật bảo vệ người tiêu dùng hay không.
Meta tìm đến trọng tài để ngăn chặn người tố giác quảng bá cuốn sách tiết lộ tất cả Vietnet24h - Meta đang tìm cách ngăn chặn việc quảng bá cuốn hồi ký mới của một cựu nhân viên có nội dung mô tả công ty theo hướng không hay, bao gồm cả cáo buộc quấy rối tình dục của giám đốc chính sách công ty.
KT kết hợp AI với thể thao, K-pop tại Đại hội Thế giới Di động (MWC) 2025 Vietnet24h - K-Stadium được thiết kế để tăng cường sự tương tác của người hâm mộ bằng AI. Một trong những tính năng chính của nó là hệ thống dịch phụ đề thời gian thực do AI hỗ trợ.
Amazon sẽ giành quyền kiểm soát sáng tạo cho loạt phim James Bond từ gia đình Broccoli Vietnet24h - Amazon sắp giành được quyền sáng tạo đối với loạt phim James Bond béo bở.
Squid Game mùa 2: Cơn sốt hay bẫy lừa đảo tiền số? Vietnet24h - Với sự phổ biến của Squid Game mùa hai, các token liên quan đến bộ phim này đã thu hút hàng triệu USD. Tuy nhiên, không ít nhà đầu tư đã mất trắng khi các token này bị sụt giảm giá trị chỉ trong thời gian ngắn, báo hiệu một làn sóng lừa đảo "rút thảm" trên thị trường tiền số.
Lễ chùa thời công nghệ: Nhật Bản số hóa nghi lễ đầu năm Vietnet24h - Chùa Zojoji, biểu tượng Phật giáo tại Tokyo, đang tiên phong tích hợp công nghệ thanh toán QR cho nghi lễ Saisen, vừa tiện lợi vừa giữ nguyên tinh thần truyền thống.
TikTok gặp rắc rối tại Nga: bị phạt vì không gỡ nội dung cấm Vietnet24h - Vừa qua, TikTok bị phạt gần 30.000 USD tại Nga vì vi phạm các quy định pháp lý về nội dung. Quyết định này cho thấy Nga đang quyết liệt hơn trong việc kiểm soát các nền tảng mạng xã hội.
Hoàn thiện hạ tầng viễn thông tại làng Nủ sau thảm họa lũ quét Vietnet24h - Vừa qua, nhà mạng VNPT đã chính thức khởi công lắp đặt trạm phát sóng di động (BTS) tại khu vực xây dựng bản tái định cư mới cho người dân thôn Làng Nủ, huyện Bảo Yên, tỉnh Lào Cai.
Thành công rực rỡ: Black Myth - Wukong thu về gần 1 tỷ USD Vietnet24h - Black Myth: Wukong, tựa game hành động nhập vai của Game Science, đã ghi dấu ấn mạnh mẽ trên thị trường game quốc tế, với doanh thu gần chạm ngưỡng 1 tỷ USD chỉ sau hai tuần ra mắt.
Trải nghiệm âm nhạc kết hợp công nghệ đỉnh cao của Galaxy AI Immersive Vietnet24h - Sự kiện hoành tráng chào đón thế hệ điện thoại gập mới Galaxy Z Fold6 và Galaxy Z Flip6 - nơi âm nhạc và công nghệ hội tụ, thể hiện vị thế tiên phong dẫn đầu kỷ nguyên AI mới đã bùng nổ với 50.000 người tham gia.
Tùng Tán Lâm - Vẻ đẹp thiêng liêng giữa lòng Shangri-La Vietnet24h - Đối với những tín đồ đam mê du lịch tâm linh, tu viện Tùng Tán Lâm (Songzanlin) là một điểm đến không thể bỏ qua. Những người từng đặt chân đến Shangri-la đều khẳng định đây là một trong những tu viện đáng ghé thăm nhất trên thế giới.