Kinh doanh
Cách DeepSeek sử dụng phương pháp chưng cất để đào tạo mô hình trí tuệ nhân tạo
Minh Ngọc - Chủ Nhật, 23/02/2025 8:34 SA
Vietnet24h - Phòng thí nghiệm trí tuệ nhân tạo Trung Quốc DeepSeek đã khuấy động thị trường vào tháng 1, gây ra một đợt bán tháo công nghệ và chất bán dẫn lớn sau khi công bố các mô hình AI mà họ cho là rẻ hơn và hiệu quả hơn so với các mô hình của Mỹ.
Nhưng nỗi sợ hãi và đột phá tiềm ẩn đã thúc đẩy đợt bán tháo này còn sâu sắc hơn nhiều so với một công ty khởi nghiệp AI. Thung lũng Silicon hiện đang tính đến một kỹ thuật trong phát triển AI được gọi là chưng cất, một kỹ thuật có thể đảo ngược bảng xếp hạng AI.
 
Chưng cất là một quá trình trích xuất kiến ​​thức từ một mô hình AI lớn hơn để tạo ra một mô hình nhỏ hơn. Nó có thể cho phép một nhóm nhỏ hầu như không có nguồn lực nào tạo ra một mô hình tiên tiến.
 
Một công ty công nghệ hàng đầu đầu tư nhiều năm và hàng triệu đô la để phát triển một mô hình hàng đầu từ đầu. Sau đó, một nhóm nhỏ hơn như DeepSeek lao vào và đào tạo mô hình chuyên biệt hơn của riêng mình bằng cách đặt câu hỏi cho mô hình "giáo viên" lớn hơn. Quá trình này tạo ra một mô hình mới có khả năng gần như mô hình của công ty lớn nhưng đào tạo nhanh hơn và hiệu quả hơn.
 
“Kỹ thuật chưng cất này cực kỳ mạnh mẽ và cực kỳ rẻ, và nó dành cho bất kỳ ai”, Ali Ghodsi, CEO của Databricks, cho biết, đồng thời nói thêm rằng ông hy vọng sẽ thấy sự đổi mới khi nói đến cách xây dựng các mô hình ngôn ngữ lớn hay LLM. “Chúng ta sẽ thấy rất nhiều sự cạnh tranh cho LLM. Đó là những gì sẽ xảy ra trong kỷ nguyên mới mà chúng ta đang bước vào”.
 
Hiện nay, chưng cất đang cho phép các công ty khởi nghiệp và phòng nghiên cứu ít vốn cạnh tranh ở vị trí tiên tiến nhanh hơn bao giờ hết.
 
Các nhà nghiên cứu tại Berkeley cho biết, sử dụng kỹ thuật này, họ đã tái tạo mô hình lý luận của OpenAI với giá 450 đô la trong 19 giờ vào tháng trước. Ngay sau đó, các nhà nghiên cứu tại Stanford và Đại học Washington đã tạo ra mô hình lý luận của riêng họ chỉ trong 26 phút, sử dụng chưa đến 50 đô la tín dụng tính toán, họ cho biết. Công ty khởi nghiệp Hugging Face đã tái tạo tính năng mới nhất và hấp dẫn nhất của OpenAI, Nghiên cứu sâu, dưới dạng thử thách mã hóa trong 24 giờ.
 
DeepSeek không phát minh ra quá trình chưng cất, nhưng nó đã đánh thức thế giới AI về tiềm năng phá vỡ của nó. Nó cũng mở ra sự trỗi dậy của một trật tự nguồn mở mới — một niềm tin rằng tính minh bạch và khả năng tiếp cận thúc đẩy sự đổi mới nhanh hơn so với nghiên cứu đóng cửa.
 
"Nguồn mở luôn chiến thắng trong ngành công nghệ", Arvind Jain, CEO của Glean, công ty tạo ra công cụ tìm kiếm hỗ trợ AI cho các doanh nghiệp, cho biết. "Bạn không thể đánh bại được động lực mà một dự án nguồn mở thành công thực sự có thể tạo ra".
 
Bản thân OpenAI đã quay lại chiến lược nguồn đóng của mình sau thành tích của DeepSeek.
 
"Cá nhân tôi nghĩ rằng chúng ta đã đi sai hướng trong lịch sử và cần tìm ra một chiến lược nguồn mở khác", CEO của OpenAI Sam Altman đã viết trong một bài đăng trên Reddit vào ngày 31 tháng 1.
 
Sự kết hợp giữa sức hút mới tìm thấy của quá trình chưng cất và sự gia tăng phổ biến của nguồn mở đang hoàn toàn thay đổi động lực cạnh tranh trong AI.
Bắc Kinh áp dụng DeepSeek để dẫn đầu việc áp dụng AI khi tìm kiếm động lực tăng trưởng mới Vietnet24h - DeepSeek cũng đã làm rung chuyển hệ sinh thái AI của Trung Quốc, với các tổ chức nhà nước cũng như các công ty công nghệ lớn, bao gồm cả các đối thủ cạnh tranh, tận dụng kiến ​​trúc nguồn mở của nó.
Mô hình AI của Deepseek, là một tác phẩm tốt nhất của Trung Quốc nhưng hơi quá "cường điệu", Giám đốc điều hành của Google Deepmind nói Vietnet24h - Mô hình AI của Deepseek, có lẽ là tác phẩm hay nhất của Trung Quốc, Demis Hassabis, CEO của Google Deepmind cho biết vào Chủ nhật.
Tin khác cùng chuyên mục
Tin đọc nhiều
Cổ phiếu Super Micro giảm do kế hoạch chào bán trái phiếu chuyển đổi trị giá 2 tỷ đô la Vietnet24h - Cổ phiếu của Super Micro Computer đã giảm vào thứ Hai sau khi nhà sản xuất máy chủ này công bố kế hoạch phát hành trái phiếu chuyển đổi trị giá 2 tỷ đô la.
Cổ phiếu AMD tăng 9% sau khi các nhà phân tích kỳ vọng một sự 'phục hồi' cho nhà sản xuất chip Vietnet24h - Đó là thời điểm các nhà phân tích kỳ vọng nhà sản xuất chip này sẽ phải chịu phần lớn khoản phí 800 triệu đô la mà AMD cho biết sẽ phải chịu do xuất khẩu sang Trung Quốc.
Cổ phiếu SK Hynix tăng vọt lên mức cao nhất trong hơn 2 thập kỷ Vietnet24h - Cổ phiếu của SK Hynix của Hàn Quốc đã mở rộng mức tăng lên mức cao nhất trong hơn 2 thập kỷ vào thứ Ba. Công ty mẹ của công ty, SK Group, được cho là có kế hoạch xây dựng trung tâm dữ liệu AI hợp tác với Amazon Web Services tại Ulsan.
Thế giới có thể phải đối mặt với một "cú sốc Trung Quốc" khác, nhưng nó cũng đi kèm với một tia hy vọng Vietnet24h - Sự gia tăng sản xuất của Trung Quốc đang lan rộng khắp thị trường toàn cầu, gây lo ngại ở châu Á rằng làn sóng nhập khẩu giá rẻ có thể gây sức ép lên các ngành công nghiệp địa phương.
Cổ phiếu của Microsoft đạt kỷ lục mới, giành lại vị trí công ty có giá trị vốn hóa lớn nhất thế giới Vietnet24h - Cổ phiếu Microsoft đã đạt mức kỷ lục đầu tiên vào thứ năm kể từ tháng 7 năm 2024.
Cổ phiếu Tesla tăng 22% vào tháng 5 khi Elon Musk kết thúc thời gian với DOGE của Trump Vietnet24h - Cổ phiếu của hãng sản xuất ô tô Tesla do Elon Musk đứng đầu đã tăng giá vào tháng 5 mặc dù doanh số bán ô tô của công ty tại Trung Quốc và Châu Âu không mấy khả quan.
Apple, Huawei, Xiaomi dẫn đầu bảng xếp hạng 500 thương hiệu tiêu dùng hàng đầu của Trung Quốc Vietnet24h - Theo báo cáo của Đại học Bắc Kinh, bảng xếp hạng này dựa trên hành vi mua sắm trực tuyến của người tiêu dùng trong nước
Cổ phiếu Sony tăng trong phiên giao dịch đầy biến động khi nhà sản xuất PlayStation công bố mua lại cổ phiếu trị giá 1,7 tỷ đô la Vietnet24h - Thu nhập hoạt động trong ba tháng cuối năm tài chính đạt 203,6 tỷ yên, vượt qua ước tính trung bình của các nhà phân tích là 192,2 tỷ yên, mặc dù giảm 11% so với cùng kỳ năm ngoái.
Cổ phiếu Nvidia tăng sau báo cáo Trump sẽ chấm dứt lệnh hạn chế xuất khẩu chip Vietnet24h - Cổ phiếu Nvidia tăng sau báo cáo cho biết chính quyền Trump có kế hoạch sửa đổi một loạt các hạn chế về thương mại chip được gọi là quy tắc “khuyến khích AI”.
Cổ phiếu Arm giảm do dự báo yếu Vietnet24h - Arm đạt được doanh thu và lợi nhuận cao nhưng lại đưa ra dự báo đáng thất vọng trong báo cáo quý vào thứ Tư (7/5).
Bức tranh toàn cảnh lừa đảo mạng tại Việt Nam: Từ thủ đoạn tinh vi đến khoảng trống phòng vệ số Vietnet24h - Không chỉ là những kịch bản cũ được làm mới, các thủ đoạn lừa đảo mạng tại Việt Nam đang tiến hóa nhanh chóng, tận dụng tâm lý bất an, sự cả tin và đặc biệt là những khoảng trống trong hạ tầng phòng vệ số của người dân.
Tòa án tối cao sẽ đưa ra phán quyết cuối cùng về Chủ tịch Samsung Lee vào ngày 17 tháng 7 Vietnet24h - Phán quyết, dự kiến ​​vào ngày 17 tháng 7, được đưa ra bốn năm 10 tháng sau khi Lee lần đầu tiên bị đưa ra xét xử và khoảng năm tháng sau khi tòa phúc thẩm giữ nguyên phán quyết tuyên trắng án của ông.
Meta thắng kiện bản quyền AI, nhưng thẩm phán cho biết những người khác có thể khởi kiện Vietnet24h - Vào thứ Tư, Meta đã thắng thế trước một nhóm gồm 13 tác giả, bao gồm Sarah Silverman và Ta-Nehisi Coates, trong một vụ kiện bản quyền lớn liên quan đến mô hình trí tuệ nhân tạo Llama của công ty.
Amazon tuyên bố AI sẽ giúp cắt giảm nhân sự trong vài năm tới Vietnet24h - CEO Andy Jassy cho biết công ty sẽ đẩy mạnh ứng dụng AI tạo sinh và các tác nhân thông minh nhằm tăng hiệu suất, đồng thời giảm nhu cầu nhân lực trong thời gian tới. Động thái này phản ánh làn sóng tự động hóa đang ảnh hưởng sâu sắc tới thị trường lao động công nghệ.
Chính phủ Anh phân bổ nhiều tiền hơn cho nguồn nhân lực bán dẫn Vietnet24h - Chính phủ Anh đã xác nhận kế hoạch phân bổ thêm 35 triệu bảng Anh cho chương trình mở rộng nhân tài bán dẫn.
Apple Ấn Độ đặt mục tiêu tuyển dụng 5.000 nhân viên cho cơ sở ở Hyderabad Vietnet24h - Apple đã tuyển dụng 3.500 người cho trung tâm phát triển của họ tại đây và dự kiến ​​sẽ nâng con số này lên 5.000 người, một viên chức cấp cao của Chính phủ Telangana cho biết.
Trump gia hạn thời hạn TikTok lần thứ ba, lùi quyết định thêm 90 ngày nữa Vietnet24h - Tổng thống Donald Trump có kế hoạch một lần nữa gia hạn thời hạn yêu cầu ByteDance của Trung Quốc phải thoái vốn khỏi hoạt động kinh doanh của TikTok tại Hoa Kỳ hoặc sẽ bị cấm tại quốc gia này.
Tai nạn máy bay Air India: Những điều cần biết về thảm kịch chết người đầu tiên của Boeing Dreamliner Vietnet24h - Chuyến bay 171 của Air India đã bị rơi vào thứ năm ngay sau khi cất cánh từ Ahmedabad, Ấn Độ, trên đường đến London.
Vụ cá cược AI lớn nhất của CEO Meta Vietnet24h - Để hoàn tất thỏa thuận đầu tư 14 tỷ đô la vào Scale AI, Mark Zuckerberg của Meta đang thuê người đồng sáng lập Alexandr Wang để giúp công ty truyền thông xã hội này thực hiện tốt hơn tham vọng về AI của mình.
Trung Quốc siết AI trong kỳ thi đại học: Bảo vệ công bằng hay giới hạn đổi mới? Vietnet24h - Kỳ thi Cao khảo (kỳ thi đại học) tại Trung Quốc, được tổ chức từ ngày 7 đến 10 tháng 6, không chỉ là một cuộc thử thách trí tuệ mà còn là nơi các cơ quan giáo dục và chính quyền thể hiện sự kiểm soát nghiêm ngặt đối với công nghệ, đặc biệt là trí tuệ nhân tạo (AI). Việc các hãng công nghệ Trung Quốc khóa hoặc hạn chế tính năng AI trong suốt kỳ thi đã dấy lên một cuộc tranh luận sâu sắc về sự công bằng, sáng tạo và tính kiểm soát trong giáo dục.
iPhone đang làm tổn thương giới trẻ? Người thiết kế ra nó lên tiếng Vietnet24h - Jony Ive, cha đẻ của iPhone, thừa nhận công nghệ smartphone đã dẫn đến những hậu quả đáng lo cho sức khỏe tâm thần. Cùng bà Powell Jobs, ông đang âm thầm phát triển một thiết bị mới để “sửa sai” cho chính di sản của mình.
Meta tìm đến trọng tài để ngăn chặn người tố giác quảng bá cuốn sách tiết lộ tất cả Vietnet24h - Meta đang tìm cách ngăn chặn việc quảng bá cuốn hồi ký mới của một cựu nhân viên có nội dung mô tả công ty theo hướng không hay, bao gồm cả cáo buộc quấy rối tình dục của giám đốc chính sách công ty.
KT kết hợp AI với thể thao, K-pop tại Đại hội Thế giới Di động (MWC) 2025 Vietnet24h - K-Stadium được thiết kế để tăng cường sự tương tác của người hâm mộ bằng AI. Một trong những tính năng chính của nó là hệ thống dịch phụ đề thời gian thực do AI hỗ trợ.
Amazon sẽ giành quyền kiểm soát sáng tạo cho loạt phim James Bond từ gia đình Broccoli Vietnet24h - Amazon sắp giành được quyền sáng tạo đối với loạt phim James Bond béo bở.
Squid Game mùa 2: Cơn sốt hay bẫy lừa đảo tiền số? Vietnet24h - Với sự phổ biến của Squid Game mùa hai, các token liên quan đến bộ phim này đã thu hút hàng triệu USD. Tuy nhiên, không ít nhà đầu tư đã mất trắng khi các token này bị sụt giảm giá trị chỉ trong thời gian ngắn, báo hiệu một làn sóng lừa đảo "rút thảm" trên thị trường tiền số.
Lễ chùa thời công nghệ: Nhật Bản số hóa nghi lễ đầu năm Vietnet24h - Chùa Zojoji, biểu tượng Phật giáo tại Tokyo, đang tiên phong tích hợp công nghệ thanh toán QR cho nghi lễ Saisen, vừa tiện lợi vừa giữ nguyên tinh thần truyền thống.
TikTok gặp rắc rối tại Nga: bị phạt vì không gỡ nội dung cấm Vietnet24h - Vừa qua, TikTok bị phạt gần 30.000 USD tại Nga vì vi phạm các quy định pháp lý về nội dung. Quyết định này cho thấy Nga đang quyết liệt hơn trong việc kiểm soát các nền tảng mạng xã hội.
Hoàn thiện hạ tầng viễn thông tại làng Nủ sau thảm họa lũ quét Vietnet24h - Vừa qua, nhà mạng VNPT đã chính thức khởi công lắp đặt trạm phát sóng di động (BTS) tại khu vực xây dựng bản tái định cư mới cho người dân thôn Làng Nủ, huyện Bảo Yên, tỉnh Lào Cai.
Thành công rực rỡ: Black Myth - Wukong thu về gần 1 tỷ USD Vietnet24h - Black Myth: Wukong, tựa game hành động nhập vai của Game Science, đã ghi dấu ấn mạnh mẽ trên thị trường game quốc tế, với doanh thu gần chạm ngưỡng 1 tỷ USD chỉ sau hai tuần ra mắt.
Trải nghiệm âm nhạc kết hợp công nghệ đỉnh cao của Galaxy AI Immersive Vietnet24h - Sự kiện hoành tráng chào đón thế hệ điện thoại gập mới Galaxy Z Fold6 và Galaxy Z Flip6 - nơi âm nhạc và công nghệ hội tụ, thể hiện vị thế tiên phong dẫn đầu kỷ nguyên AI mới đã bùng nổ với 50.000 người tham gia.