Môi trường & Năng lượng
Cách DeepSeek sử dụng phương pháp chưng cất để đào tạo mô hình trí tuệ nhân tạo
Minh Ngọc - Chủ Nhật, 23/02/2025 8:34 SA
Vietnet24h - Phòng thí nghiệm trí tuệ nhân tạo Trung Quốc DeepSeek đã khuấy động thị trường vào tháng 1, gây ra một đợt bán tháo công nghệ và chất bán dẫn lớn sau khi công bố các mô hình AI mà họ cho là rẻ hơn và hiệu quả hơn so với các mô hình của Mỹ.
Nhưng nỗi sợ hãi và đột phá tiềm ẩn đã thúc đẩy đợt bán tháo này còn sâu sắc hơn nhiều so với một công ty khởi nghiệp AI. Thung lũng Silicon hiện đang tính đến một kỹ thuật trong phát triển AI được gọi là chưng cất, một kỹ thuật có thể đảo ngược bảng xếp hạng AI.
 
Chưng cất là một quá trình trích xuất kiến ​​thức từ một mô hình AI lớn hơn để tạo ra một mô hình nhỏ hơn. Nó có thể cho phép một nhóm nhỏ hầu như không có nguồn lực nào tạo ra một mô hình tiên tiến.
 
Một công ty công nghệ hàng đầu đầu tư nhiều năm và hàng triệu đô la để phát triển một mô hình hàng đầu từ đầu. Sau đó, một nhóm nhỏ hơn như DeepSeek lao vào và đào tạo mô hình chuyên biệt hơn của riêng mình bằng cách đặt câu hỏi cho mô hình "giáo viên" lớn hơn. Quá trình này tạo ra một mô hình mới có khả năng gần như mô hình của công ty lớn nhưng đào tạo nhanh hơn và hiệu quả hơn.
 
“Kỹ thuật chưng cất này cực kỳ mạnh mẽ và cực kỳ rẻ, và nó dành cho bất kỳ ai”, Ali Ghodsi, CEO của Databricks, cho biết, đồng thời nói thêm rằng ông hy vọng sẽ thấy sự đổi mới khi nói đến cách xây dựng các mô hình ngôn ngữ lớn hay LLM. “Chúng ta sẽ thấy rất nhiều sự cạnh tranh cho LLM. Đó là những gì sẽ xảy ra trong kỷ nguyên mới mà chúng ta đang bước vào”.
 
Hiện nay, chưng cất đang cho phép các công ty khởi nghiệp và phòng nghiên cứu ít vốn cạnh tranh ở vị trí tiên tiến nhanh hơn bao giờ hết.
 
Các nhà nghiên cứu tại Berkeley cho biết, sử dụng kỹ thuật này, họ đã tái tạo mô hình lý luận của OpenAI với giá 450 đô la trong 19 giờ vào tháng trước. Ngay sau đó, các nhà nghiên cứu tại Stanford và Đại học Washington đã tạo ra mô hình lý luận của riêng họ chỉ trong 26 phút, sử dụng chưa đến 50 đô la tín dụng tính toán, họ cho biết. Công ty khởi nghiệp Hugging Face đã tái tạo tính năng mới nhất và hấp dẫn nhất của OpenAI, Nghiên cứu sâu, dưới dạng thử thách mã hóa trong 24 giờ.
 
DeepSeek không phát minh ra quá trình chưng cất, nhưng nó đã đánh thức thế giới AI về tiềm năng phá vỡ của nó. Nó cũng mở ra sự trỗi dậy của một trật tự nguồn mở mới — một niềm tin rằng tính minh bạch và khả năng tiếp cận thúc đẩy sự đổi mới nhanh hơn so với nghiên cứu đóng cửa.
 
"Nguồn mở luôn chiến thắng trong ngành công nghệ", Arvind Jain, CEO của Glean, công ty tạo ra công cụ tìm kiếm hỗ trợ AI cho các doanh nghiệp, cho biết. "Bạn không thể đánh bại được động lực mà một dự án nguồn mở thành công thực sự có thể tạo ra".
 
Bản thân OpenAI đã quay lại chiến lược nguồn đóng của mình sau thành tích của DeepSeek.
 
"Cá nhân tôi nghĩ rằng chúng ta đã đi sai hướng trong lịch sử và cần tìm ra một chiến lược nguồn mở khác", CEO của OpenAI Sam Altman đã viết trong một bài đăng trên Reddit vào ngày 31 tháng 1.
 
Sự kết hợp giữa sức hút mới tìm thấy của quá trình chưng cất và sự gia tăng phổ biến của nguồn mở đang hoàn toàn thay đổi động lực cạnh tranh trong AI.
Bắc Kinh áp dụng DeepSeek để dẫn đầu việc áp dụng AI khi tìm kiếm động lực tăng trưởng mới Vietnet24h - DeepSeek cũng đã làm rung chuyển hệ sinh thái AI của Trung Quốc, với các tổ chức nhà nước cũng như các công ty công nghệ lớn, bao gồm cả các đối thủ cạnh tranh, tận dụng kiến ​​trúc nguồn mở của nó.
Mô hình AI của Deepseek, là một tác phẩm tốt nhất của Trung Quốc nhưng hơi quá "cường điệu", Giám đốc điều hành của Google Deepmind nói Vietnet24h - Mô hình AI của Deepseek, có lẽ là tác phẩm hay nhất của Trung Quốc, Demis Hassabis, CEO của Google Deepmind cho biết vào Chủ nhật.
Tin khác cùng chuyên mục
Tin đọc nhiều
THUẾ QUAN HOA KỲ VÀ PHÉP THỬ CHIẾN LƯỢC ĐỐI VỚI NGÀNH ĐIỆN TỬ VIỆT NAM Vietnet24h - Những diễn biến gần đây trong chính sách thương mại của Hoa Kỳ đang đặt ngành điện tử Việt Nam – lĩnh vực xuất khẩu mũi nhọn với kim ngạch kỷ lục hơn 164 tỷ USD trong năm 2025 – trước một phép thử lớn về bản lĩnh chiến lược và năng lực thích ứng - Góc nhìn từ Hiệp hội Doanh nghiệp Điện tử Việt Nam.
Ông Trump sẽ tăng thuế quan toàn cầu từ 10% lên 15%, có hiệu lực ngay lập tức Vietnet24h - Tổng thống Donald Trump hôm thứ Bảy tuyên bố sẽ tăng thuế quan toàn cầu từ 10% lên 15%, một ngày sau khi Tòa án Tối cao bác bỏ các mức thuế quan "có đi có lại" của ông.
Điều kiện cấp Giấy chứng nhận doanh nghiệp khoa học – công nghệ: Đòn bẩy cho doanh nghiệp điện tử – bán dẫn Việt Nam Vietnet24h - Bộ Khoa học và Công nghệ vừa ban hành thông tư hướng dẫn điều kiện cấp Giấy chứng nhận doanh nghiệp khoa học và công nghệ (DN KH&CN), mở ra những cơ hội quan trọng cho các doanh nghiệp công nghệ cao, đặc biệt trong ngành điện tử – bán dẫn – công nghệ số.
Chiến lược thuế quan Mỹ gây nghẽn dòng vốn nhập khẩu – tín hiệu thị trường và góc nhìn công nghệ Vietnet24h - Các chính sách thuế quan của chính quyền Hoa Kỳ dưới thời cựu Tổng thống Donald Trump đã tạo ra một lượng lớn khoản thiếu hụt tài trợ trái phiếu hải quan (customs bond) ở mức kỷ lục.
Kinh tế tư nhân phải tăng trưởng hai con số — Một mục tiêu chiến lược cho tăng trưởng bền vững Vietnet24h - Trong Thông báo số 72/TB-VPCP ngày 9/2/2026, Thủ tướng Phạm Minh Chính khẳng định khu vực kinh tế tư nhân phải đạt tốc độ tăng trưởng “hai con số”.
Hàn Quốc trở thành quốc gia đầu tiên ban hành luật toàn diện về sử dụng trí tuệ nhân tạo an toàn Vietnet24h - Hôm thứ Năm (22/1), Hàn Quốc chính thức ban hành luật toàn diện về việc sử dụng an toàn các mô hình trí tuệ nhân tạo (AI), trở thành quốc gia đầu tiên trên thế giới làm điều này.
Thuế quan mới của Mỹ đối với chip tiên tiến của Hàn Quốc có tác động hạn chế Vietnet24h - Hầu hết các sản phẩm bộ nhớ xuất khẩu sang các trung tâm dữ liệu của Mỹ có thể được miễn thuế, thuế quan này được cho là nhắm vào các chip AI xuất sang Trung Quốc.
Từ Arizona đến Việt Nam: Nhân lực bán dẫn và bài toán chiến lược trong kỷ nguyên cạnh tranh công nghệ Vietnet24h - Trong cuộc cạnh tranh công nghệ toàn cầu đang ngày càng quyết liệt, bán dẫn không chỉ là một ngành công nghiệp, mà đã trở thành trụ cột của an ninh kinh tế, an ninh quốc gia và năng lực cạnh tranh dài hạn của mỗi quốc gia.
Từ AI giao tiếp đến robot hình người: Trung Quốc định hình khung quản lý cho thế hệ máy móc “giống người” Vietnet24h - Trung Quốc vừa công bố dự thảo quy định mới nhằm quản lý các hệ thống AI có khả năng tương tác giống con người – một động thái được giới chuyên gia đánh giá là đặt nền móng cho khung pháp lý đối với robot hình người (humanoid robots) trong tương lai gần.
Khi Trung Quốc đặt cược vào “hard technology”: Tái cấu trúc chuỗi cung ứng bán dẫn toàn cầu và những cơ hội – thách thức cho Việt Nam Vietnet24h - Bắc Kinh đang chuyển trọng tâm từ mô hình tăng trưởng dựa trên thị trường tiêu dùng, bất động sản và công nghệ nền tảng số sang xây dựng năng lực công nghệ lõi.
TRIỂN VỌNG NGÀNH THIẾT KẾ BÁN DẪN TẠI VIỆT NAM: TỪ LẮP RÁP ĐẾN CHỦ LỰC CÔNG NGHỆ Vietnet24h - Việt Nam đang chứng kiến một bước chuyển căn bản trong vị thế công nghệ của mình khi ngành bán dẫn – mảng lõi quyết định vận mệnh của nền kinh tế số – bắt đầu được xác định là trọng tâm phát triển chiến lược quốc gia.
Nỗ lực tự chủ sản xuất chip của Trung Quốc đã dẫn nước này đến đâu? Vietnet24h - Nỗ lực tự chủ sản xuất chip của Trung Quốc đã thúc đẩy tăng trưởng nhanh chóng, nhưng nước này vẫn tụt hậu so với các cường quốc sản xuất toàn cầu.
Liệu Ấn Độ có thể thực sự khẳng định vị thế là "thủ đô ứng dụng trí tuệ nhân tạo" của thế giới? Vietnet24h - Hội nghị thượng đỉnh về Tác động AI kéo dài 5 ngày của Ấn Độ đã thu hút hơn 200 tỷ đô la cam kết đầu tư, các quan hệ đối tác cấp cao, sự ra mắt của ít nhất ba mô hình AI của Ấn Độ và nhiều tuyên bố về sự khởi đầu của quá trình chuyển đổi mang tính đột phá.
Thiết kế chip – “điểm rơi chiến lược” để Việt Nam bứt phá trong làn sóng AI và bán dẫn toàn cầu Vietnet24h - Trong khi nhiều quốc gia tập trung vào cuộc đua sản xuất chip tiên tiến với vốn đầu tư hàng chục, thậm chí hàng trăm tỷ USD, thì một hướng đi khác – thiết kế chip (IC design) – đang nổi lên như “điểm rơi chiến lược” phù hợp hơn với các nền kinh tế đang phát triển nhưng có nguồn nhân lực công nghệ mạnh, trong đó có Việt Nam.
Hàn Quốc chuẩn bị khởi động dự án trị giá 687 triệu USD để phát triển chất bán dẫn AI tích hợp trên thiết bị Vietnet24h - Bộ Công nghiệp và Tài nguyên Hàn Quốc hôm thứ Tư (11/2) cho biết, nước này sẽ khởi động dự án trị giá 1 nghìn tỷ won (687,8 triệu USD) vào tháng tới để phát triển chất bán dẫn trí tuệ nhân tạo (AI) dùng trong thiết bị.
Ông chủ SK gặp gỡ CEO Nvidia tại Mỹ để thảo luận về hợp tác HBM và AI Vietnet24h - Theo nguồn tin trong ngành, hôm thứ Hai, Chủ tịch Tập đoàn SK, ông Chey Tae-won, đã gặp Giám đốc điều hành Tập đoàn Nvidia, ông Jensen Huang, tại Hoa Kỳ để thảo luận về hợp tác trong lĩnh vực cung cấp bộ nhớ băng thông cao (HBM) và các hoạt động kinh doanh trí tuệ nhân tạo (AI) rộng hơn.
Apple kỷ niệm 50 năm và tầm nhìn công nghệ cho năm 2026: Chuyển mình từ biểu tượng thiết bị sang kiến tạo hệ sinh thái thông minh Vietnet24h - Trong năm 2026, “nhà Táo” – Apple Inc. – sẽ bước sang cột mốc quan trọng: 50 năm kể từ ngày thành lập (1/4/1976).
Hội chợ Hannover Messe sẽ giúp định vị các công ty Hàn Quốc trở thành những nhà lãnh đạo trong lĩnh vực trí tuệ nhân tạo công nghiệp. Vietnet24h - Với sự trở lại của HD Hyundai Electric lần đầu tiên sau bảy năm, ban tổ chức triển lãm của Đức cũng nhấn mạnh rằng khoảng 70 tổ chức và công ty Hàn Quốc, bao gồm các công ty nhỏ chuyên về máy móc và robot sáng tạo, sẽ tham gia sự kiện để tìm cách thích ứng với những thay đổi nhanh chóng trong lĩnh vực công nghiệp.
Dù Nvidia và OpenAI đang bế tắc trong thương vụ khổng lồ, nhưng họ vẫn cần nhau Vietnet24h - OpenAI và Nvidia, hai công ty đang dẫn đầu sự bùng nổ trí tuệ nhân tạo, vẫn chưa đạt được tiến triển nào trong thỏa thuận trị giá 100 tỷ đô la dự kiến ​​ký kết vào tháng 9.
Lĩnh vực bộ nhớ của Hàn Quốc đang chịu áp lực khi Trung Quốc tiến lên — nhưng vị thế dẫn đầu vẫn được giữ vững. Vietnet24h - Bất chấp nỗ lực đầu tư khổng lồ của Trung Quốc, tiền bạc không thể mua được kinh nghiệm trong lĩnh vực bộ nhớ tiên tiến.
Chủ tịch Chey của tập đoàn SK gặp Tổng Bí thư Tô Lâm để mở rộng quan hệ năng lượng. Vietnet24h - Chủ tịch Tập đoàn SK, ông Chey Tae-won đã gặp Tổng Bí thư Đảng Cộng sản Việt Nam Tô Lâm tại Washington để thảo luận về hợp tác trong lĩnh vực năng lượng và công nghiệp.
LG Energy Solution cam kết hệ thống lưu trữ năng lượng (ESS) an toàn hơn và tạo ra hệ sinh thái LFP Vietnet24h - LG Energy Solution (LGES) hôm thứ Năm cho biết họ đã ký một biên bản ghi nhớ với Tập đoàn An toàn Điện Hàn Quốc (KESCO) để tăng cường an toàn cho các hệ thống lưu trữ năng lượng (ESS) và thúc đẩy hệ sinh thái cho pin lithium sắt photphat (LFP) tại Hàn Quốc.
Foxconn trong kỷ nguyên mới: Khi một biểu tượng sản xuất chuyển mình giữa chuỗi công nghệ toàn cầu Vietnet24h - Foxconn, chính thức là Hon Hai Technology Group, được biết đến rộng rãi là nhà thầu sản xuất hợp đồng lớn nhất thế giới, hợp tác với Apple, Nvidia, Microsoft và nhiều hãng công nghệ khác để lắp ráp điện thoại, máy tính và các thiết bị điện tử tiêu dùng khác.
Sự hồi sinh của ngành điện hạt nhân toàn cầu đang tạo áp lực tăng giá uranium. Vietnet24h - Xu hướng toàn cầu hướng tới việc khởi động lại các nhà máy điện hạt nhân – được thúc đẩy bởi nhu cầu điện năng tăng vọt do sự phát triển của trí tuệ nhân tạo cũng như các biện pháp đối phó với biến đổi khí hậu – đã dẫn đến tình trạng khan hiếm uranium, làm dấy lên lo ngại về tình trạng thiếu hụt nguồn cung.
ĐIỆN HẠT NHÂN TẠI VIỆT NAM TRONG BỐI CẢNH ASEAN VÀ ĐÁNH GIÁ KHẢ NĂNG ĐẠT MỐC VẬN HÀNH 2035 Vietnet24h - Bài báo phân tích vị thế của Việt Nam trong phát triển điện hạt nhân so với một số quốc gia ASEAN, đồng thời đánh giá tính khả thi của mục tiêu đưa nhà máy điện hạt nhân đầu tiên vào vận hành khoảng năm 2035.
Nhật Bản rút khỏi dự án điện hạt nhân Ninh Thuận: Bối cảnh, nguyên nhân và hàm ý chính sách năng lượng cho Việt Nam Vietnet24h - Bài viết phân tích có hệ thống bối cảnh hình thành dự án, các nguyên nhân cốt lõi dẫn đến việc rút lui của phía Nhật Bản, đồng thời rút ra những hàm ý khoa học và chính sách cho Việt Nam trong hoạch định an ninh năng lượng dài hạn.
Thách Thức và Cơ Hội trong Giải Quyết Vấn Đề Làm Mát Trung Tâm Dữ Liệu trong Thời Đại AI Vietnet24h - Trong bối cảnh bùng nổ toàn cầu của các trung tâm dữ liệu, đặc biệt là khi nhu cầu sử dụng ứng dụng trí tuệ nhân tạo (AI) tăng mạnh, việc “giữ mát” cho máy chủ trở thành một thách thức quan trọng.
SK Chemicals tập trung vào tái chế, copolyester thế hệ tiếp theo Vietnet24h - Nhà sản xuất copolyester hàng đầu thế giới tìm cách nâng cấp thương hiệu chịu nhiệt Ecozen
Tập đoàn Nước sạch Hàn Quốc ký kết biên bản ghi nhớ với công ty Kazakhstan và công ty Việt Nam Vietnet24h - Cụm Công nghiệp Nước Hàn Quốc (Korea Water Cluster), một khu công nghiệp được chính phủ hỗ trợ tại Daegu, đã ký kết biên bản ghi nhớ chung (MOU) với Công ty Cấp thoát nước Almaty của Kazakhstan và Tập đoàn Minh Tân của Việt Nam vào thứ Năm (13/11).
Microsoft dự kiến đầu tư 10 tỷ USD vào trung tâm dữ liệu AI tại Bồ Đào Nha Vietnet24h - Microsoft sẽ chi 10 tỷ USD cho một trung tâm dữ liệu trí tuệ nhân tạo dọc theo bờ biển Bồ Đào Nha, đánh dấu một trong những khoản đầu tư lớn nhất của hãng tại châu Âu trong năm nay.