Kinh tế
Cách DeepSeek sử dụng phương pháp chưng cất để đào tạo mô hình trí tuệ nhân tạo
Minh Ngọc - Chủ Nhật, 23/02/2025 8:34 SA
Vietnet24h - Phòng thí nghiệm trí tuệ nhân tạo Trung Quốc DeepSeek đã khuấy động thị trường vào tháng 1, gây ra một đợt bán tháo công nghệ và chất bán dẫn lớn sau khi công bố các mô hình AI mà họ cho là rẻ hơn và hiệu quả hơn so với các mô hình của Mỹ.
Nhưng nỗi sợ hãi và đột phá tiềm ẩn đã thúc đẩy đợt bán tháo này còn sâu sắc hơn nhiều so với một công ty khởi nghiệp AI. Thung lũng Silicon hiện đang tính đến một kỹ thuật trong phát triển AI được gọi là chưng cất, một kỹ thuật có thể đảo ngược bảng xếp hạng AI.
 
Chưng cất là một quá trình trích xuất kiến ​​thức từ một mô hình AI lớn hơn để tạo ra một mô hình nhỏ hơn. Nó có thể cho phép một nhóm nhỏ hầu như không có nguồn lực nào tạo ra một mô hình tiên tiến.
 
Một công ty công nghệ hàng đầu đầu tư nhiều năm và hàng triệu đô la để phát triển một mô hình hàng đầu từ đầu. Sau đó, một nhóm nhỏ hơn như DeepSeek lao vào và đào tạo mô hình chuyên biệt hơn của riêng mình bằng cách đặt câu hỏi cho mô hình "giáo viên" lớn hơn. Quá trình này tạo ra một mô hình mới có khả năng gần như mô hình của công ty lớn nhưng đào tạo nhanh hơn và hiệu quả hơn.
 
“Kỹ thuật chưng cất này cực kỳ mạnh mẽ và cực kỳ rẻ, và nó dành cho bất kỳ ai”, Ali Ghodsi, CEO của Databricks, cho biết, đồng thời nói thêm rằng ông hy vọng sẽ thấy sự đổi mới khi nói đến cách xây dựng các mô hình ngôn ngữ lớn hay LLM. “Chúng ta sẽ thấy rất nhiều sự cạnh tranh cho LLM. Đó là những gì sẽ xảy ra trong kỷ nguyên mới mà chúng ta đang bước vào”.
 
Hiện nay, chưng cất đang cho phép các công ty khởi nghiệp và phòng nghiên cứu ít vốn cạnh tranh ở vị trí tiên tiến nhanh hơn bao giờ hết.
 
Các nhà nghiên cứu tại Berkeley cho biết, sử dụng kỹ thuật này, họ đã tái tạo mô hình lý luận của OpenAI với giá 450 đô la trong 19 giờ vào tháng trước. Ngay sau đó, các nhà nghiên cứu tại Stanford và Đại học Washington đã tạo ra mô hình lý luận của riêng họ chỉ trong 26 phút, sử dụng chưa đến 50 đô la tín dụng tính toán, họ cho biết. Công ty khởi nghiệp Hugging Face đã tái tạo tính năng mới nhất và hấp dẫn nhất của OpenAI, Nghiên cứu sâu, dưới dạng thử thách mã hóa trong 24 giờ.
 
DeepSeek không phát minh ra quá trình chưng cất, nhưng nó đã đánh thức thế giới AI về tiềm năng phá vỡ của nó. Nó cũng mở ra sự trỗi dậy của một trật tự nguồn mở mới — một niềm tin rằng tính minh bạch và khả năng tiếp cận thúc đẩy sự đổi mới nhanh hơn so với nghiên cứu đóng cửa.
 
"Nguồn mở luôn chiến thắng trong ngành công nghệ", Arvind Jain, CEO của Glean, công ty tạo ra công cụ tìm kiếm hỗ trợ AI cho các doanh nghiệp, cho biết. "Bạn không thể đánh bại được động lực mà một dự án nguồn mở thành công thực sự có thể tạo ra".
 
Bản thân OpenAI đã quay lại chiến lược nguồn đóng của mình sau thành tích của DeepSeek.
 
"Cá nhân tôi nghĩ rằng chúng ta đã đi sai hướng trong lịch sử và cần tìm ra một chiến lược nguồn mở khác", CEO của OpenAI Sam Altman đã viết trong một bài đăng trên Reddit vào ngày 31 tháng 1.
 
Sự kết hợp giữa sức hút mới tìm thấy của quá trình chưng cất và sự gia tăng phổ biến của nguồn mở đang hoàn toàn thay đổi động lực cạnh tranh trong AI.
Bắc Kinh áp dụng DeepSeek để dẫn đầu việc áp dụng AI khi tìm kiếm động lực tăng trưởng mới Vietnet24h - DeepSeek cũng đã làm rung chuyển hệ sinh thái AI của Trung Quốc, với các tổ chức nhà nước cũng như các công ty công nghệ lớn, bao gồm cả các đối thủ cạnh tranh, tận dụng kiến ​​trúc nguồn mở của nó.
Mô hình AI của Deepseek, là một tác phẩm tốt nhất của Trung Quốc nhưng hơi quá "cường điệu", Giám đốc điều hành của Google Deepmind nói Vietnet24h - Mô hình AI của Deepseek, có lẽ là tác phẩm hay nhất của Trung Quốc, Demis Hassabis, CEO của Google Deepmind cho biết vào Chủ nhật.
Tin khác cùng chuyên mục
Tin đọc nhiều
Cổ phiếu các công ty liên quan đến hệ thống làm mát trung tâm dữ liệu giảm giá sau phát ngôn của CEO Nvidia Vietnet24h - Cổ phiếu của các công ty liên quan đến hệ thống sưởi, thông gió và điều hòa không khí của Mỹ đã giảm vào thứ Ba sau khi Giám đốc điều hành Nvidia, Jensen Huang, cho biết các chip sắp ra mắt của công ty có thể giảm đáng kể nhu cầu làm mát trong các trung tâm dữ liệu.
Doanh thu quý 4 của Foxconn tăng vọt 22% lên mức cao kỷ lục nhờ nhu cầu về trí tuệ nhân tạo (AI). Vietnet24h - Tập đoàn Foxconn của Đài Loan, nhà sản xuất điện tử theo hợp đồng lớn nhất thế giới, đã báo cáo doanh thu quý IV đạt mức kỷ lục vào thứ Hai (5/1), nhờ nhu cầu mạnh mẽ đối với các sản phẩm trí tuệ nhân tạo.
Cổ phiếu công ty sản xuất chip AI Biren của Trung Quốc tăng vọt trong phiên giao dịch đầu tư trực tuyến tại Hồng Kông Vietnet24h - Cổ phiếu của công ty thiết kế chip trí tuệ nhân tạo Trung Quốc Shanghai Biren Technology đã tăng 76% trong phiên giao dịch đầu tiên tại Hồng Kông vào thứ Sáu (2/1), đây là đợt niêm yết đầu tiên của trung tâm tài chính này trong năm 2026.
Đồng rupee suy yếu: tín hiệu cảnh báo từ một nền kinh tế đang trỗi dậy Vietnet24h - Năm 2025 khép lại với một nghịch lý đáng chú ý của kinh tế Ấn Độ: trong khi quốc gia Nam Á này tiếp tục được ca ngợi là “động cơ tăng trưởng mới của châu Á”, thì đồng tiền quốc gia – rupee – lại trở thành một trong những đồng tiền có diễn biến yếu nhất khu vực.
Cổ phiếu Oracle đang trên đà trải qua quý tồi tệ nhất kể từ năm 2001 khi các CEO mới đối mặt với những lo ngại về việc triển khai trí tuệ nhân tạo (AI). Vietnet24h - Cổ phiếu của Oracle đã giảm 30% trong quý này, hướng tới mức giảm mạnh nhất kể từ quý 3 năm 2001, khi nó giảm gần 34%.
Samsung (Harman) thâu tóm ADAS của ZF: Bước ngoặt chiến lược trong kỷ nguyên ô tô phần mềm Vietnet24h - Reuters công bố hôm 23/12/2025 cho biết Harman International, đơn vị thuộc Samsung Electronics, đã đồng ý mua lại mảng Hệ thống hỗ trợ lái xe tiên tiến (ADAS) của ZF Group (Đức) trị giá khoảng 1,5 tỷ euro (tương đương khoảng 1,8 tỷ USD).
Các hợp đồng thuê mặt bằng của Oracle tăng gần 150% khi công ty mở rộng cơ sở hạ tầng để đáp ứng nhu cầu về trí tuệ nhân tạo (AI). Vietnet24h - Oracle đang đồng thời lên kế hoạch chi tiêu vốn lớn hơn và ký kết các hợp đồng thuê để đáp ứng nhu cầu về cơ sở hạ tầng đám mây cho các khách hàng về trí tuệ nhân tạo như OpenAI.
SK Hynix nhắm đến việc niêm yết tại Mỹ khi mở rộng hoạt động trong lĩnh vực trí tuệ nhân tạo Vietnet24h - SK Hynix cho biết họ đang "xem xét nhiều biện pháp khác nhau để nâng cao giá trị doanh nghiệp, bao gồm cả việc niêm yết trên thị trường chứng khoán Mỹ bằng cách sử dụng cổ phiếu quỹ."
Cổ phiếu Oracle giảm mạnh 11% do doanh thu yếu, kéo theo sự sụt giảm của các cổ phiếu AI như Nvidia và CoreWeave. Vietnet24h - Lợi nhuận quý của Oracle vượt kỳ vọng, nhưng doanh thu lại không đạt như mong đợi.
Samsung Electronics công bố kết quả kinh doanh Quý III năm 2025 Vietnet24h - Samsung Electronics vừa qua đã công bố kết quả kinh doanh hợp nhất Quý III năm tài chính 2025, kết thúc vào ngày 30 tháng 9 năm 2025.
Meta đối mặt với cuộc điều tra của Trung Quốc về thương vụ mua lại công ty khởi nghiệp về trí tuệ nhân tạo Manus. Vietnet24h - Tháng trước, Meta đã mua lại Manus có trụ sở tại Singapore, khi gã khổng lồ công nghệ Mỹ tìm cách tích hợp tự động hóa tiên tiến vào các sản phẩm dành cho người tiêu dùng và doanh nghiệp của mình.
Microsoft được tiết lộ là công ty đứng sau đề xuất xây dựng trung tâm dữ liệu gây tranh cãi tại một thị trấn ở Michigan. Vietnet24h - Microsoft cho biết họ quan tâm đến việc xây dựng một trung tâm dữ liệu trên một khu đất nằm cạnh đường cao tốc liên bang bên ngoài Grand Rapids, Michigan.
Marvell mua lại công ty thiết bị mạng XConn với giá 540 triệu đô la trong bối cảnh thúc đẩy cơ sở hạ tầng trí tuệ nhân tạo (AI). Vietnet24h - Hôm thứ Ba (6/1), Marvell Technology tuyên bố sẽ mua lại nhà cung cấp thiết bị mạng XConn Technologies với giá trị khoảng 540 triệu đô la.
Công ty Starlink của Elon Musk cung cấp truy cập internet miễn phí tại Venezuela sau các cuộc không kích của Mỹ Vietnet24h - Starlink đã cung cấp dịch vụ internet miễn phí tại Venezuela sau cuộc đột kích của Mỹ bắt giữ Maduro.
Nhật Bản sẽ hỗ trợ phát triển robot trí tuệ nhân tạo cho ngành đóng tàu. Vietnet24h - Nhật Bản sẽ bắt đầu hỗ trợ phát triển robot sử dụng trí tuệ nhân tạo (AI) cho ngành đóng tàu trong nước trong năm nay, một phần trong nỗ lực giải quyết tình trạng thiếu lao động trong một ngành công nghiệp quan trọng đối với nền kinh tế quốc gia.
Mỹ cáo buộc luật mạng mới của Hàn Quốc sẽ ảnh hưởng tiêu cực đến hoạt động kinh doanh của các tập đoàn công nghệ lớn của Mỹ Vietnet24h - Những lời chỉ trích về việc sửa đổi luật làm gia tăng rủi ro xung đột thương mại.
Trung Quốc cáo buộc Hà Lan phạm sai lầm trong vụ việc liên quan đến nhà sản xuất chip Nexperia. Vietnet24h - Hôm thứ Tư (31/12), Trung Quốc kêu gọi Hà Lan "ngay lập tức sửa chữa sai lầm" liên quan đến nhà sản xuất chip Nexperia.
Một dự án của Hàn Quốc đặt mục tiêu bắt đầu sản xuất hàng loạt máy bay không người lái nội địa vào năm 2026. Vietnet24h - Công ty Airbility Inc., một doanh nghiệp Hàn Quốc chuyên về công nghệ di chuyển xanh, dự định bắt đầu sản xuất hàng loạt máy bay không người lái do chính mình sản xuất vào năm tới để mở rộng sự hiện diện trong ngành công nghiệp máy bay không người lái.
Mức lương ngành sản xuất tại Hàn Quốc vượt Nhật Bản và Đài Loan hơn 25%. Vietnet24h - Liên đoàn Doanh nghiệp Hàn Quốc nêu bật khoảng cách tiền lương ngày càng gia tăng trong báo cáo mới.
Huawei nhắm đến thị trường cơ sở hạ tầng AI của Hàn Quốc với chip Ascend 950. Vietnet24h - Huawei hy vọng sẽ ra mắt chip trí tuệ nhân tạo (AI) mới nhất của mình tại Hàn Quốc vào năm tới.
Khám phá những kiệt tác nổi tiếng của Henri Matisse, Salvador Dalí và Mark Rothko trên Samsung Art Store Vietnet24h - Samsung Electronics công bố bổ sung 15 tác phẩm nghệ thuật mới từ Tate vào Samsung Art Store.
ChatGPT, Claude, Gemini... lần đầu tiên tham dự thi đấu cờ vua Vietnet24h - Không còn là những chuyên gia viết luận hay trả lời phỏng vấn, các chatbot nổi tiếng lần đầu thi đấu cờ vua như những kỳ thủ thực thụ. Nhưng khi “bộ não ngôn ngữ” bước vào bàn cờ chiến thuật, chuyện đi sai luật hay “mắc bẫy ngớ ngẩn” là điều khó tránh khỏi.
Sự trỗi dậy của những “kỹ sư sân cỏ”: Khi chuyển nhượng bóng đá không còn là canh bạc cảm tính Vietnet24h - Trong suốt nhiều thập kỷ, các thương vụ chuyển nhượng cầu thủ thường được định đoạt bởi trực giác, mạng lưới cá nhân của giới tuyển trạch, hay đơn giản chỉ là tên tuổi và phong độ hiện tại của một cầu thủ. Nhưng bóng đá đang chuyển mình mạnh mẽ. Và ở thời điểm mà dữ liệu thống kê, trí tuệ nhân tạo và học máy ngày càng định hình cách chơi và cách mua bán, một “kỹ sư Microsoft” như Sudarshan Gopaladesikan trở thành biểu tượng cho một hình mẫu hoàn toàn mới: chuyên gia phân tích dữ liệu như mắt thần trong bóng tối, người biến canh bạc cảm tính thành chiến lược khoa học.
Bill Gates cho biết việc Trump cắt giảm ngân sách của USAID là vô cùng tàn khốc: 'Vẫn chưa quá muộn để đảo ngược chúng' Vietnet24h - Bill Gates cho biết tác động của việc Tổng thống Donald Trump cắt giảm USAID là "thảm khốc" nhưng có thể ngăn chặn được.
iPhone đang làm tổn thương giới trẻ? Người thiết kế ra nó lên tiếng Vietnet24h - Jony Ive, cha đẻ của iPhone, thừa nhận công nghệ smartphone đã dẫn đến những hậu quả đáng lo cho sức khỏe tâm thần. Cùng bà Powell Jobs, ông đang âm thầm phát triển một thiết bị mới để “sửa sai” cho chính di sản của mình.
Meta tìm đến trọng tài để ngăn chặn người tố giác quảng bá cuốn sách tiết lộ tất cả Vietnet24h - Meta đang tìm cách ngăn chặn việc quảng bá cuốn hồi ký mới của một cựu nhân viên có nội dung mô tả công ty theo hướng không hay, bao gồm cả cáo buộc quấy rối tình dục của giám đốc chính sách công ty.
KT kết hợp AI với thể thao, K-pop tại Đại hội Thế giới Di động (MWC) 2025 Vietnet24h - K-Stadium được thiết kế để tăng cường sự tương tác của người hâm mộ bằng AI. Một trong những tính năng chính của nó là hệ thống dịch phụ đề thời gian thực do AI hỗ trợ.
Amazon sẽ giành quyền kiểm soát sáng tạo cho loạt phim James Bond từ gia đình Broccoli Vietnet24h - Amazon sắp giành được quyền sáng tạo đối với loạt phim James Bond béo bở.
Squid Game mùa 2: Cơn sốt hay bẫy lừa đảo tiền số? Vietnet24h - Với sự phổ biến của Squid Game mùa hai, các token liên quan đến bộ phim này đã thu hút hàng triệu USD. Tuy nhiên, không ít nhà đầu tư đã mất trắng khi các token này bị sụt giảm giá trị chỉ trong thời gian ngắn, báo hiệu một làn sóng lừa đảo "rút thảm" trên thị trường tiền số.
Lễ chùa thời công nghệ: Nhật Bản số hóa nghi lễ đầu năm Vietnet24h - Chùa Zojoji, biểu tượng Phật giáo tại Tokyo, đang tiên phong tích hợp công nghệ thanh toán QR cho nghi lễ Saisen, vừa tiện lợi vừa giữ nguyên tinh thần truyền thống.