Công nghệ độc lạ
Cách DeepSeek sử dụng phương pháp chưng cất để đào tạo mô hình trí tuệ nhân tạo
Minh Ngọc - Chủ Nhật, 23/02/2025 8:34 SA
Vietnet24h - Phòng thí nghiệm trí tuệ nhân tạo Trung Quốc DeepSeek đã khuấy động thị trường vào tháng 1, gây ra một đợt bán tháo công nghệ và chất bán dẫn lớn sau khi công bố các mô hình AI mà họ cho là rẻ hơn và hiệu quả hơn so với các mô hình của Mỹ.
Nhưng nỗi sợ hãi và đột phá tiềm ẩn đã thúc đẩy đợt bán tháo này còn sâu sắc hơn nhiều so với một công ty khởi nghiệp AI. Thung lũng Silicon hiện đang tính đến một kỹ thuật trong phát triển AI được gọi là chưng cất, một kỹ thuật có thể đảo ngược bảng xếp hạng AI.
 
Chưng cất là một quá trình trích xuất kiến ​​thức từ một mô hình AI lớn hơn để tạo ra một mô hình nhỏ hơn. Nó có thể cho phép một nhóm nhỏ hầu như không có nguồn lực nào tạo ra một mô hình tiên tiến.
 
Một công ty công nghệ hàng đầu đầu tư nhiều năm và hàng triệu đô la để phát triển một mô hình hàng đầu từ đầu. Sau đó, một nhóm nhỏ hơn như DeepSeek lao vào và đào tạo mô hình chuyên biệt hơn của riêng mình bằng cách đặt câu hỏi cho mô hình "giáo viên" lớn hơn. Quá trình này tạo ra một mô hình mới có khả năng gần như mô hình của công ty lớn nhưng đào tạo nhanh hơn và hiệu quả hơn.
 
“Kỹ thuật chưng cất này cực kỳ mạnh mẽ và cực kỳ rẻ, và nó dành cho bất kỳ ai”, Ali Ghodsi, CEO của Databricks, cho biết, đồng thời nói thêm rằng ông hy vọng sẽ thấy sự đổi mới khi nói đến cách xây dựng các mô hình ngôn ngữ lớn hay LLM. “Chúng ta sẽ thấy rất nhiều sự cạnh tranh cho LLM. Đó là những gì sẽ xảy ra trong kỷ nguyên mới mà chúng ta đang bước vào”.
 
Hiện nay, chưng cất đang cho phép các công ty khởi nghiệp và phòng nghiên cứu ít vốn cạnh tranh ở vị trí tiên tiến nhanh hơn bao giờ hết.
 
Các nhà nghiên cứu tại Berkeley cho biết, sử dụng kỹ thuật này, họ đã tái tạo mô hình lý luận của OpenAI với giá 450 đô la trong 19 giờ vào tháng trước. Ngay sau đó, các nhà nghiên cứu tại Stanford và Đại học Washington đã tạo ra mô hình lý luận của riêng họ chỉ trong 26 phút, sử dụng chưa đến 50 đô la tín dụng tính toán, họ cho biết. Công ty khởi nghiệp Hugging Face đã tái tạo tính năng mới nhất và hấp dẫn nhất của OpenAI, Nghiên cứu sâu, dưới dạng thử thách mã hóa trong 24 giờ.
 
DeepSeek không phát minh ra quá trình chưng cất, nhưng nó đã đánh thức thế giới AI về tiềm năng phá vỡ của nó. Nó cũng mở ra sự trỗi dậy của một trật tự nguồn mở mới — một niềm tin rằng tính minh bạch và khả năng tiếp cận thúc đẩy sự đổi mới nhanh hơn so với nghiên cứu đóng cửa.
 
"Nguồn mở luôn chiến thắng trong ngành công nghệ", Arvind Jain, CEO của Glean, công ty tạo ra công cụ tìm kiếm hỗ trợ AI cho các doanh nghiệp, cho biết. "Bạn không thể đánh bại được động lực mà một dự án nguồn mở thành công thực sự có thể tạo ra".
 
Bản thân OpenAI đã quay lại chiến lược nguồn đóng của mình sau thành tích của DeepSeek.
 
"Cá nhân tôi nghĩ rằng chúng ta đã đi sai hướng trong lịch sử và cần tìm ra một chiến lược nguồn mở khác", CEO của OpenAI Sam Altman đã viết trong một bài đăng trên Reddit vào ngày 31 tháng 1.
 
Sự kết hợp giữa sức hút mới tìm thấy của quá trình chưng cất và sự gia tăng phổ biến của nguồn mở đang hoàn toàn thay đổi động lực cạnh tranh trong AI.
Bắc Kinh áp dụng DeepSeek để dẫn đầu việc áp dụng AI khi tìm kiếm động lực tăng trưởng mới Vietnet24h - DeepSeek cũng đã làm rung chuyển hệ sinh thái AI của Trung Quốc, với các tổ chức nhà nước cũng như các công ty công nghệ lớn, bao gồm cả các đối thủ cạnh tranh, tận dụng kiến ​​trúc nguồn mở của nó.
Mô hình AI của Deepseek, là một tác phẩm tốt nhất của Trung Quốc nhưng hơi quá "cường điệu", Giám đốc điều hành của Google Deepmind nói Vietnet24h - Mô hình AI của Deepseek, có lẽ là tác phẩm hay nhất của Trung Quốc, Demis Hassabis, CEO của Google Deepmind cho biết vào Chủ nhật.
Tin khác cùng chuyên mục
Tin đọc nhiều
Meta Connect 2025: Kính thông minh tích hợp AI chiếm vị trí trung tâm Vietnet24h - Meta đã chi hàng tỷ đô la để cố gắng đưa thực tế ảo (VR) trở thành xu hướng với người tiêu dùng. Khi chuyển hướng chiến lược metaverse sang kính thông minh, các nhà đầu tư sẽ theo dõi phản ứng của công chúng.
Virtual Twin: mô hình kỹ thuật số mô phỏng chính xác một thực thể vật lý hoặc hệ thống trong thế giới thực Vietnet24h - Virtual Twin (Song sinh số) là một mô hình kỹ thuật số được tạo ra để mô phỏng chính xác một thực thể vật lý hoặc hệ thống trong thế giới thực, như sản phẩm, quy trình sản xuất, hoặc thậm chí là toàn bộ nhà máy, thành phố.
Google Maps cho phép xem lại đường phố từ quá khứ, bạn đã thử chưa? Vietnet24h - Chỉ với vài cú nhấn trên ứng dụng hoặc máy tính, bạn có thể quay lại thời điểm năm 2010 để xem phố xá lúc đó như thế nào. Đây là tính năng Street View mở rộng mà nhiều người dùng vẫn chưa khám phá hết.
Google Search tiết lộ những tính năng sáng tạo có thể thay đổi trải nghiệm trực tuyến của bạn Vietnet24h - Các công cụ tìm kiếm vẫn là đồng minh đáng tin cậy của chúng ta trong hành trình tìm kiếm thông tin, với 16,4 tỷ truy vấn mỗi ngày chỉ tính riêng trên Google.
Google Maps nên lo lắng: Apple Maps giờ thông minh hơn và... nhớ cả bạn thích đi đâu! Vietnet24h - Apple vừa tung bản cập nhật iOS 26 khiến cộng đồng công nghệ xôn xao. Apple Maps không chỉ dẫn đường mà còn ghi nhớ thói quen di chuyển, gợi ý theo sở thích cá nhân và bảo mật tuyệt đối. Đây chính là điều mà Google Maps – với mọi dữ liệu khổng lồ – vẫn chưa thể làm được.
Apple và cuộc "đại tu hệ điều hành" tại WWDC 2025: Khi con số không chỉ là ký hiệu Vietnet24h - Tại WWDC 2025, Apple không đơn thuần giới thiệu các phiên bản phần mềm kế tiếp mà đang vẽ lại cả triết lý định danh sản phẩm và trải nghiệm người dùng. Việc chuyển từ iOS 19 sang iOS 26 không phải chỉ là đổi số, mà là tín hiệu của một chiến lược hợp nhất, đồng bộ và hướng tới tương lai của toàn hệ sinh thái Apple.
Sony FE PZ 16-35mm F4 G – Khi sự tinh gọn gặp sức mạnh quang học Vietnet24h - Trong thế giới nhiếp ảnh và quay phim hiện đại, nơi tính linh hoạt và hiệu suất thường phải đánh đổi lẫn nhau, Sony một lần nữa chứng minh họ có thể phá vỡ quy luật ấy bằng việc ra mắt ống kính zoom điện góc rộng FE PZ 16-35mm F4 G – một minh chứng cho hướng đi ngày càng rõ ràng của hãng: tối ưu trải nghiệm sáng tạo nội dung trên hệ máy mirrorless full-frame mà không thỏa hiệp về chất lượng.
Vì sao màn hình kép và AI khiến Yoga Book 9i trở nên khác biệt? Vietnet24h - Không phải là chiếc laptop đầu tiên có màn hình kép, nhưng Yoga Book 9i kết hợp công nghệ OLED, AI và thiết kế xoay gập linh hoạt theo cách mà rất ít sản phẩm trên thị trường có thể làm được. Đâu là điểm khiến nó trở thành công cụ mơ ước cho người làm sáng tạo?
Muốn dùng AI không cần mạng? Google đã có giải pháp mới cho bạn Vietnet24h - Không cần Wi-Fi, không cần 4G, bạn vẫn có thể tạo ảnh, viết code hay tóm tắt văn bản nhờ AI. Với AI Edge Gallery, Google mang trải nghiệm trí tuệ nhân tạo về ngay trong túi áo của bạn – gọn nhẹ, bảo mật và sẵn sàng mọi lúc.
Thiết kế siêu mỏng "đòi hỏi" đánh đổi – iPhone 17 Air và bài toán năng lượng Vietnet24h - Việc Apple chuẩn bị trình làng iPhone 17 Air với thiết kế siêu mỏng chỉ 5,5 mm, theo tiết lộ mới nhất từ tài khoản yeux1122 trên Naver, đang tạo ra nhiều kỳ vọng về mặt thẩm mỹ – nhưng cũng đồng thời đặt ra những dấu hỏi lớn về hiệu suất pin và trải nghiệm người dùng trong thực tế.
Cổ phiếu Intel tăng vọt khi có tin công ty đang trong giai đoạn đàm phán đầu tiên để thêm AMD làm khách hàng Vietnet24h - Theo báo cáo từ Semafor, Intel đang trong giai đoạn đàm phán ban đầu với AMD để sản xuất chip cho hãng này tại xưởng đúc của mình.
Samsung dự kiến ​​ra mắt điện thoại thông minh gập ba tại hội nghị thượng đỉnh APEC Vietnet24h - Hôm qua, thứ Ba (30/9), các nguồn tin trong ngành cho biết, Samsung Electronics dự kiến ​​sẽ ra mắt điện thoại thông minh gập ba đầu tiên của mình tại Hội nghị thượng đỉnh Hợp tác Kinh tế Châu Á - Thái Bình Dương (APEC) sắp tới.
Trump Ký Sắc Lệnh Mở Đường Cho Thỏa Thuận TikTok: Trung Quốc “Bật Đèn Xanh” Vietnet24h - Ngày 25/9/2025, Tổng thống Mỹ Donald Trump đã ký sắc lệnh hành pháp, đánh dấu bước tiến quan trọng trong việc hoàn tất thỏa thuận bán tài sản TikTok tại Mỹ cho một liên danh các nhà đầu tư chủ yếu là người Mỹ.
MediaTek ra mắt chip flagship Dimensity 9500 được xây dựng trên quy trình 3nm của TSMC Vietnet24h - Được trang bị quy trình 3nm của TSMC, công nghệ mới nhất mà nhà sản xuất chip này đã bắt đầu sản xuất hàng loạt, bộ xử lý lõi siêu mạnh của Dimensity 9500 đạt mức tiêu thụ điện năng thấp hơn tới 55% ở hiệu suất cao nhất.
Apple ra mắt iPhone Air với chip A19 Pro mới, tập trung mạnh vào AI Vietnet24h - Apple vừa chính thức trình làng iPhone Air, mẫu điện thoại mới nhất trong dòng sản phẩm iPhone 17, lên kệ vào thứ Sáu (19/9) vừa qua.
LG Innotek hoàn thành việc mở rộng nhà máy sản xuất module camera tại Việt Nam Vietnet24h - Hôm Chủ nhật (21/9), LG Innotek thông báo đã hoàn tất việc mở rộng nhà máy sản xuất mô-đun camera tại Việt Nam, một phần trong chiến lược cắt giảm chi phí thông qua việc vận hành các trung tâm sản xuất tại cả Việt Nam và Hàn Quốc.
GEIMS Việt Nam 2025: Kết nối doanh nghiệp Việt với công nghệ và đối tác toàn cầu Vietnet24h - GEIMS Việt Nam 2025 không chỉ là triển lãm thương mại, mà còn là điểm hội tụ của tri thức, công nghệ và kết nối.
CEO Nvidia Huang cho biết khoản đầu tư 5 tỷ đô la vào đối thủ Intel sẽ là 'một khoản đầu tư đáng kinh ngạc' Vietnet24h - Giám đốc điều hành Nvidia Jensen Huang cho biết khoản đầu tư 5 tỷ đô la và hợp tác công nghệ với Intel diễn ra sau khi hai công ty đã thảo luận trong gần một năm.
MediaTek áp dụng quy trình 2nm của TSMC cho chip hàng đầu mới Vietnet24h - MediaTek Inc., nhà thiết kế chip lớn nhất Đài Loan, hôm thứ Ba (16/9) cho biết, họ đã áp dụng quy trình 2 nanomet tiên tiến của Taiwan Semiconductor Manufacturing Co. (TSMC)
Exynos trở lại: Samsung chuẩn bị chip 2nm cho Galaxy S26 Vietnet24h - Samsung Electronics sẽ bắt đầu sản xuất hàng loạt bộ vi xử lý di động Exynos 2600 trong tháng này, dự kiến ​​sẽ được trang bị cho điện thoại thông minh Galaxy S26 vào năm sau, các nguồn tin trong ngành cho biết hôm thứ Hai.
PCIM Asia Shanghai 2025: Cuộc Cách Mạng Công Nghệ Điện Tử Công Suất – Phỏng Vấn Độc Quyền Với CEO EPC Về Tương Lai GaN Và AI Vietnet24h - Phóng viên Vietnet24h đã có cơ hội phỏng vấn độc quyền ông Alexander Lidow, Tiến sĩ khoa học, Tổng Giám đốc điều hành EPC (Efficient Power Conversion) – một trong những nhà tiên phong về công nghệ Gallium Nitride (GaN).
Triển Lãm Robot Tại Thượng Hải 2025: Đa Robot, Đa Nhiệm Vụ Và Tương Lai Việc Làm Tự Động Hóa Vietnet24h - Thượng Hải, Trung Quốc, ngày 27/9/2025 – Trong khuôn khổ China International Industry Fair (CIIF) 2025, Triển lãm Robot (Robot Show) đang diễn ra sôi nổi từ ngày 23 đến 27/9 tại Trung tâm Triển lãm và Hội nghị Quốc gia (National Exhibition and Convention Center, địa chỉ: 333 Songze Avenue, Quận Thanh Phổ, Thượng Hải).
Mark Zuckerberg ra mắt kính Meta Ray-Ban Display giá 799 đô la Vietnet24h - Hôm thứ Tư, Mark Zuckerberg đã ra mắt chiếc kính Meta Ray-Ban Display trị giá 799 đô la, chiếc kính thông minh đầu tiên của công ty truyền thông xã hội này dành cho người tiêu dùng với màn hình tích hợp.
SK hynix ra mắt DRAM di động cắt nhiệt đầu tiên Vietnet24h - Gã khổng lồ chip nhớ cho biết họ là công ty đầu tiên phát triển vật liệu High-K EMC, giải quyết hiệu quả vấn đề sinh nhiệt và suy giảm hiệu suất do truyền dữ liệu nhanh cho các ứng dụng AI trên thiết bị.
WindRunner: Chuyến bay chưa cất cánh của ngành điện gió Vietnet24h - Nằm tại Boulder, Colorado, một công ty khởi nghiệp tên Radia đang ấp ủ chế tạo chiếc máy bay lớn nhất thế giới. Nhưng trước khi WindRunner có thể vươn lên bầu trời với những cánh turbine khổng lồ trong khoang, họ phải vượt qua những giới hạn tưởng chừng không thể: từ kỹ thuật, quy định cho đến niềm tin thị trường.
Trung Quốc: Robot trí tuệ nhân tạo đầu tiên học tiến sĩ nghệ thuật Vietnet24h - Xueba 01 – robot hình người được phát triển tại Thượng Hải – vừa chính thức được ghi danh vào chương trình tiến sĩ 4 năm về kịch nghệ. Đây là lần đầu tiên một cỗ máy được công nhận tư cách nghiên cứu sinh trong lĩnh vực nghệ thuật biểu diễn tại Trung Quốc.
Bê tông thông minh và giấc mơ về một ngành xây dựng trung hòa carbon Vietnet24h - Trong bối cảnh biến đổi khí hậu trở thành một trong những thách thức cấp bách nhất của nhân loại, một đột phá từ Đại học Southern California (USC) có thể định hình lại ngành xây dựng – lĩnh vực vốn là một trong những nguồn phát thải CO₂ lớn nhất toàn cầu. Nhưng lần này, vật liệu truyền thống như bê tông không chỉ là một phần của vấn đề, mà đang được tái định nghĩa để trở thành một phần của giải pháp.
Apple hướng đến mục tiêu cách mạng hóa nhiếp ảnh với camera iPhone mới lấy cảm hứng từ thị giác con người Vietnet24h - Theo một bằng sáng chế mới được nộp, Apple đang hướng đến mục tiêu cách mạng hóa công nghệ camera trên những chiếc iPhone trong tương lai, tiết lộ những kế hoạch đầy tham vọng nhằm nâng cao khả năng chụp ảnh.
Otto Aviation trình làng máy bay không cửa sổ Phantom 3500, bay thử từ 2027 Vietnet24h - Mẫu máy bay Phantom 3500 do Otto Aviation phát triển đang gây chú ý với thiết kế không cửa sổ nhằm tăng hiệu suất khí động học. Công ty dự kiến sẽ cho cất cánh thử nghiệm vào cuối năm 2027, mở ra chương mới cho hàng không thương mại cận âm.
LG Innotek ra mắt mô-đun xe truyền thông vệ tinh 5G đầu tiên trên thế giới Vietnet24h - Mô-đun mới nhất hỗ trợ 5G NR-NTN, một mạng truyền thông di động hoạt động trên các vệ tinh quỹ đạo Trái đất thấp, cho phép truyền dữ liệu khối lượng lớn theo thời gian thực.