Tư vấn tiêu dùng
Cách DeepSeek sử dụng phương pháp chưng cất để đào tạo mô hình trí tuệ nhân tạo
Minh Ngọc - Chủ Nhật, 23/02/2025 8:34 SA
Vietnet24h - Phòng thí nghiệm trí tuệ nhân tạo Trung Quốc DeepSeek đã khuấy động thị trường vào tháng 1, gây ra một đợt bán tháo công nghệ và chất bán dẫn lớn sau khi công bố các mô hình AI mà họ cho là rẻ hơn và hiệu quả hơn so với các mô hình của Mỹ.
Nhưng nỗi sợ hãi và đột phá tiềm ẩn đã thúc đẩy đợt bán tháo này còn sâu sắc hơn nhiều so với một công ty khởi nghiệp AI. Thung lũng Silicon hiện đang tính đến một kỹ thuật trong phát triển AI được gọi là chưng cất, một kỹ thuật có thể đảo ngược bảng xếp hạng AI.
 
Chưng cất là một quá trình trích xuất kiến ​​thức từ một mô hình AI lớn hơn để tạo ra một mô hình nhỏ hơn. Nó có thể cho phép một nhóm nhỏ hầu như không có nguồn lực nào tạo ra một mô hình tiên tiến.
 
Một công ty công nghệ hàng đầu đầu tư nhiều năm và hàng triệu đô la để phát triển một mô hình hàng đầu từ đầu. Sau đó, một nhóm nhỏ hơn như DeepSeek lao vào và đào tạo mô hình chuyên biệt hơn của riêng mình bằng cách đặt câu hỏi cho mô hình "giáo viên" lớn hơn. Quá trình này tạo ra một mô hình mới có khả năng gần như mô hình của công ty lớn nhưng đào tạo nhanh hơn và hiệu quả hơn.
 
“Kỹ thuật chưng cất này cực kỳ mạnh mẽ và cực kỳ rẻ, và nó dành cho bất kỳ ai”, Ali Ghodsi, CEO của Databricks, cho biết, đồng thời nói thêm rằng ông hy vọng sẽ thấy sự đổi mới khi nói đến cách xây dựng các mô hình ngôn ngữ lớn hay LLM. “Chúng ta sẽ thấy rất nhiều sự cạnh tranh cho LLM. Đó là những gì sẽ xảy ra trong kỷ nguyên mới mà chúng ta đang bước vào”.
 
Hiện nay, chưng cất đang cho phép các công ty khởi nghiệp và phòng nghiên cứu ít vốn cạnh tranh ở vị trí tiên tiến nhanh hơn bao giờ hết.
 
Các nhà nghiên cứu tại Berkeley cho biết, sử dụng kỹ thuật này, họ đã tái tạo mô hình lý luận của OpenAI với giá 450 đô la trong 19 giờ vào tháng trước. Ngay sau đó, các nhà nghiên cứu tại Stanford và Đại học Washington đã tạo ra mô hình lý luận của riêng họ chỉ trong 26 phút, sử dụng chưa đến 50 đô la tín dụng tính toán, họ cho biết. Công ty khởi nghiệp Hugging Face đã tái tạo tính năng mới nhất và hấp dẫn nhất của OpenAI, Nghiên cứu sâu, dưới dạng thử thách mã hóa trong 24 giờ.
 
DeepSeek không phát minh ra quá trình chưng cất, nhưng nó đã đánh thức thế giới AI về tiềm năng phá vỡ của nó. Nó cũng mở ra sự trỗi dậy của một trật tự nguồn mở mới — một niềm tin rằng tính minh bạch và khả năng tiếp cận thúc đẩy sự đổi mới nhanh hơn so với nghiên cứu đóng cửa.
 
"Nguồn mở luôn chiến thắng trong ngành công nghệ", Arvind Jain, CEO của Glean, công ty tạo ra công cụ tìm kiếm hỗ trợ AI cho các doanh nghiệp, cho biết. "Bạn không thể đánh bại được động lực mà một dự án nguồn mở thành công thực sự có thể tạo ra".
 
Bản thân OpenAI đã quay lại chiến lược nguồn đóng của mình sau thành tích của DeepSeek.
 
"Cá nhân tôi nghĩ rằng chúng ta đã đi sai hướng trong lịch sử và cần tìm ra một chiến lược nguồn mở khác", CEO của OpenAI Sam Altman đã viết trong một bài đăng trên Reddit vào ngày 31 tháng 1.
 
Sự kết hợp giữa sức hút mới tìm thấy của quá trình chưng cất và sự gia tăng phổ biến của nguồn mở đang hoàn toàn thay đổi động lực cạnh tranh trong AI.
Bắc Kinh áp dụng DeepSeek để dẫn đầu việc áp dụng AI khi tìm kiếm động lực tăng trưởng mới Vietnet24h - DeepSeek cũng đã làm rung chuyển hệ sinh thái AI của Trung Quốc, với các tổ chức nhà nước cũng như các công ty công nghệ lớn, bao gồm cả các đối thủ cạnh tranh, tận dụng kiến ​​trúc nguồn mở của nó.
Mô hình AI của Deepseek, là một tác phẩm tốt nhất của Trung Quốc nhưng hơi quá "cường điệu", Giám đốc điều hành của Google Deepmind nói Vietnet24h - Mô hình AI của Deepseek, có lẽ là tác phẩm hay nhất của Trung Quốc, Demis Hassabis, CEO của Google Deepmind cho biết vào Chủ nhật.
Tin khác cùng chuyên mục
Tin đọc nhiều
Hàn Quốc trì hoãn quyết định về yêu cầu xuất khẩu dữ liệu bản đồ có độ chính xác cao của Apple Vietnet24h - Chính phủ Hàn Quốc đã hoãn quyết định về việc có cho phép Apple xuất khẩu dữ liệu bản đồ kỹ thuật số có độ chính xác cao hay không, với lý do cần cân nhắc thêm về an ninh quốc gia và các tác động đối với ngành công nghiệp.
Samsung giới thiệu tinh hoa của không gian bếp âm tường cao cấp Vietnet24h - Bếp từ tích hợp máy hút mùi và máy rửa bát Bespoke AI mới vừa mang lại hiệu suất, hiệu quả tiết kiệm điện vượt trội, vừa giữ trọn nét thẩm mỹ tối giản theo xu hướng bếp châu Âu.
Samsung Sắp Ra Mắt Kính Thông Minh Không Màn Hình, Apple Gặp Khó Trong Cuộc Đua Công Nghệ Vietnet24h - Samsung đang âm thầm chuẩn bị cho một bước tiến mới trong lĩnh vực công nghệ với dự án kính thông minh không màn hình (display-free smart glasses), dự kiến ra mắt vào cuối năm tới.
Meta sẽ ra mắt kính thông minh Hypernova có màn hình và dây đeo cổ tay tại Connect vào tháng tới Vietnet24h - Meta dự kiến ​​sẽ ra mắt hai chiếc kính thông minh mới tại hội nghị dành cho nhà phát triển Connect thường niên vào tháng 9.
Viettronics Thủ Đức tiên phong ra mắt Giải pháp hệ thống âm thanh, loa đa hướng 360 – Bước tiến công nghệ cho không gian hội họp thông minh Vietnet24h - Khi cả quốc gia đang đồng hành trên con đường chuyển đổi số và tự động hóa, Công ty Cổ phần Viettronics Thủ Đức – thương hiệu gắn liền với dòng sản phẩm công nghệ điện tử “Make in Vietnam” – đã chính thức cho ra mắt sản phẩm Giải pháp hệ thống âm thanh loa đa hướng 360, một giải pháp âm thanh thông minh, được thiết kế chuyên biệt cho phòng họp, hội trường, phòng học và các không gian tương tác hiện đại.
Apple Watch Series 10 giảm giá 100 đô la trên Amazon – Sản phẩm không thể thiếu cho những người mua sắm thông thái Vietnet24h - Apple Watch Series 10 không phải là một chiếc đồng hồ thông minh thông thường. Nó tự hào sánh vai cùng các đối thủ như Pixel Watch 3 và Galaxy Watch 8.
Làm quen với Apple iPhone Fold: Chiếc điện thoại có thể gập đầu tiên đáng mua Vietnet24h - Các báo cáo cho thấy Apple đang phát triển một thiết kế đột phá cho iPhone Fold, với màn hình không nếp nhăn mang tính cách mạng, tận dụng công nghệ kim loại lỏng.
Google tiết lộ hình ảnh đầu tiên tuyệt đẹp về tất cả các mẫu Pixel 10 sắp ra mắt Vietnet24h - Điên thoại thông minh Pixel 10 đã "Hiện đã có sẵn", kèm theo mức giảm giá 50 đô la, thu hút người mua tiềm năng cho đến ngày 13 tháng 10.
Khám phá những màu sắc mới rực rỡ sắp có trên dòng iPhone 17! Vietnet24h - Với những tin đồn về các tính năng đột phá và thay đổi thiết kế lan truyền chóng mặt, sự mong đợi iPhone 17 đang ở mức cao nhất mọi thời đại.
Apple sắp gây bất ngờ với những nâng cấp bí mật cho MacBook – Dưới đây là những điều bạn có thể mong đợi! Vietnet24h - Apple được cho là đang chuẩn bị cách mạng hóa cách các thiết bị của mình nhận bản cập nhật, lấy cảm hứng từ hệ thống Presto tiên tiến, vốn đã cập nhật iPhone không dây ngay khi còn trong hộp.
Phong trào toàn cầu bảo vệ trẻ em trực tuyến thúc đẩy làn sóng công nghệ an toàn AI Vietnet24h - Một phong trào toàn cầu nhằm bảo vệ trẻ em an toàn trực tuyến đang ngày càng phát triển, với các quy định mới nghiêm ngặt được đưa ra tại Vương quốc Anh và Hoa Kỳ.
Galaxy Watch8 series trở thành trợ thủ công nghệ mới của các tín đồ biohacking Vietnet24h - Biohacking hay ‘hack tuổi sinh học’ là việc biến dữ liệu sức khỏe cá nhân thành những thay đổi nhỏ mỗi ngày nhằm cải thiện thể chất và kéo dài tuổi thọ.
Apple cân nhắc khôi phục dịch vụ sửa chữa iPad tại cửa hàng vào cuối năm Vietnet24h - Apple đang đẩy mạnh dịch vụ khách hàng bằng cách có thể thay đổi cách thức xử lý việc sửa chữa iPad tại Hoa Kỳ.
Galaxy S26 Pro tỏa sáng trong báo cáo về pin, trong khi S26 Edge gặp nhiều thách thức Vietnet24h - Tin đồn đang lan truyền rằng dòng Galaxy S26 sắp ra mắt có thể sẽ giới thiệu bốn mẫu máy ấn tượng, phá vỡ bộ ba truyền thống.
Chỉ vài phút sau động đất, thế giới đã biết liệu có sóng thần hay không Vietnet24h - Cảnh báo sớm sóng thần từng là điều xa xỉ, nhưng ngày nay các nhà khoa học chỉ mất vài phút để phát tín hiệu giúp hàng triệu người có cơ hội sống sót – nhờ hệ thống quan sát đáy biển, dữ liệu vệ tinh và AI.
Mua Motorola Razr+ (2025) tại Amazon ngay hôm nay với mức giá tốt thứ hai từ trước đến nay Vietnet24h - Motorola Razr+ (2025) đã trở thành tâm điểm chú ý trong thế giới điện thoại thông minh, và hiện tại, nó đang thu hút sự chú ý vì tất cả những lý do chính đáng.
Hơn 1.200 website giả mạo bị phát hiện mỗi ngày: Tội phạm mạng chuyển hướng tấn công người dùng cá nhân Vietnet24h - Số liệu từ các tổ chức giám sát an ninh mạng cho thấy, mỗi ngày có hàng nghìn tên miền giả mạo được đăng ký nhằm mục đích đánh cắp dữ liệu người dùng. Đáng chú ý, các website “nhái” thường sao chép hoàn toàn giao diện của ngân hàng, dịch vụ đặt phòng, trang mua sắm, khiến nạn nhân dễ dàng sập bẫy nếu không kiểm tra kỹ.
iPad Air M512 2GB giảm giá hấp dẫn nhất từ ​​trước đến nay trên Amazon Vietnet24h - Bạn có thể mua cùng một mẫu iPad Air M2 512GB 11 inch với mức giảm giá đáng kinh ngạc là 33%, tương đương với khoản tiết kiệm hào phóng là 350 đô la.
Apple cân nhắc cho phép người dùng iPhone lựa chọn các giải pháp thay thế Siri làm trợ lý mặc định Vietnet24h - Khi Siri gặp khó khăn trong việc đưa ra câu trả lời thỏa đáng, bạn vẫn có thể gọi Google để được trợ giúp.
iPhone 13 được cập nhật tính năng nhắn tin vệ tinh qua iOS 18.5 Vietnet24h - Với iOS 18.5, Apple chính thức cho phép iPhone 13 nhắn tin vệ tinh thông qua một số nhà mạng, mở rộng khả năng kết nối không phụ thuộc hạ tầng truyền thống. Tuy nhiên, tính năng này không áp dụng với mọi thiết bị và nhà mạng, cho thấy chiến lược triển khai có chọn lọc của hãng.