Hướng dẫn công nghệ
Cách DeepSeek sử dụng phương pháp chưng cất để đào tạo mô hình trí tuệ nhân tạo
Minh Ngọc - Chủ Nhật, 23/02/2025 8:34 SA
Vietnet24h - Phòng thí nghiệm trí tuệ nhân tạo Trung Quốc DeepSeek đã khuấy động thị trường vào tháng 1, gây ra một đợt bán tháo công nghệ và chất bán dẫn lớn sau khi công bố các mô hình AI mà họ cho là rẻ hơn và hiệu quả hơn so với các mô hình của Mỹ.
Nhưng nỗi sợ hãi và đột phá tiềm ẩn đã thúc đẩy đợt bán tháo này còn sâu sắc hơn nhiều so với một công ty khởi nghiệp AI. Thung lũng Silicon hiện đang tính đến một kỹ thuật trong phát triển AI được gọi là chưng cất, một kỹ thuật có thể đảo ngược bảng xếp hạng AI.
 
Chưng cất là một quá trình trích xuất kiến ​​thức từ một mô hình AI lớn hơn để tạo ra một mô hình nhỏ hơn. Nó có thể cho phép một nhóm nhỏ hầu như không có nguồn lực nào tạo ra một mô hình tiên tiến.
 
Một công ty công nghệ hàng đầu đầu tư nhiều năm và hàng triệu đô la để phát triển một mô hình hàng đầu từ đầu. Sau đó, một nhóm nhỏ hơn như DeepSeek lao vào và đào tạo mô hình chuyên biệt hơn của riêng mình bằng cách đặt câu hỏi cho mô hình "giáo viên" lớn hơn. Quá trình này tạo ra một mô hình mới có khả năng gần như mô hình của công ty lớn nhưng đào tạo nhanh hơn và hiệu quả hơn.
 
“Kỹ thuật chưng cất này cực kỳ mạnh mẽ và cực kỳ rẻ, và nó dành cho bất kỳ ai”, Ali Ghodsi, CEO của Databricks, cho biết, đồng thời nói thêm rằng ông hy vọng sẽ thấy sự đổi mới khi nói đến cách xây dựng các mô hình ngôn ngữ lớn hay LLM. “Chúng ta sẽ thấy rất nhiều sự cạnh tranh cho LLM. Đó là những gì sẽ xảy ra trong kỷ nguyên mới mà chúng ta đang bước vào”.
 
Hiện nay, chưng cất đang cho phép các công ty khởi nghiệp và phòng nghiên cứu ít vốn cạnh tranh ở vị trí tiên tiến nhanh hơn bao giờ hết.
 
Các nhà nghiên cứu tại Berkeley cho biết, sử dụng kỹ thuật này, họ đã tái tạo mô hình lý luận của OpenAI với giá 450 đô la trong 19 giờ vào tháng trước. Ngay sau đó, các nhà nghiên cứu tại Stanford và Đại học Washington đã tạo ra mô hình lý luận của riêng họ chỉ trong 26 phút, sử dụng chưa đến 50 đô la tín dụng tính toán, họ cho biết. Công ty khởi nghiệp Hugging Face đã tái tạo tính năng mới nhất và hấp dẫn nhất của OpenAI, Nghiên cứu sâu, dưới dạng thử thách mã hóa trong 24 giờ.
 
DeepSeek không phát minh ra quá trình chưng cất, nhưng nó đã đánh thức thế giới AI về tiềm năng phá vỡ của nó. Nó cũng mở ra sự trỗi dậy của một trật tự nguồn mở mới — một niềm tin rằng tính minh bạch và khả năng tiếp cận thúc đẩy sự đổi mới nhanh hơn so với nghiên cứu đóng cửa.
 
"Nguồn mở luôn chiến thắng trong ngành công nghệ", Arvind Jain, CEO của Glean, công ty tạo ra công cụ tìm kiếm hỗ trợ AI cho các doanh nghiệp, cho biết. "Bạn không thể đánh bại được động lực mà một dự án nguồn mở thành công thực sự có thể tạo ra".
 
Bản thân OpenAI đã quay lại chiến lược nguồn đóng của mình sau thành tích của DeepSeek.
 
"Cá nhân tôi nghĩ rằng chúng ta đã đi sai hướng trong lịch sử và cần tìm ra một chiến lược nguồn mở khác", CEO của OpenAI Sam Altman đã viết trong một bài đăng trên Reddit vào ngày 31 tháng 1.
 
Sự kết hợp giữa sức hút mới tìm thấy của quá trình chưng cất và sự gia tăng phổ biến của nguồn mở đang hoàn toàn thay đổi động lực cạnh tranh trong AI.
Bắc Kinh áp dụng DeepSeek để dẫn đầu việc áp dụng AI khi tìm kiếm động lực tăng trưởng mới Vietnet24h - DeepSeek cũng đã làm rung chuyển hệ sinh thái AI của Trung Quốc, với các tổ chức nhà nước cũng như các công ty công nghệ lớn, bao gồm cả các đối thủ cạnh tranh, tận dụng kiến ​​trúc nguồn mở của nó.
Mô hình AI của Deepseek, là một tác phẩm tốt nhất của Trung Quốc nhưng hơi quá "cường điệu", Giám đốc điều hành của Google Deepmind nói Vietnet24h - Mô hình AI của Deepseek, có lẽ là tác phẩm hay nhất của Trung Quốc, Demis Hassabis, CEO của Google Deepmind cho biết vào Chủ nhật.
Tin khác cùng chuyên mục
Tin đọc nhiều
Sony FE PZ 16-35mm F4 G – Khi sự tinh gọn gặp sức mạnh quang học Vietnet24h - Trong thế giới nhiếp ảnh và quay phim hiện đại, nơi tính linh hoạt và hiệu suất thường phải đánh đổi lẫn nhau, Sony một lần nữa chứng minh họ có thể phá vỡ quy luật ấy bằng việc ra mắt ống kính zoom điện góc rộng FE PZ 16-35mm F4 G – một minh chứng cho hướng đi ngày càng rõ ràng của hãng: tối ưu trải nghiệm sáng tạo nội dung trên hệ máy mirrorless full-frame mà không thỏa hiệp về chất lượng.
Vì sao màn hình kép và AI khiến Yoga Book 9i trở nên khác biệt? Vietnet24h - Không phải là chiếc laptop đầu tiên có màn hình kép, nhưng Yoga Book 9i kết hợp công nghệ OLED, AI và thiết kế xoay gập linh hoạt theo cách mà rất ít sản phẩm trên thị trường có thể làm được. Đâu là điểm khiến nó trở thành công cụ mơ ước cho người làm sáng tạo?
Muốn dùng AI không cần mạng? Google đã có giải pháp mới cho bạn Vietnet24h - Không cần Wi-Fi, không cần 4G, bạn vẫn có thể tạo ảnh, viết code hay tóm tắt văn bản nhờ AI. Với AI Edge Gallery, Google mang trải nghiệm trí tuệ nhân tạo về ngay trong túi áo của bạn – gọn nhẹ, bảo mật và sẵn sàng mọi lúc.
Thiết kế siêu mỏng "đòi hỏi" đánh đổi – iPhone 17 Air và bài toán năng lượng Vietnet24h - Việc Apple chuẩn bị trình làng iPhone 17 Air với thiết kế siêu mỏng chỉ 5,5 mm, theo tiết lộ mới nhất từ tài khoản yeux1122 trên Naver, đang tạo ra nhiều kỳ vọng về mặt thẩm mỹ – nhưng cũng đồng thời đặt ra những dấu hỏi lớn về hiệu suất pin và trải nghiệm người dùng trong thực tế.
MediaTek ra mắt bộ xử lý AI cho Chromebook Plus Vietnet24h - MediaTek Inc., nhà thiết kế IC lớn nhất tại Đài Loan, đã giới thiệu bộ xử lý mới -- Kompanio Ultra -- vào thứ Hai, công ty mô tả đây là cột mốc mới nhất trong Chromebook hiệu suất cao, chạy bằng trí tuệ nhân tạo.
Chuẩn GPMI của Trung Quốc: ‘Một dây cáp cho mọi thiết bị’ Vietnet24h - GPMI được thiết kế để tối giản hóa kết nối số bằng cách gộp cả dữ liệu và điện năng vào một sợi cáp duy nhất. Nếu được phổ biến, đây có thể là bước ngoặt định hình lại hệ sinh thái điện tử trong tương lai.
Rò rỉ cách Apple sẽ làm cho màn hình bên trong của iPhone gập trở nên quen thuộc với người dùng iPad Vietnet24h - Chiếc điện thoại có thể gập đầu tiên của Apple dự kiến ​​sẽ được sản xuất hàng loạt vào cuối năm sau và có thể ra mắt vào quý 4 năm 2026 hoặc quý 1 năm 2027.
Alibaba cung cấp miễn phí mô hình tạo video AI trên toàn cầu Vietnet24h - Gã khổng lồ Trung Quốc cho biết họ đang mở mã nguồn bốn mô hình thuộc dòng Wan2.1, phiên bản mới nhất của mô hình AI nền tảng của công ty, có khả năng tạo hình ảnh và video từ dữ liệu đầu vào là văn bản và hình ảnh.
Từ Gmail đến Word, cài đặt quyền riêng tư và AI của bạn đang bước vào một mối quan hệ mới Vietnet24h - Các chương trình như Gmail, Microsoft và Facebook đã tồn tại trong nhiều năm qua đã âm thầm kích hoạt và tích hợp các tính năng AI.
AI trong Gmail, Word: Tiện ích hay mối đe dọa quyền riêng tư? Vietnet24h - AI đang dần xâm nhập vào mọi ngóc ngách của cuộc sống số, từ email đến sổ sách kế toán. Tuy nhiên, sự thiếu rõ ràng trong chính sách bảo mật khiến nhiều chuyên gia cảnh báo về nguy cơ dữ liệu cá nhân bị lạm dụng.
Dữ liệu mới cho thấy chip Nvidia đạt được tiến bộ trong việc đào tạo các hệ thống AI lớn nhất Vietnet24h - Trong kết quả nhanh nhất cho chip mới của Nvidia, 2.496 chip Blackwell đã hoàn thành bài kiểm tra đào tạo trong 27 phút.
iPhone 17: Khi Apple buộc phải lắng nghe người dùng Vietnet24h - Từ màn hình lớn hơn đến tốc độ làm mới 120Hz, dòng iPhone 17 cho thấy Apple đang phá bỏ ranh giới giữa tiêu chuẩn và cao cấp. Đặc biệt, phiên bản iPhone 17 Air có thể là quân bài chiến lược để đối đầu trực tiếp với Samsung trong cuộc đua thiết kế mỏng nhẹ.
Nvidia vượt qua Microsoft, giành lại danh hiệu công ty có giá trị nhất lần đầu tiên kể từ tháng Giêng Vietnet24h - Nvidia đã vượt qua Microsoft về vốn hóa thị trường vào thứ Ba, một lần nữa trở thành công ty đại chúng có giá trị nhất thế giới.
Trung Quốc chỉ trích Trump vì 'lạm dụng' kiểm soát xuất khẩu chất bán dẫn Vietnet24h - Trung Quốc lên tiếng phản đối việc kiểm soát xuất khẩu chất bán dẫn của Hoa Kỳ để đáp trả cáo buộc của Trump rằng nền kinh tế lớn thứ hai thế giới đã vi phạm thỏa thuận thương mại sơ bộ giữa hai nước.
Tàu vũ trụ Starship của SpaceX phát nổ lần thứ ba liên tiếp Vietnet24h - SpaceX chứng kiến ​​hệ thống Starship của mình phát nổ vào thứ ba trong chuyến bay thử nghiệm, đây là thất bại thứ ba liên tiếp của nhà sản xuất tên lửa của Elon Musk.
Samsung sẽ bổ sung model Edge vào Galaxy S26 vào năm sau Vietnet24h - Samsung đang có kế hoạch bổ sung thêm một mẫu Edge vào dòng điện thoại thông minh Galaxy S26 của mình vào năm tới,
CEO Nvidia công bố sáng kiến ​​xây dựng siêu máy tính AI cho Đài Loan Vietnet24h - CEO Nvidia Huang Jensen công bố sáng kiến xây dựng "siêu máy tính AI khổng lồ đầu tiên" cho Đài Loan vào thứ Hai (19/5).
Samsung Display ra mắt tại Computex, tiết lộ màn hình OLED CNTT thế hệ tiếp theo Vietnet24h - Samsung Display đã công bố vào ngày 20 tháng 5 việc công ty sẽ lần đầu tiên tham gia Computex, triển lãm công nghệ thông tin (CNTT) lớn nhất châu Á được tổ chức tại Đài Loan, giới thiệu một loạt các tấm nền diode phát quang hữu cơ (OLED) hàng đầu trong ngành.
Nvidia công bố công nghệ mới để giữ vị trí trung tâm trong phát triển AI Vietnet24h - Chương trình “NVLink Fusion” mới của Nvidia sẽ cho phép khách hàng và đối tác sử dụng CPU và GPU không phải của Nvidia cùng với các sản phẩm của Nvidia và NVLink.
Nvidia, Cisco, Oracle và OpenAI đang hỗ trợ dự án trung tâm dữ liệu Stargate của UAE Vietnet24h - Các gã khổng lồ công nghệ Hoa Kỳ là Nvidia, Cisco, Oracle và OpenAI đang hỗ trợ trung tâm dữ liệu trí tuệ nhân tạo “UAE Stargate” được công bố trong tuần này.
LG Innotek ra mắt mô-đun xe truyền thông vệ tinh 5G đầu tiên trên thế giới Vietnet24h - Mô-đun mới nhất hỗ trợ 5G NR-NTN, một mạng truyền thông di động hoạt động trên các vệ tinh quỹ đạo Trái đất thấp, cho phép truyền dữ liệu khối lượng lớn theo thời gian thực.
Công nghệ như phim viễn tưởng: Đeo kính áp tròng, nhắm mắt vẫn thấy rõ! Vietnet24h - Ngỡ chỉ có trong phim Marvel, nhưng loại kính áp tròng siêu nhỏ gọn vừa ra đời tại Trung Quốc lại có thể giúp người dùng nhìn thấy trong đêm tối mà không cần mở mắt. Chuyện thật như đùa, nhưng khoa học đã chứng minh điều đó là khả thi.
Google, Samsung sẽ ra mắt kính thông minh XR trong năm nay Vietnet24h - Samsung bước lên vị trí dẫn đầu về phần cứng trong sự trở lại của kính thông minh Google, mở rộng vai trò trong hệ sinh thái XR đang phát triển
Neuralink: cấy chip não, biên tập video và đăng YouTube bằng suy nghĩ Vietnet24h - Trong một bước đột phá ấn tượng, Bradford Smith, người mắc bệnh ALS, đã chứng minh khả năng tuyệt vời của công nghệ giao diện não-máy tính (BCI) khi có thể biên tập video và đăng tải lên YouTube chỉ bằng suy nghĩ, mà không cần sự trợ giúp từ bất kỳ thiết bị hay người khác. Đây không chỉ là sự tiến bộ trong lĩnh vực công nghệ mà còn mang lại hy vọng mới cho những người khuyết tật vận động.
LG Display công bố màn hình OLED màu xanh huỳnh quang thương mại đầu tiên trên thế giới Vietnet24h - LG Display đã xác minh thành công hiệu suất sản xuất của tấm nền điốt phát quang hữu cơ phát quang màu xanh lam (OLED) cho dây chuyền sản xuất hàng loạt lần đầu tiên trên thế giới, công ty cho biết hôm thứ Năm (1/5).
Người Trung Quốc chuẩn bị bay như Iron Man! Vietnet24h - Một thiết bị bay cá nhân vừa được trình diễn tại Hàng Châu khiến nhiều người liên tưởng đến các bộ phim siêu anh hùng. Nhưng lần này, không phải Hollywood mà chính các nhà khoa học Trung Quốc mới là người hiện thực hóa giấc mơ bay cá nhân.
Công nghệ cấy ghép não được FDA chấp thuận cho Precision Neuroscience Vietnet24h - Precision Neuroscience thông báo rằng một thành phần cốt lõi của hệ thống cấy ghép não đã được Cục Quản lý Thực phẩm và Dược phẩm Hoa Kỳ chấp thuận.
Từ ghi hình kép đến UX sáng tạo: iPhone 17 Pro có thể mở ra chương mới trong thiết kế trải nghiệm Vietnet24h - Không chỉ là tính năng mới, ghi hình kép trên iPhone 17 Pro là phép thử đầu tiên cho cách Apple xây dựng trải nghiệm người dùng kiểu mới – nơi cảm xúc, phản ứng và câu chuyện của người quay trở thành trung tâm của mọi khung hình.
Kim loại lỏng: Apple đang thử nghiệm cho iPhone gập, bền hơn titan 2,5 lần Vietnet24h - Công nghệ bản lề kim loại lỏng có thể giúp iPhone gập không chỉ bền hơn mà còn có thiết kế sang trọng hơn. Liệu đây có phải là bước tiến lớn trong công nghệ smartphone gập?
Apple áp dụng kim loại lỏng cho iPhone gập, mở ra kỷ nguyên mới Vietnet24h - Apple được cho là sẽ sử dụng kim loại lỏng để chế tạo bản lề cho iPhone gập, giúp tăng độ bền và hạn chế nếp gấp màn hình. Công nghệ này có thể tạo ra bước đột phá trên thị trường smartphone gập.