Công nghệ
Cách DeepSeek sử dụng phương pháp chưng cất để đào tạo mô hình trí tuệ nhân tạo
Minh Ngọc - Chủ Nhật, 23/02/2025 8:34 SA
Vietnet24h - Phòng thí nghiệm trí tuệ nhân tạo Trung Quốc DeepSeek đã khuấy động thị trường vào tháng 1, gây ra một đợt bán tháo công nghệ và chất bán dẫn lớn sau khi công bố các mô hình AI mà họ cho là rẻ hơn và hiệu quả hơn so với các mô hình của Mỹ.
Nhưng nỗi sợ hãi và đột phá tiềm ẩn đã thúc đẩy đợt bán tháo này còn sâu sắc hơn nhiều so với một công ty khởi nghiệp AI. Thung lũng Silicon hiện đang tính đến một kỹ thuật trong phát triển AI được gọi là chưng cất, một kỹ thuật có thể đảo ngược bảng xếp hạng AI.
 
Chưng cất là một quá trình trích xuất kiến ​​thức từ một mô hình AI lớn hơn để tạo ra một mô hình nhỏ hơn. Nó có thể cho phép một nhóm nhỏ hầu như không có nguồn lực nào tạo ra một mô hình tiên tiến.
 
Một công ty công nghệ hàng đầu đầu tư nhiều năm và hàng triệu đô la để phát triển một mô hình hàng đầu từ đầu. Sau đó, một nhóm nhỏ hơn như DeepSeek lao vào và đào tạo mô hình chuyên biệt hơn của riêng mình bằng cách đặt câu hỏi cho mô hình "giáo viên" lớn hơn. Quá trình này tạo ra một mô hình mới có khả năng gần như mô hình của công ty lớn nhưng đào tạo nhanh hơn và hiệu quả hơn.
 
“Kỹ thuật chưng cất này cực kỳ mạnh mẽ và cực kỳ rẻ, và nó dành cho bất kỳ ai”, Ali Ghodsi, CEO của Databricks, cho biết, đồng thời nói thêm rằng ông hy vọng sẽ thấy sự đổi mới khi nói đến cách xây dựng các mô hình ngôn ngữ lớn hay LLM. “Chúng ta sẽ thấy rất nhiều sự cạnh tranh cho LLM. Đó là những gì sẽ xảy ra trong kỷ nguyên mới mà chúng ta đang bước vào”.
 
Hiện nay, chưng cất đang cho phép các công ty khởi nghiệp và phòng nghiên cứu ít vốn cạnh tranh ở vị trí tiên tiến nhanh hơn bao giờ hết.
 
Các nhà nghiên cứu tại Berkeley cho biết, sử dụng kỹ thuật này, họ đã tái tạo mô hình lý luận của OpenAI với giá 450 đô la trong 19 giờ vào tháng trước. Ngay sau đó, các nhà nghiên cứu tại Stanford và Đại học Washington đã tạo ra mô hình lý luận của riêng họ chỉ trong 26 phút, sử dụng chưa đến 50 đô la tín dụng tính toán, họ cho biết. Công ty khởi nghiệp Hugging Face đã tái tạo tính năng mới nhất và hấp dẫn nhất của OpenAI, Nghiên cứu sâu, dưới dạng thử thách mã hóa trong 24 giờ.
 
DeepSeek không phát minh ra quá trình chưng cất, nhưng nó đã đánh thức thế giới AI về tiềm năng phá vỡ của nó. Nó cũng mở ra sự trỗi dậy của một trật tự nguồn mở mới — một niềm tin rằng tính minh bạch và khả năng tiếp cận thúc đẩy sự đổi mới nhanh hơn so với nghiên cứu đóng cửa.
 
"Nguồn mở luôn chiến thắng trong ngành công nghệ", Arvind Jain, CEO của Glean, công ty tạo ra công cụ tìm kiếm hỗ trợ AI cho các doanh nghiệp, cho biết. "Bạn không thể đánh bại được động lực mà một dự án nguồn mở thành công thực sự có thể tạo ra".
 
Bản thân OpenAI đã quay lại chiến lược nguồn đóng của mình sau thành tích của DeepSeek.
 
"Cá nhân tôi nghĩ rằng chúng ta đã đi sai hướng trong lịch sử và cần tìm ra một chiến lược nguồn mở khác", CEO của OpenAI Sam Altman đã viết trong một bài đăng trên Reddit vào ngày 31 tháng 1.
 
Sự kết hợp giữa sức hút mới tìm thấy của quá trình chưng cất và sự gia tăng phổ biến của nguồn mở đang hoàn toàn thay đổi động lực cạnh tranh trong AI.
Bắc Kinh áp dụng DeepSeek để dẫn đầu việc áp dụng AI khi tìm kiếm động lực tăng trưởng mới Vietnet24h - DeepSeek cũng đã làm rung chuyển hệ sinh thái AI của Trung Quốc, với các tổ chức nhà nước cũng như các công ty công nghệ lớn, bao gồm cả các đối thủ cạnh tranh, tận dụng kiến ​​trúc nguồn mở của nó.
Mô hình AI của Deepseek, là một tác phẩm tốt nhất của Trung Quốc nhưng hơi quá "cường điệu", Giám đốc điều hành của Google Deepmind nói Vietnet24h - Mô hình AI của Deepseek, có lẽ là tác phẩm hay nhất của Trung Quốc, Demis Hassabis, CEO của Google Deepmind cho biết vào Chủ nhật.
Tin khác cùng chuyên mục
Tin đọc nhiều
Alibaba cung cấp miễn phí mô hình tạo video AI trên toàn cầu Vietnet24h - Gã khổng lồ Trung Quốc cho biết họ đang mở mã nguồn bốn mô hình thuộc dòng Wan2.1, phiên bản mới nhất của mô hình AI nền tảng của công ty, có khả năng tạo hình ảnh và video từ dữ liệu đầu vào là văn bản và hình ảnh.
Từ Gmail đến Word, cài đặt quyền riêng tư và AI của bạn đang bước vào một mối quan hệ mới Vietnet24h - Các chương trình như Gmail, Microsoft và Facebook đã tồn tại trong nhiều năm qua đã âm thầm kích hoạt và tích hợp các tính năng AI.
AI trong Gmail, Word: Tiện ích hay mối đe dọa quyền riêng tư? Vietnet24h - AI đang dần xâm nhập vào mọi ngóc ngách của cuộc sống số, từ email đến sổ sách kế toán. Tuy nhiên, sự thiếu rõ ràng trong chính sách bảo mật khiến nhiều chuyên gia cảnh báo về nguy cơ dữ liệu cá nhân bị lạm dụng.
OpenAI bật mí 5 mẹo dùng ChatGPT mà bạn chưa biết Vietnet24h - Nick Turley, chuyên gia của OpenAI, tiết lộ các tính năng như tải tập tin, tạo GPT tùy chỉnh và sử dụng giọng nói, hứa hẹn thay đổi cách người dùng tương tác với ChatGPT.
Ghi âm cuộc gọi và cải tiến camera: Những điểm nổi bật trong iOS 18.1 của Apple Vietnet24h - Vào tối 28 tháng 10, Apple phát hành phiên bản iOS 18.1, mang đến tính năng ghi âm cuộc gọi lần đầu tiên cho người dùng iPhone. Cùng với đó là những cải tiến cho camera và giao diện, hứa hẹn sẽ nâng cao trải nghiệm người dùng trên các thiết bị mới.
Orion sắp ra mắt: OpenAI mở ra chương mới cho trí tuệ nhân tạo Vietnet24h - Với việc ra mắt mô hình AI mới mang tên Orion vào tháng 12/2024, OpenAI đang tạo ra những bước tiến mạnh mẽ trong lĩnh vực công nghệ. Orion được kỳ vọng sẽ có sức mạnh vượt trội gấp 100 lần GPT-4, đánh dấu một cột mốc quan trọng trong hành trình phát triển trí tuệ nhân tạo tổng quát.
Chỉnh sửa ảnh thông minh với Microsoft Paint nhờ AI Vietnet24h - Microsoft Paint không ngừng cải tiến với sự ra mắt của Generative Fill và Generative Erase. Hai tính năng mới này giúp người dùng dễ dàng thêm hoặc xóa các chi tiết trong ảnh, mang lại trải nghiệm chỉnh sửa ảnh phong phú và trực quan hơn bao giờ hết.
Nút bấm mới trên iPhone 17 Pro: Tích hợp âm lượng và Action Vietnet24h - Thông tin từ các nguồn đáng tin cậy cho thấy iPhone 17 Pro có thể ra mắt với nút bấm đa năng, thay thế cho nút Action và âm lượng riêng biệt, hứa hẹn mang lại trải nghiệm người dùng mới lạ.
Phiên bản iPhone nào đủ sức chạy Apple Intelligence? Vietnet24h - Apple vừa đưa ra thông tin về dung lượng bộ nhớ mà các mẫu iPhone cần để hỗ trợ tính năng Apple Intelligence, cho biết tối thiểu 4 GB dung lượng trống là cần thiết và dự kiến sẽ tăng lên trong tương lai. Điều này được đề cập trong tài liệu hướng dẫn mới nhất của hãng dành cho bản cập nhật iOS 18.1 Developer Beta 5.
Liệu Apple Intelligence có lợi thế hơn Galaxy AI không? Vietnet24h - Tại Hội nghị các nhà phát triển toàn cầu hôm thứ Hai, Apple đã giới thiệu Apple Intelligence, hệ thống AI sẽ được tích hợp trên các sản phẩm từ iPhone đến Macbook.
Alibaba ra mắt mô hình AI nguồn mở mới cho 'các tác nhân AI tiết kiệm chi phí' Vietnet24h - Công ty cho biết “Qwen2.5-Omni-7B” mới là một mô hình đa phương thức có thể xử lý văn bản, hình ảnh, âm thanh và video, đồng thời tạo ra văn bản thời gian thực và phản hồi giọng nói tự nhiên.
Việt Nam cho phép sử dụng dịch vụ internet vệ tinh Starlink của SpaceX Vietnet24h - Chính phủ Việt Nam cho biết sẽ cho phép SpaceX triển khai dịch vụ internet vệ tinh Starlink của mình trên cơ sở thử nghiệm tại nước ta.
TSMC giới thiệu liên doanh đúc Intel với Nvidia, AMD và Broadcom Vietnet24h - TSMC đã chào hàng các nhà thiết kế chip của Hoa Kỳ là Nvidia, Advanced Micro Devices và Broadcom về việc nắm giữ cổ phần trong một liên doanh sẽ vận hành các nhà máy của Intel, theo bốn nguồn tin quen thuộc với vấn đề này.
Microsoft phát triển các mô hình lý luận AI để cạnh tranh với OpenAI Vietnet24h - Microsoft đang phát triển các mô hình lý luận trí tuệ nhân tạo nội bộ để cạnh tranh với OpenAI và có thể bán chúng cho các nhà phát triển.
Nỗ lực phát triển robot của Samsung đạt được thành công với sự chấp thuận cuối cùng cho Rainbow Robotics Vietnet24h - Samsung Electronics đã nhận được sự chấp thuận cuối cùng từ cơ quan quản lý chống độc quyền của Hàn Quốc để mua lại Rainbow Robotics, mở đường cho gã khổng lồ công nghệ mở rộng hoạt động kinh doanh robot sang robot hình người.
Từ Galaxy AI đến hệ sinh thái phần mềm thông minh: Samsung khẳng định vị thế dẫn đầu tại MWC 2025 Vietnet24h - Tại Đại hội Thế giới Di động (MWC) 2025 ở Bacelona, Samsung giới thiệu những đột phá mới nhất về Galaxy AI và các giải pháp phần mềm toàn diện, trao quyền cho các nhà mạng khai thác tối đa lợi ích từ công nghệ AI.
Cổ phiếu Alibaba tăng vọt sau khi gã khổng lồ công nghệ Trung Quốc ra mắt đối thủ mới của DeepSeek Vietnet24h - Gã khổng lồ công nghệ Trung Quốc Alibaba cho biết mô hình suy luận AI mới nhất của họ, QwQ-32B, "có thể sánh ngang với mô hình suy luận tiên tiến, ví dụ như DeepSeek-R1".
Nhiều điện thoại thông minh gập ba đang xuất hiện tại Đại hội Thế giới Di động ở Bacelona Vietnet24h - Ngày càng có nhiều nhà sản xuất điện thoại thông minh giới thiệu điện thoại gập ba của riêng mình - điện thoại thông minh có ba màn hình - tại sự kiện Mobile World Congress ở Barcelona.
Samsung sẽ ra mắt tai nghe đối thủ với Apple Vision Pro trong năm nay Vietnet24h - Samsung đã hé lộ về chiếc tai nghe này vào năm 2024 nhưng lần đầu tiên giới thiệu nó trên toàn cầu tại Mobile World Congress năm nay ở Barcelona.
LG Display sẽ sản xuất iPhone OLED vào quý 3 năm nay Vietnet24h - LG Display sẽ sản xuất tấm nền iPhone OLED tại dây chuyền sản xuất IT OLED của mình bắt đầu từ quý 3 năm nay.
Apple áp dụng kim loại lỏng cho iPhone gập, mở ra kỷ nguyên mới Vietnet24h - Apple được cho là sẽ sử dụng kim loại lỏng để chế tạo bản lề cho iPhone gập, giúp tăng độ bền và hạn chế nếp gấp màn hình. Công nghệ này có thể tạo ra bước đột phá trên thị trường smartphone gập.
Amazon sẽ mang công nghệ quét lòng bàn tay đến các cơ sở y tế NYU Langone Vietnet24h - Bệnh nhân của NYU Langone Health sẽ có thể đăng ký lịch hẹn bằng Amazon One, công nghệ quét lòng bàn tay của công ty.
Lenovo hé lộ máy tính xách tay màn hình gập chạy bằng năng lượng mặt trời trong khái niệm mới nhất Vietnet24h - Lenovo đã tiết lộ khái niệm Lenovo ThinkBook ‘flip’, một chiếc máy tính xách tay có màn hình có thể gập lại. Khi mở hoàn toàn, toàn màn hình có kích thước 18 inch.
Meta công bố kính thông minh nghiên cứu thử nghiệm Aria Gen 2 Vietnet24h - Meta đã tiết lộ phiên bản mới nhất của loại kính thử nghiệm nhằm hỗ trợ nghiên cứu về trí tuệ nhân tạo, robot và nhận thức của máy móc.
Smartphone gập ba: Samsung chạm đỉnh công nghệ, người dùng chạm đáy túi tiền Vietnet24h - Với tham vọng thay đổi cách người dùng trải nghiệm thiết bị di động, Samsung sắp ra mắt điện thoại gập ba. Dù mang thiết kế tiên phong, giá bán lên đến 2.800 USD sẽ là rào cản lớn để sản phẩm đến tay người dùng đại chúng.
Samsung Display sẽ ra mắt màn hình gập 18,1 inch tại CES Vietnet24h - Samsung Display cho biết hôm Chủ Nhật rằng họ sẽ ra mắt màn hình OLED có thể gập 18,1 inch đầu tiên trên thế giới tại CES 2025, dự kiến ​​sẽ khai mạc vào thứ Ba (7/1) tại Las Vegas.
Khí quyển của TRAPPIST-1: một phát hiện thú vị về sự tồn tại sự sống ngoài trái đất Vietnet24h - TRAPPIST-1b, hành tinh cách Trái đất 40 năm ánh sáng, đã gây bất ngờ khi các nhà khoa học phát hiện rằng nó có khí quyển dày đặc và một lớp sương mù đặc biệt, mở ra triển vọng mới trong nghiên cứu sự sống ngoài hành tinh.
Elon Musk biến Texas thành trung tâm không gian mới: Starbase và những giấc mơ vũ trụ Vietnet24h - Elon Musk đang làm một điều chưa từng có: biến một vùng đất xa xôi tại Texas thành một thị trấn vũ trụ mang tên Starbase. Với dự án này, ông không chỉ mong muốn tạo ra một cộng đồng phục vụ cho SpaceX mà còn muốn mở ra một kỷ nguyên mới cho ngành công nghiệp không gian, với tầm nhìn đưa con người lên Sao Hỏa.
Parker Solar Probe: Tàu vũ trụ “siêu tốc” của NASA chính thức đến gần mặt trời nhất Vietnet24h - NASA vừa thực hiện một bước tiến quan trọng trong sứ mệnh khám phá vũ trụ, khi tàu thăm dò Parker Solar Probe đã tiến gần mặt trời hơn bao giờ hết. Cùng với đó, tàu vũ trụ này cũng lập kỷ lục mới về tốc độ, giúp giải quyết nhiều câu hỏi lâu dài về nguồn gốc gió mặt trời và vầng nhật hoa.
Các nhà nghiên cứu Đài Loan phát triển kính hiển vi 4D để quét não nhanh hơn và rõ hơn Vietnet24h - Tại một cuộc họp báo, nhóm các nhà nghiên cứu từ Đại học Quốc gia Đài Loan (NTU) và Đại học Quốc gia Thanh Hoa cho biết kính hiển vi mới cung cấp hình ảnh nhanh hơn hàng nghìn lần so với kính hiển vi truyền thống.