Tiêu dùng
Cách DeepSeek sử dụng phương pháp chưng cất để đào tạo mô hình trí tuệ nhân tạo
Minh Ngọc - Chủ Nhật, 23/02/2025 8:34 SA
Vietnet24h - Phòng thí nghiệm trí tuệ nhân tạo Trung Quốc DeepSeek đã khuấy động thị trường vào tháng 1, gây ra một đợt bán tháo công nghệ và chất bán dẫn lớn sau khi công bố các mô hình AI mà họ cho là rẻ hơn và hiệu quả hơn so với các mô hình của Mỹ.
Nhưng nỗi sợ hãi và đột phá tiềm ẩn đã thúc đẩy đợt bán tháo này còn sâu sắc hơn nhiều so với một công ty khởi nghiệp AI. Thung lũng Silicon hiện đang tính đến một kỹ thuật trong phát triển AI được gọi là chưng cất, một kỹ thuật có thể đảo ngược bảng xếp hạng AI.
 
Chưng cất là một quá trình trích xuất kiến ​​thức từ một mô hình AI lớn hơn để tạo ra một mô hình nhỏ hơn. Nó có thể cho phép một nhóm nhỏ hầu như không có nguồn lực nào tạo ra một mô hình tiên tiến.
 
Một công ty công nghệ hàng đầu đầu tư nhiều năm và hàng triệu đô la để phát triển một mô hình hàng đầu từ đầu. Sau đó, một nhóm nhỏ hơn như DeepSeek lao vào và đào tạo mô hình chuyên biệt hơn của riêng mình bằng cách đặt câu hỏi cho mô hình "giáo viên" lớn hơn. Quá trình này tạo ra một mô hình mới có khả năng gần như mô hình của công ty lớn nhưng đào tạo nhanh hơn và hiệu quả hơn.
 
“Kỹ thuật chưng cất này cực kỳ mạnh mẽ và cực kỳ rẻ, và nó dành cho bất kỳ ai”, Ali Ghodsi, CEO của Databricks, cho biết, đồng thời nói thêm rằng ông hy vọng sẽ thấy sự đổi mới khi nói đến cách xây dựng các mô hình ngôn ngữ lớn hay LLM. “Chúng ta sẽ thấy rất nhiều sự cạnh tranh cho LLM. Đó là những gì sẽ xảy ra trong kỷ nguyên mới mà chúng ta đang bước vào”.
 
Hiện nay, chưng cất đang cho phép các công ty khởi nghiệp và phòng nghiên cứu ít vốn cạnh tranh ở vị trí tiên tiến nhanh hơn bao giờ hết.
 
Các nhà nghiên cứu tại Berkeley cho biết, sử dụng kỹ thuật này, họ đã tái tạo mô hình lý luận của OpenAI với giá 450 đô la trong 19 giờ vào tháng trước. Ngay sau đó, các nhà nghiên cứu tại Stanford và Đại học Washington đã tạo ra mô hình lý luận của riêng họ chỉ trong 26 phút, sử dụng chưa đến 50 đô la tín dụng tính toán, họ cho biết. Công ty khởi nghiệp Hugging Face đã tái tạo tính năng mới nhất và hấp dẫn nhất của OpenAI, Nghiên cứu sâu, dưới dạng thử thách mã hóa trong 24 giờ.
 
DeepSeek không phát minh ra quá trình chưng cất, nhưng nó đã đánh thức thế giới AI về tiềm năng phá vỡ của nó. Nó cũng mở ra sự trỗi dậy của một trật tự nguồn mở mới — một niềm tin rằng tính minh bạch và khả năng tiếp cận thúc đẩy sự đổi mới nhanh hơn so với nghiên cứu đóng cửa.
 
"Nguồn mở luôn chiến thắng trong ngành công nghệ", Arvind Jain, CEO của Glean, công ty tạo ra công cụ tìm kiếm hỗ trợ AI cho các doanh nghiệp, cho biết. "Bạn không thể đánh bại được động lực mà một dự án nguồn mở thành công thực sự có thể tạo ra".
 
Bản thân OpenAI đã quay lại chiến lược nguồn đóng của mình sau thành tích của DeepSeek.
 
"Cá nhân tôi nghĩ rằng chúng ta đã đi sai hướng trong lịch sử và cần tìm ra một chiến lược nguồn mở khác", CEO của OpenAI Sam Altman đã viết trong một bài đăng trên Reddit vào ngày 31 tháng 1.
 
Sự kết hợp giữa sức hút mới tìm thấy của quá trình chưng cất và sự gia tăng phổ biến của nguồn mở đang hoàn toàn thay đổi động lực cạnh tranh trong AI.
Bắc Kinh áp dụng DeepSeek để dẫn đầu việc áp dụng AI khi tìm kiếm động lực tăng trưởng mới Vietnet24h - DeepSeek cũng đã làm rung chuyển hệ sinh thái AI của Trung Quốc, với các tổ chức nhà nước cũng như các công ty công nghệ lớn, bao gồm cả các đối thủ cạnh tranh, tận dụng kiến ​​trúc nguồn mở của nó.
Mô hình AI của Deepseek, là một tác phẩm tốt nhất của Trung Quốc nhưng hơi quá "cường điệu", Giám đốc điều hành của Google Deepmind nói Vietnet24h - Mô hình AI của Deepseek, có lẽ là tác phẩm hay nhất của Trung Quốc, Demis Hassabis, CEO của Google Deepmind cho biết vào Chủ nhật.
Tin khác cùng chuyên mục
Tin đọc nhiều
Meta’s Community Notes sẽ sử dụng công nghệ nguồn mở từ X của Elon Musk Vietnet24h - Meta cho biết hôm thứ Năm rằng công cụ kiểm duyệt nội dung cộng đồng mới mang tên Community Notes sẽ sử dụng thuật toán nguồn mở từ X.
Apple hoãn cải tiến Siri AI đến năm 2026 Vietnet24h - Hôm qua, thứ Sáu (7/3), Apple đã thông báo rằng, họ sẽ trì hoãn các tính năng sẽ hỗ trợ Siri với khả năng làm việc với các ứng dụng khác cho đến năm sau. Tính năng đó dự kiến ​​sẽ được phát hành vào mùa xuân này.
Công ty khởi nghiệp điện thoại thông minh Nothing cố gắng khuấy động thị trường với chiếc điện thoại giá 400 đô la Vietnet24h - Công ty khởi nghiệp công nghệ tiêu dùng Nothing đã ra mắt điện thoại thông minh Phone (3a) mới vào thứ ba (4/3).
Microsoft ra mắt trợ lý AI kích hoạt bằng giọng nói mới dành cho bác sĩ Vietnet24h - Hôm nay, thứ Ha (3/3)i, Microsoft đã công bố một trợ lý AI chăm sóc sức khỏe mới có tên Dragon Copilot, được xây dựng dựa trên các giải pháp nghe chính tả và lắng nghe xung quanh hiện có.
Xiaomi ra mắt điện thoại giá 1.600 đô la khi giá cổ phiếu tăng 300% lên mức cao kỷ lục Vietnet24h - Xiaomi đã ra mắt Xiaomi 15 và Xiaomi 15 Ultra vào Chủ Nhật tại Đại hội Thế giới Di động (MWC) 2025. Xiaomi 15 có giá khởi điểm là 999 euro (1.047 đô la) và Xiaomi 15 Ultra có giá khởi điểm là 1.499 euro (1.571 đô la).
DeepSeek tạm dừng tải xuống ứng dụng tại Hàn Quốc vì lo ngại về quyền riêng tư Vietnet24h - DeepSeek của Công ty trí tuệ nhân tạo Trung Quốc đã bị dừng tải xuống ứng dụng chatbot mới tại Hàn Quốc sau khi các cơ quan quản lý của Hàn Quốc nêu lên mối lo ngại về cách công ty này xử lý dữ liệu cá nhân.
Samsung Galaxy S25 series: Cánh tay đắc lực AI tiên phong thiết lập chuẩn mực mới cho điện thoại AI Vietnet24h - Ngày 23 tháng 1 năm 2025, Samsung Electronics chính thức ra mắt Galaxy S25 Ultra, Galaxy S25+ và Galaxy S25, người bạn đồng hành AI mang đến trải nghiệm di động tự nhiên và khả năng thấu hiểu ngữ cảnh vượt trội nhất từ trước đến nay.
Apple vô hiệu hóa thông báo AI cho tin tức trong phần mềm iPhone beta của mình Vietnet24h - Apple đã vô hiệu hóa tính năng tóm tắt Apple Intelligence cho các ứng dụng tin tức dành cho người dùng phần mềm beta trên iPhone, iPad và Mac.
TV Samsung Neo QLED và TV Lifestyle đạt chứng nhận ‘EyeCare Circadian’ từ VDE Vietnet24h - Chứng nhận đánh giá độ thoải mái thị giác và khả năng hỗ trợ nhịp sinh học tự nhiên.
Samsung, Hyundai thu hút người mua nhà bằng dịch vụ giao hàng bằng robot Vietnet24h - Samsung C&T và Hyundai E&C đang cạnh tranh để thu hút chủ nhà và người mua nhà bằng dịch vụ giao hàng bằng robot tự lái của họ, được thiết kế để hoạt động trong các khu chung cư.
Giải pháp đánh bay hôi miệng, lấy lại tự tin trong giao tiếp Vietnet24h - Hôi miệng không chỉ là vấn đề về sức khỏe mà còn ảnh hưởng trực tiếp đến sự tự tin và giao tiếp hàng ngày, đặc biệt đối với những người làm công việc tư vấn, kinh doanh hoặc giao tiếp trực tiếp. Mùi hôi khó chịu từ miệng khiến bạn gặp khó khăn trong các cuộc trò chuyện, khiến người khác ngại ngùng và ảnh hưởng đến mối quan hệ xã hội. Tuy nhiên, đừng lo lắng, vì những giải pháp đơn giản có thể giúp bạn khắc phục tình trạng này một cách hiệu quả.
Giới chức Mỹ kiện TikTok vì lo ngại thanh thiếu niên bị ảnh hưởng bởi nghiện mạng xã hội Vietnet24h - TikTok, nền tảng video nổi tiếng, đã trở thành mục tiêu của các vụ kiện từ 13 bang ở Mỹ, với cáo buộc gây nghiện cho thanh thiếu niên và làm tổn hại đến sức khỏe tâm thần của họ thông qua những thuật toán được thiết kế để tăng thời gian sử dụng.
Cách sử dụng ChatGPT vừa ra mắt chế độ giọng nói nâng cao cho trò chuyện âm thanh của OpenAI Vietnet24h - Mặc dù công cụ này phản hồi nhanh và có thể nói bằng nhiều giọng khác nhau, nhưng bạn có thể gặp phải giới hạn về tốc độ nếu sử dụng nhiều lần trong một ngày.
Đánh giá sơ bộ về iPhone 16 mới ra lò của Apple Vietnet24h - iPhone 16 Pro Max có thời lượng pin tốt hơn và camera tuyệt vời, nhưng Apple Intelligence vẫn chưa xuất hiện
Apple Watch Series 10 chỉ có những nâng cấp nhỏ, nhưng điểm cộng lớn là sạc nhanh hơn Vietnet24h - Apple Watch là một phần của bộ phận Thiết bị đeo, Gia đình và Phụ kiện của công ty, đã báo cáo doanh thu 8,1 tỷ đô la trong quý tài chính thứ ba, giảm 2% so với một năm trước.
Apple phát hành iOS 18 cho iPhone, nhưng không bao gồm Apple Intelligence Vietnet24h - Đây là bản cập nhật iPhone lớn nhất trong năm của Apple, nhưng bản cập nhật này không bao gồm Apple Intelligence, hệ thống AI sắp ra mắt của công ty.
Lý do nhiều người không ưa chuộng smartphone màn hình gập Vietnet24h - Đã nhiều năm trôi qua kể từ khi smartphone màn hình gập lần đầu tiên xuất hiện, nhưng doanh số của thiết bị đầy sáng tạo này vẫn chưa thể cạnh tranh với smartphone thông thường. Dù các thương hiệu liên tục thúc đẩy sản phẩm ra thị trường, nhiều người vẫn tỏ ra không mặn mà với dòng sản phẩm này. Vậy điều gì khiến smartphone màn hình gập chưa thể đạt được thành công mong đợi? Hãy cùng khám phá.
Liệu trẻ em có nên dùng Apple Watch? Vietnet24h - Apple vừa tung ra một trang web tiếp thị mới, quảng cáo Apple Watch như một cách để các bậc cha mẹ giữ liên lạc với con cái của họ.
Đánh giá sơ bộ về máy tính bảng Surface Pro của Microsoft Vietnet24h - Phiên bản thứ 11 của máy tính bảng chuyển đổi Surface Pro của Microsoft dựa trên chip Qualcomm tiêu thụ năng lượng, dẫn đến thời lượng pin hơn 8 giờ trong các thử nghiệm ban đầu.
Cảnh báo: mạng lưới lừa đảo với chiêu thức giả mạo ứng dụng bảo hiểm xã hội số Vietnet24h - Trong bối cảnh không gian mạng ngày càng trở nên phức tạp, Cục An toàn thông tin, thuộc Bộ Thông tin và Truyền thông, đã phát đi một thông báo khẩn cấp về những chiêu trò lừa đảo mới mẻ, đặc biệt là các vụ việc giả mạo ứng dụng VssID - Bảo hiểm xã hội số.