Tiêu điểm công nghệ
Emo của Alibaba: khi ảnh tĩnh có thể cất tiếng hát
Phan Khôi - Thứ Tư, 13/03/2024 9:41 CH
Vietnet24h - EMO, một sản phẩm trí tuệ nhân tạo (AI) sáng tạo, trao cho ảnh tĩnh khả năng hát, tạo ra những trải nghiệm âm nhạc độc đáo và hấp dẫn chưa từng có.
Alibaba, đứng đầu trong lĩnh vực công nghệ, đã đặt dấu ấn mạnh mẽ trong thế giới trí tuệ nhân tạo (AI) với sự ra đời của sản phẩm đột phá EMO (Emotive Portrait Alive). Được phát triển bởi nhóm nghiên cứu tại Viện Điện toán Thông minh (IIC) của Alibaba, EMO là kết quả của nỗ lực nghiên cứu sâu từ các nhà khoa học hàng đầu như LinRui Tian, Qi Wang, LieFeng Bo, và Bang.
 
EMO có khả năng "hô biến" hình ảnh tĩnh thành video có khả năng nói và hát như thật. Nói một cách đơn giản, AI của Alibaba có thể chuyển đổi một bức tranh tĩnh và âm thanh giọng nói thành một video chân thực với biểu cảm tự nhiên, với đặc điểm nổi bật là miệng tạo ra bởi AI trông vô cùng tự nhiên.
 
Trong các video mà Alibaba đã công bố, chúng ta đã thấy hình ảnh trở nên sống động và bắt đầu hát các bài hát chỉ trong vài giây. Một trong những ví dụ đáng chú ý nhất là bức tranh Mona Lisa biểu diễn đoạn độc thoại của nhân vật Rosalind trong vở kịch "As You Like It" của William Shakespeare.
 
EMO không chỉ là một bước tiến lớn trong việc biến đổi hình ảnh tĩnh thành video mà còn mở ra nhiều khả năng mới cho ngành công nghiệp công nghệ. Có lẽ chúng ta sẽ được chứng kiến những ứng dụng thú vị và độc đáo mà EMO mang lại trong tương lai.
Công nghệ EMO của Alibaba được phát triển thông qua một quá trình đào tạo sâu với hơn 250 giờ video đa dạng, đa ngôn ngữ, bao gồm các bài phát biểu, phim và biểu diễn âm nhạc. Thay vì phụ thuộc vào mô hình 3D truyền thống, hệ thống này trực tiếp tạo ra khung hình video thông qua mô hình khuếch tán.
 
EMO sử dụng công nghệ nhận diện khuôn mặt và xử lý ngôn ngữ tự nhiên để tạo ra hình ảnh và âm thanh đồng bộ, mang lại trải nghiệm thực tế ảo chưa từng có. Alibaba cho biết họ đã huấn luyện AI với một lượng lớn dữ liệu về hình ảnh, âm thanh và video để tạo ra biểu cảm khuôn mặt chân thực thông qua mô hình khuếch tán riêng biệt có tên là Audio2Video.
 
Đại diện của nhóm nghiên cứu lý giải rằng mục tiêu của họ là vượt qua thách thức lớn hiện nay về tính chân thực và biểu cảm khi chuyển đổi hình ảnh và âm thanh thành video. Họ tập trung vào mối liên hệ và sắc thái giữa tín hiệu âm thanh và chuyển động trên khuôn mặt, áp dụng phương pháp tổng hợp, bỏ qua các mô hình 3D trung gian hoặc các điểm mốc trên khuôn mặt để tạo ra khung hình video liền mạch và bảo toàn tính nhất quán, mang lại cho video động tính biểu cảm và sống động như thật.
iPhone 16 Pro và 16 Pro Max: Sự tiến bộ vượt trội với nút chụp như máy ảnh chuyên nghiệp Vietnet24h - Trong một bước tiến đầy bất ngờ, Apple đã hé lộ thiết kế mới nhất của mình cho chiếc iPhone 16 Pro. Điểm nhấn đáng chú ý nhất chính là nút chụp được thiết kế giống như trên máy ảnh truyền thống.
Dự đoán của Jensen Huang về thời điểm xuất hiện của AGI chỉ là suy đoán Vietnet24h - CEO Jensen Huang thừa nhận rằng dự đoán về thời điểm xuất hiện của AGI chỉ là suy đoán và chỉ thời gian mới có thể trả lời liệu dự đoán của ông có chính xác hay không.
Tin khác cùng chuyên mục
Tin đọc nhiều
Meta Connect 2025: Kính thông minh tích hợp AI chiếm vị trí trung tâm Vietnet24h - Meta đã chi hàng tỷ đô la để cố gắng đưa thực tế ảo (VR) trở thành xu hướng với người tiêu dùng. Khi chuyển hướng chiến lược metaverse sang kính thông minh, các nhà đầu tư sẽ theo dõi phản ứng của công chúng.
Virtual Twin: mô hình kỹ thuật số mô phỏng chính xác một thực thể vật lý hoặc hệ thống trong thế giới thực Vietnet24h - Virtual Twin (Song sinh số) là một mô hình kỹ thuật số được tạo ra để mô phỏng chính xác một thực thể vật lý hoặc hệ thống trong thế giới thực, như sản phẩm, quy trình sản xuất, hoặc thậm chí là toàn bộ nhà máy, thành phố.
Google Maps cho phép xem lại đường phố từ quá khứ, bạn đã thử chưa? Vietnet24h - Chỉ với vài cú nhấn trên ứng dụng hoặc máy tính, bạn có thể quay lại thời điểm năm 2010 để xem phố xá lúc đó như thế nào. Đây là tính năng Street View mở rộng mà nhiều người dùng vẫn chưa khám phá hết.
Google Search tiết lộ những tính năng sáng tạo có thể thay đổi trải nghiệm trực tuyến của bạn Vietnet24h - Các công cụ tìm kiếm vẫn là đồng minh đáng tin cậy của chúng ta trong hành trình tìm kiếm thông tin, với 16,4 tỷ truy vấn mỗi ngày chỉ tính riêng trên Google.
Google Maps nên lo lắng: Apple Maps giờ thông minh hơn và... nhớ cả bạn thích đi đâu! Vietnet24h - Apple vừa tung bản cập nhật iOS 26 khiến cộng đồng công nghệ xôn xao. Apple Maps không chỉ dẫn đường mà còn ghi nhớ thói quen di chuyển, gợi ý theo sở thích cá nhân và bảo mật tuyệt đối. Đây chính là điều mà Google Maps – với mọi dữ liệu khổng lồ – vẫn chưa thể làm được.
Apple và cuộc "đại tu hệ điều hành" tại WWDC 2025: Khi con số không chỉ là ký hiệu Vietnet24h - Tại WWDC 2025, Apple không đơn thuần giới thiệu các phiên bản phần mềm kế tiếp mà đang vẽ lại cả triết lý định danh sản phẩm và trải nghiệm người dùng. Việc chuyển từ iOS 19 sang iOS 26 không phải chỉ là đổi số, mà là tín hiệu của một chiến lược hợp nhất, đồng bộ và hướng tới tương lai của toàn hệ sinh thái Apple.
Sony FE PZ 16-35mm F4 G – Khi sự tinh gọn gặp sức mạnh quang học Vietnet24h - Trong thế giới nhiếp ảnh và quay phim hiện đại, nơi tính linh hoạt và hiệu suất thường phải đánh đổi lẫn nhau, Sony một lần nữa chứng minh họ có thể phá vỡ quy luật ấy bằng việc ra mắt ống kính zoom điện góc rộng FE PZ 16-35mm F4 G – một minh chứng cho hướng đi ngày càng rõ ràng của hãng: tối ưu trải nghiệm sáng tạo nội dung trên hệ máy mirrorless full-frame mà không thỏa hiệp về chất lượng.
Vì sao màn hình kép và AI khiến Yoga Book 9i trở nên khác biệt? Vietnet24h - Không phải là chiếc laptop đầu tiên có màn hình kép, nhưng Yoga Book 9i kết hợp công nghệ OLED, AI và thiết kế xoay gập linh hoạt theo cách mà rất ít sản phẩm trên thị trường có thể làm được. Đâu là điểm khiến nó trở thành công cụ mơ ước cho người làm sáng tạo?
Muốn dùng AI không cần mạng? Google đã có giải pháp mới cho bạn Vietnet24h - Không cần Wi-Fi, không cần 4G, bạn vẫn có thể tạo ảnh, viết code hay tóm tắt văn bản nhờ AI. Với AI Edge Gallery, Google mang trải nghiệm trí tuệ nhân tạo về ngay trong túi áo của bạn – gọn nhẹ, bảo mật và sẵn sàng mọi lúc.
Thiết kế siêu mỏng "đòi hỏi" đánh đổi – iPhone 17 Air và bài toán năng lượng Vietnet24h - Việc Apple chuẩn bị trình làng iPhone 17 Air với thiết kế siêu mỏng chỉ 5,5 mm, theo tiết lộ mới nhất từ tài khoản yeux1122 trên Naver, đang tạo ra nhiều kỳ vọng về mặt thẩm mỹ – nhưng cũng đồng thời đặt ra những dấu hỏi lớn về hiệu suất pin và trải nghiệm người dùng trong thực tế.
Apple ra mắt iPhone Air với chip A19 Pro mới, tập trung mạnh vào AI Vietnet24h - Apple vừa chính thức trình làng iPhone Air, mẫu điện thoại mới nhất trong dòng sản phẩm iPhone 17, lên kệ vào thứ Sáu (19/9) vừa qua.
LG Innotek hoàn thành việc mở rộng nhà máy sản xuất module camera tại Việt Nam Vietnet24h - Hôm Chủ nhật (21/9), LG Innotek thông báo đã hoàn tất việc mở rộng nhà máy sản xuất mô-đun camera tại Việt Nam, một phần trong chiến lược cắt giảm chi phí thông qua việc vận hành các trung tâm sản xuất tại cả Việt Nam và Hàn Quốc.
GEIMS Việt Nam 2025: Kết nối doanh nghiệp Việt với công nghệ và đối tác toàn cầu Vietnet24h - GEIMS Việt Nam 2025 không chỉ là triển lãm thương mại, mà còn là điểm hội tụ của tri thức, công nghệ và kết nối.
CEO Nvidia Huang cho biết khoản đầu tư 5 tỷ đô la vào đối thủ Intel sẽ là 'một khoản đầu tư đáng kinh ngạc' Vietnet24h - Giám đốc điều hành Nvidia Jensen Huang cho biết khoản đầu tư 5 tỷ đô la và hợp tác công nghệ với Intel diễn ra sau khi hai công ty đã thảo luận trong gần một năm.
MediaTek áp dụng quy trình 2nm của TSMC cho chip hàng đầu mới Vietnet24h - MediaTek Inc., nhà thiết kế chip lớn nhất Đài Loan, hôm thứ Ba (16/9) cho biết, họ đã áp dụng quy trình 2 nanomet tiên tiến của Taiwan Semiconductor Manufacturing Co. (TSMC)
Exynos trở lại: Samsung chuẩn bị chip 2nm cho Galaxy S26 Vietnet24h - Samsung Electronics sẽ bắt đầu sản xuất hàng loạt bộ vi xử lý di động Exynos 2600 trong tháng này, dự kiến ​​sẽ được trang bị cho điện thoại thông minh Galaxy S26 vào năm sau, các nguồn tin trong ngành cho biết hôm thứ Hai.
Mỹ hướng tới mô hình TSMC được nhà nước hậu thuẫn để vực dậy Intel Vietnet24h - 10% cổ phần nhằm tăng cường sức mạnh cho nhà sản xuất chip Mỹ trong bối cảnh thiếu khách hàng gia công.
SK Hynix tiếp tục đà tăng trưởng 80 tỷ đô la khi chuẩn bị chip thế hệ tiếp theo cho Nvidia Vietnet24h - SK Hynix cho biết họ đã hoàn tất quy trình đảm bảo chất lượng cho chip HBM4 "tốt nhất trong phân khúc" và đã sẵn sàng để sản xuất hàng loạt.
SK hynix hoàn tất phát triển HBM4, sẵn sàng sản xuất hàng loạt Vietnet24h - Nhà sản xuất chip dẫn đầu cuộc đua ngày càng gay gắt về bộ nhớ dành riêng cho AI.
iPhone Air mỏng có thể là một chiến thắng về thiết kế cho Apple Vietnet24h - CEO Apple Tim Cook dường như đang kế thừa thiên tài thiết kế Steve Jobs khi ông ra mắt iPhone Air vào thứ Ba, chiếc điện thoại mỏng nhất của công ty từ trước đến nay và là sự thay đổi lớn nhất trong tám năm qua đối với một dòng sản phẩm mà người hâm mộ và các nhà phân tích cho là trì trệ.
Mark Zuckerberg ra mắt kính Meta Ray-Ban Display giá 799 đô la Vietnet24h - Hôm thứ Tư, Mark Zuckerberg đã ra mắt chiếc kính Meta Ray-Ban Display trị giá 799 đô la, chiếc kính thông minh đầu tiên của công ty truyền thông xã hội này dành cho người tiêu dùng với màn hình tích hợp.
SK hynix ra mắt DRAM di động cắt nhiệt đầu tiên Vietnet24h - Gã khổng lồ chip nhớ cho biết họ là công ty đầu tiên phát triển vật liệu High-K EMC, giải quyết hiệu quả vấn đề sinh nhiệt và suy giảm hiệu suất do truyền dữ liệu nhanh cho các ứng dụng AI trên thiết bị.
WindRunner: Chuyến bay chưa cất cánh của ngành điện gió Vietnet24h - Nằm tại Boulder, Colorado, một công ty khởi nghiệp tên Radia đang ấp ủ chế tạo chiếc máy bay lớn nhất thế giới. Nhưng trước khi WindRunner có thể vươn lên bầu trời với những cánh turbine khổng lồ trong khoang, họ phải vượt qua những giới hạn tưởng chừng không thể: từ kỹ thuật, quy định cho đến niềm tin thị trường.
Trung Quốc: Robot trí tuệ nhân tạo đầu tiên học tiến sĩ nghệ thuật Vietnet24h - Xueba 01 – robot hình người được phát triển tại Thượng Hải – vừa chính thức được ghi danh vào chương trình tiến sĩ 4 năm về kịch nghệ. Đây là lần đầu tiên một cỗ máy được công nhận tư cách nghiên cứu sinh trong lĩnh vực nghệ thuật biểu diễn tại Trung Quốc.
Bê tông thông minh và giấc mơ về một ngành xây dựng trung hòa carbon Vietnet24h - Trong bối cảnh biến đổi khí hậu trở thành một trong những thách thức cấp bách nhất của nhân loại, một đột phá từ Đại học Southern California (USC) có thể định hình lại ngành xây dựng – lĩnh vực vốn là một trong những nguồn phát thải CO₂ lớn nhất toàn cầu. Nhưng lần này, vật liệu truyền thống như bê tông không chỉ là một phần của vấn đề, mà đang được tái định nghĩa để trở thành một phần của giải pháp.
Apple hướng đến mục tiêu cách mạng hóa nhiếp ảnh với camera iPhone mới lấy cảm hứng từ thị giác con người Vietnet24h - Theo một bằng sáng chế mới được nộp, Apple đang hướng đến mục tiêu cách mạng hóa công nghệ camera trên những chiếc iPhone trong tương lai, tiết lộ những kế hoạch đầy tham vọng nhằm nâng cao khả năng chụp ảnh.
Otto Aviation trình làng máy bay không cửa sổ Phantom 3500, bay thử từ 2027 Vietnet24h - Mẫu máy bay Phantom 3500 do Otto Aviation phát triển đang gây chú ý với thiết kế không cửa sổ nhằm tăng hiệu suất khí động học. Công ty dự kiến sẽ cho cất cánh thử nghiệm vào cuối năm 2027, mở ra chương mới cho hàng không thương mại cận âm.
LG Innotek ra mắt mô-đun xe truyền thông vệ tinh 5G đầu tiên trên thế giới Vietnet24h - Mô-đun mới nhất hỗ trợ 5G NR-NTN, một mạng truyền thông di động hoạt động trên các vệ tinh quỹ đạo Trái đất thấp, cho phép truyền dữ liệu khối lượng lớn theo thời gian thực.
Công nghệ như phim viễn tưởng: Đeo kính áp tròng, nhắm mắt vẫn thấy rõ! Vietnet24h - Ngỡ chỉ có trong phim Marvel, nhưng loại kính áp tròng siêu nhỏ gọn vừa ra đời tại Trung Quốc lại có thể giúp người dùng nhìn thấy trong đêm tối mà không cần mở mắt. Chuyện thật như đùa, nhưng khoa học đã chứng minh điều đó là khả thi.
Google, Samsung sẽ ra mắt kính thông minh XR trong năm nay Vietnet24h - Samsung bước lên vị trí dẫn đầu về phần cứng trong sự trở lại của kính thông minh Google, mở rộng vai trò trong hệ sinh thái XR đang phát triển