Tiêu dùng
Emo của Alibaba: khi ảnh tĩnh có thể cất tiếng hát
Phan Khôi - Thứ Tư, 13/03/2024 9:41 CH
Vietnet24h - EMO, một sản phẩm trí tuệ nhân tạo (AI) sáng tạo, trao cho ảnh tĩnh khả năng hát, tạo ra những trải nghiệm âm nhạc độc đáo và hấp dẫn chưa từng có.
Alibaba, đứng đầu trong lĩnh vực công nghệ, đã đặt dấu ấn mạnh mẽ trong thế giới trí tuệ nhân tạo (AI) với sự ra đời của sản phẩm đột phá EMO (Emotive Portrait Alive). Được phát triển bởi nhóm nghiên cứu tại Viện Điện toán Thông minh (IIC) của Alibaba, EMO là kết quả của nỗ lực nghiên cứu sâu từ các nhà khoa học hàng đầu như LinRui Tian, Qi Wang, LieFeng Bo, và Bang.
 
EMO có khả năng "hô biến" hình ảnh tĩnh thành video có khả năng nói và hát như thật. Nói một cách đơn giản, AI của Alibaba có thể chuyển đổi một bức tranh tĩnh và âm thanh giọng nói thành một video chân thực với biểu cảm tự nhiên, với đặc điểm nổi bật là miệng tạo ra bởi AI trông vô cùng tự nhiên.
 
Trong các video mà Alibaba đã công bố, chúng ta đã thấy hình ảnh trở nên sống động và bắt đầu hát các bài hát chỉ trong vài giây. Một trong những ví dụ đáng chú ý nhất là bức tranh Mona Lisa biểu diễn đoạn độc thoại của nhân vật Rosalind trong vở kịch "As You Like It" của William Shakespeare.
 
EMO không chỉ là một bước tiến lớn trong việc biến đổi hình ảnh tĩnh thành video mà còn mở ra nhiều khả năng mới cho ngành công nghiệp công nghệ. Có lẽ chúng ta sẽ được chứng kiến những ứng dụng thú vị và độc đáo mà EMO mang lại trong tương lai.
Công nghệ EMO của Alibaba được phát triển thông qua một quá trình đào tạo sâu với hơn 250 giờ video đa dạng, đa ngôn ngữ, bao gồm các bài phát biểu, phim và biểu diễn âm nhạc. Thay vì phụ thuộc vào mô hình 3D truyền thống, hệ thống này trực tiếp tạo ra khung hình video thông qua mô hình khuếch tán.
 
EMO sử dụng công nghệ nhận diện khuôn mặt và xử lý ngôn ngữ tự nhiên để tạo ra hình ảnh và âm thanh đồng bộ, mang lại trải nghiệm thực tế ảo chưa từng có. Alibaba cho biết họ đã huấn luyện AI với một lượng lớn dữ liệu về hình ảnh, âm thanh và video để tạo ra biểu cảm khuôn mặt chân thực thông qua mô hình khuếch tán riêng biệt có tên là Audio2Video.
 
Đại diện của nhóm nghiên cứu lý giải rằng mục tiêu của họ là vượt qua thách thức lớn hiện nay về tính chân thực và biểu cảm khi chuyển đổi hình ảnh và âm thanh thành video. Họ tập trung vào mối liên hệ và sắc thái giữa tín hiệu âm thanh và chuyển động trên khuôn mặt, áp dụng phương pháp tổng hợp, bỏ qua các mô hình 3D trung gian hoặc các điểm mốc trên khuôn mặt để tạo ra khung hình video liền mạch và bảo toàn tính nhất quán, mang lại cho video động tính biểu cảm và sống động như thật.
iPhone 16 Pro và 16 Pro Max: Sự tiến bộ vượt trội với nút chụp như máy ảnh chuyên nghiệp Vietnet24h - Trong một bước tiến đầy bất ngờ, Apple đã hé lộ thiết kế mới nhất của mình cho chiếc iPhone 16 Pro. Điểm nhấn đáng chú ý nhất chính là nút chụp được thiết kế giống như trên máy ảnh truyền thống.
Dự đoán của Jensen Huang về thời điểm xuất hiện của AGI chỉ là suy đoán Vietnet24h - CEO Jensen Huang thừa nhận rằng dự đoán về thời điểm xuất hiện của AGI chỉ là suy đoán và chỉ thời gian mới có thể trả lời liệu dự đoán của ông có chính xác hay không.
Tin khác cùng chuyên mục
Tin đọc nhiều
Apple ra mắt iPhone 17e giá rẻ hơn và iPad Air mới trang bị chip M4 của hãng Vietnet24h - Sáng thứ Hai, Apple đã mở màn tuần lễ ra mắt sản phẩm mới với một chiếc iPhone giá rẻ được nâng cấp và một chiếc iPad Air nhanh hơn.
Galaxy S26 ra mắt với tư cách là điện thoại thông minh AI đa tác nhân Vietnet24h - Giá tăng tới 20% trong bối cảnh bùng nổ thị trường bộ nhớ; màn hình bảo mật được bổ sung.
Samsung ra mắt Galaxy S26, tăng giá bán trong nỗ lực thúc đẩy trí tuệ nhân tạo Vietnet24h - Đây là lần tăng giá đầu tiên sau ba năm khi Samsung tập trung mạnh vào trí tuệ nhân tạo chủ động và tính năng bảo mật tích hợp.
Sony hé lộ màu sắc mới cho tai nghe WH-1000XM6: Liệu màu hồng cát có phải là xu hướng tiếp theo? Vietnet24h - Những tuần gần đây, Sony đã có một lịch trình dày đặc, với việc ra mắt LinkBuds Clip vào tháng trước, một đoạn teaser cho sự ra mắt được mong đợi của tai nghe cao cấp và những đồn đoán đầu tiên về điện thoại thông minh Xperia 1 VIII và Xperia 10 VIII.
Samsung nhắm đến Roborock với robot hút bụi mới tích hợp trí tuệ nhân tạo Vietnet24h - Số liệu ngành cho thấy Roborock hiện đang thống trị thị trường robot hút bụi Hàn Quốc, nắm giữ hơn 50% thị phần.
Samsung muốn nói gì về "trí tuệ nhân tạo tác nhân" trong dòng Galaxy S26 sắp ra mắt? Vietnet24h - Tháng trước, Samsung Electronics đã ăn mừng lợi nhuận quý IV kỷ lục, phần lớn nhờ nhu cầu chip nhớ tăng mạnh, nhưng bức tranh lại không mấy khả quan đối với bộ phận điện thoại thông minh của hãng.
Apple 2026: Giai đoạn “đa chiều hoá sản phẩm” và củng cố hệ sinh thái Vietnet24h - Apple đang chuẩn bị cho một năm 2026 năng động với loạt sản phẩm mới, phản ánh định hướng chiến lược rõ rệt: đa dạng hoá danh mục thiết bị, cân bằng giữa dòng cao cấp và phổ thông, và củng cố trải nghiệm hệ sinh thái xuyên suốt.
Dyson thiết kế robot hút bụi phù hợp với thói quen lau nhà bằng khăn ướt của người Hàn Quốc Vietnet24h - Dyson đã gia nhập thị trường máy hút bụi robot đầy cạnh tranh của Hàn Quốc với một sản phẩm hứa hẹn sẽ chủ động loại bỏ vết bẩn và liên tục kiểm tra xem việc loại bỏ đã thành công hay chưa.
Samsung Galaxy S26 Plus sẽ sở hữu màn hình 6,66 inch Vietnet24h - Mẫu điện thoại sắp ra mắt của Samsung, Galaxy S26 Plus, thuộc dòng Galaxy S26 mới, sẽ sở hữu màn hình 6,66 inch, giống như Galaxy S25 Plus.
Dự án máy sấy quần áo thế hệ tiếp theo của Samsung sẽ nhận được sự hỗ trợ từ Bộ Năng lượng Hoa Kỳ (DOE) Vietnet24h - Dự án nghiên cứu máy sấy quần áo thế hệ tiếp theo của Samsung Electronics sẽ nhận được sự hỗ trợ từ Bộ Năng lượng Hoa Kỳ (DOE), công ty cho biết hôm thứ Năm.
Samsung tổ chức sự kiện ra mắt Galaxy S26 series tại Việt Nam Vietnet24h - Công ty Điện tử Samsung Việt Nam chính thức tổ chức sự kiện ra mắt thế hệ Galaxy S26 series mới tại Thiskyhall Sala (TP.HCM). Sự kiện thu hút sự tham gia của hơn 600 khách mời, bao gồm các đối tác, đại diện cơ quan báo chí – truyền thông, chuyên gia công nghệ và nhà sáng tạo nội dung.
OnePlus 15R – LỰA CHỌN HÀI HOÀ GIỮA MÀN HÌNH 165 HZ VÀ PIN LỚN Vietnet24h - Điểm nổi bật nhất của 15R là màn hình 165 Hz và viên pin dung lượng lớn, hai yếu tố tạo nên trải nghiệm hàng ngày vượt trội so với số đông smartphone cùng phân khúc.
iPhone Air sau 4 tháng: có đáng mua ở thời điểm này? Vietnet24h - Apple từng kỳ vọng iPhone Air — chiếc iPhone mỏng nhất và nhẹ nhất từ trước đến nay — sẽ mở ra một phân khúc mới giữa các mẫu iPhone truyền thống.
Indonesia tạm thời chặn truy cập vào Grok vì nội dung khiêu dâm Vietnet24h - Hôm thứ Bảy, Indonesia đã tạm thời chặn chatbot Grok của Elon Musk do lo ngại về nội dung khiêu dâm do trí tuệ nhân tạo tạo ra, trở thành quốc gia đầu tiên từ chối quyền truy cập vào công cụ AI này.
MacBook Pro 14-inch và chiến lược “ổn định hóa đỉnh cao” của Apple trong kỷ nguyên Apple Silicon Vietnet24h - MacBook Pro 14-inch không mang đến cuộc cách mạng về thiết kế. Tuy nhiên, chính sự “không đổi” này lại phản ánh một thông điệp rõ ràng: Apple đã đạt đến độ chín của nền tảng phần cứng.
Đánh giá iPhone Air: Thiết kế siêu mỏng có đáng để đánh đổi không? Vietnet24h - Apple lần đầu tiên trình làng iPhone Air với thiết kế siêu mỏng chỉ 5,6 mm — điểm nhấn lớn về mặt thẩm mỹ và cảm giác cầm. Tuy nhiên, mức độ mỏng này đi kèm với một số “hy sinh” đáng kể so với dòng Pro của hãng.
EVA Air cấm ký gửi tai nghe Bluetooth Vietnet24h - Theo hãng hàng không, các thiết bị điện tử như tai nghe Bluetooth phải được để trong hành lý xách tay.
Oppo Find X9 Pro: Siêu phẩm “điên rồ” nhất 2025, pin 7.500 mAh, camera 200 MP, giá gần 42 triệu đồng Vietnet24h - Siêu phẩm Trung Quốc này mang đến pin 7.500 mAh trong thân máy mỏng 8 mm, màn hình sáng 3.600 nits, camera tele 200 MP cùng hiệu năng “khủng” từ chip MediaTek Dimensity 9500.
Đánh giá iPad Pro 13 inch (M5): Siêu mạnh, siêu thừa, siêu đắt! Vietnet24h - Apple lại tiếp tục “đốt tiền” vào chip khủng cho thiết bị bị… kìm hãm bởi hệ điều hành. iPad Pro 13 inch (M5) chính là minh chứng rõ nhất.
Google Pixel Watch 4: Kẻ Thay Đổi Cuộc Chơi Trong Ngành Đồng Hồ Thông Minh Vietnet24h - Google Pixel Watch 4 đánh dấu bước đột phá, khắc phục các hạn chế của các phiên bản trước, mang đến trải nghiệm đồng hồ thông minh hoàn chỉnh.