Tiêu dùng
Emo của Alibaba: khi ảnh tĩnh có thể cất tiếng hát
Phan Khôi - Thứ Tư, 13/03/2024 9:41 CH
Vietnet24h - EMO, một sản phẩm trí tuệ nhân tạo (AI) sáng tạo, trao cho ảnh tĩnh khả năng hát, tạo ra những trải nghiệm âm nhạc độc đáo và hấp dẫn chưa từng có.
Alibaba, đứng đầu trong lĩnh vực công nghệ, đã đặt dấu ấn mạnh mẽ trong thế giới trí tuệ nhân tạo (AI) với sự ra đời của sản phẩm đột phá EMO (Emotive Portrait Alive). Được phát triển bởi nhóm nghiên cứu tại Viện Điện toán Thông minh (IIC) của Alibaba, EMO là kết quả của nỗ lực nghiên cứu sâu từ các nhà khoa học hàng đầu như LinRui Tian, Qi Wang, LieFeng Bo, và Bang.
 
EMO có khả năng "hô biến" hình ảnh tĩnh thành video có khả năng nói và hát như thật. Nói một cách đơn giản, AI của Alibaba có thể chuyển đổi một bức tranh tĩnh và âm thanh giọng nói thành một video chân thực với biểu cảm tự nhiên, với đặc điểm nổi bật là miệng tạo ra bởi AI trông vô cùng tự nhiên.
 
Trong các video mà Alibaba đã công bố, chúng ta đã thấy hình ảnh trở nên sống động và bắt đầu hát các bài hát chỉ trong vài giây. Một trong những ví dụ đáng chú ý nhất là bức tranh Mona Lisa biểu diễn đoạn độc thoại của nhân vật Rosalind trong vở kịch "As You Like It" của William Shakespeare.
 
EMO không chỉ là một bước tiến lớn trong việc biến đổi hình ảnh tĩnh thành video mà còn mở ra nhiều khả năng mới cho ngành công nghiệp công nghệ. Có lẽ chúng ta sẽ được chứng kiến những ứng dụng thú vị và độc đáo mà EMO mang lại trong tương lai.
Công nghệ EMO của Alibaba được phát triển thông qua một quá trình đào tạo sâu với hơn 250 giờ video đa dạng, đa ngôn ngữ, bao gồm các bài phát biểu, phim và biểu diễn âm nhạc. Thay vì phụ thuộc vào mô hình 3D truyền thống, hệ thống này trực tiếp tạo ra khung hình video thông qua mô hình khuếch tán.
 
EMO sử dụng công nghệ nhận diện khuôn mặt và xử lý ngôn ngữ tự nhiên để tạo ra hình ảnh và âm thanh đồng bộ, mang lại trải nghiệm thực tế ảo chưa từng có. Alibaba cho biết họ đã huấn luyện AI với một lượng lớn dữ liệu về hình ảnh, âm thanh và video để tạo ra biểu cảm khuôn mặt chân thực thông qua mô hình khuếch tán riêng biệt có tên là Audio2Video.
 
Đại diện của nhóm nghiên cứu lý giải rằng mục tiêu của họ là vượt qua thách thức lớn hiện nay về tính chân thực và biểu cảm khi chuyển đổi hình ảnh và âm thanh thành video. Họ tập trung vào mối liên hệ và sắc thái giữa tín hiệu âm thanh và chuyển động trên khuôn mặt, áp dụng phương pháp tổng hợp, bỏ qua các mô hình 3D trung gian hoặc các điểm mốc trên khuôn mặt để tạo ra khung hình video liền mạch và bảo toàn tính nhất quán, mang lại cho video động tính biểu cảm và sống động như thật.
iPhone 16 Pro và 16 Pro Max: Sự tiến bộ vượt trội với nút chụp như máy ảnh chuyên nghiệp Vietnet24h - Trong một bước tiến đầy bất ngờ, Apple đã hé lộ thiết kế mới nhất của mình cho chiếc iPhone 16 Pro. Điểm nhấn đáng chú ý nhất chính là nút chụp được thiết kế giống như trên máy ảnh truyền thống.
Dự đoán của Jensen Huang về thời điểm xuất hiện của AGI chỉ là suy đoán Vietnet24h - CEO Jensen Huang thừa nhận rằng dự đoán về thời điểm xuất hiện của AGI chỉ là suy đoán và chỉ thời gian mới có thể trả lời liệu dự đoán của ông có chính xác hay không.
Tin khác cùng chuyên mục
Tin đọc nhiều
Ứng dụng iPhone mới của Apple chứng minh việc hủy mật khẩu trực tuyến khó đến mức nào Vietnet24h - Phiên bản của Apple, ứng dụng Mật khẩu, miễn phí và tiện lợi, nhưng các chuyên gia an ninh mạng vẫn cho rằng xác thực dựa trên thông báo đẩy, sinh trắc học hoặc mật mã là giải pháp tốt hơn cho tương lai.
Microsoft xác nhận lỗi trên Windows 10 và chuẩn bị bản vá lỗi Vietnet24h - Microsoft đã thừa nhận sự cố ảnh hưởng đến chức năng nhấp chuột phải trên thanh tác vụ Windows 10 sau các bản cập nhật gần đây, cam kết sẽ cung cấp bản vá lỗi trong bản cập nhật sắp tới để khắc phục tình trạng này cho người dùng.
Tủ lạnh hỗ trợ AI của Samsung giúp chủ nhân tiết kiệm năng lượng Vietnet24h - Công ty Điện tử Samsung cho biết hôm thứ Năm (20/6) rằng, tủ lạnh đầu tiên trong ngành sử dụng trí tuệ nhân tạo và công nghệ bán dẫn làm nguồn năng lượng làm mát bên cạnh công nghệ máy nén thông thường, giúp chủ sở hữu tiết kiệm hóa đơn tiện ích.
Samsung Electronics ra mắt đồng loạt dòng màn hình OLED cao cấp Vietnet24h - Các tính năng thông minh được hỗ trợ bởi AI mang lại khả năng giải trí vượt trội cho Smart Monitor M8 và Odyssey OLED G8, trong khi các mẫu mẫu màn hình ViewFinity mới giúp tăng cường hiệu quả làm việc.
OPPO Find X7 Ultra đầu tiên đạt được Nhãn hiển thị thoải mái cho mắt DXOMARK Vietnet24h - Để đạt được tiêu chuẩn chất lượng này, độ nhấp nháy, độ sáng tối thiểu, tính năng lọc ánh sáng xanh và độ đồng nhất màu sắc của Find X7 Ultra đều đáp ứng tiêu chuẩn chính xác do DXOMARK đặt ra.
Màn hình tự phục hồi của iPhone gập: Không chỉ dành cho iPhone Vietnet24h - Công nghệ màn hình tự phục hồi có thể xuất hiện trên các thiết bị khác của Apple, từ laptop đến smartwatch.
Lỗi không thể tin: iOS 17.5 hồi sinh ảnh đã xóa Vietnet24h - Người dùng iPhone đang bày tỏ sự lo lắng sau khi phát hiện ra rằng các bức ảnh mà họ đã xóa vĩnh viễn trước đây bất ngờ được khôi phục trong thư viện ảnh của họ, một hiện tượng kỳ lạ sau khi cập nhật lên phiên bản iOS 17.5 mới nhất từ Apple.
Kiểm soát thời gian sử dụng công nghệ cho trẻ em: Bài học kinh nghiệm từ Pháp Vietnet24h - Một báo cáo chuyên sâu của Pháp đã khám phá các phương pháp hiệu quả nhất để kiểm soát thời gian sử dụng công nghệ của trẻ em, bảo vệ chúng khỏi những tác động tiêu cực tiềm ẩn.
Smart Ring của Apple có thể phát hiện chơi 'oẳn tù tì' Vietnet24h - Thiết bị đeo của Apple nhận bằng sáng chế có thể phân biệt nhiều cử chỉ ngón tay khác nhau.
Samsung ra mắt dải sản phẩm TV AI đỉnh cao 2024 tại Việt Nam Vietnet24h - Dòng sản phẩm 2024 đại diện cho thời đại TV AI thông minh vượt bậc, mang trải nghiệm nghe nhìn vượt chuẩn, an toàn và tiết kiệm điện cho người dùng.
Cảnh báo: mạng lưới lừa đảo với chiêu thức giả mạo ứng dụng bảo hiểm xã hội số Vietnet24h - Trong bối cảnh không gian mạng ngày càng trở nên phức tạp, Cục An toàn thông tin, thuộc Bộ Thông tin và Truyền thông, đã phát đi một thông báo khẩn cấp về những chiêu trò lừa đảo mới mẻ, đặc biệt là các vụ việc giả mạo ứng dụng VssID - Bảo hiểm xã hội số.
Cổng tiếp nhận phản ánh lạm dụng tên miền: Hỗ trợ người dùng bảo vệ quyền lợi Vietnet24h - Cổng tiếp nhận phản ánh lạm dụng tên miền hỗ trợ người dùng bảo vệ quyền lợi và chống lại hành vi vi phạm.
Cài đặt iOS 17.5: Hướng dẫn từng bước nâng cấp Vietnet24h - Đừng bỏ lỡ bản cập nhật iOS 17.5 với các tính năng mới ấn tượng. Học cách nâng cấp ngay bây giờ!
Samsung Galaxy M15 5G ra mắt: Pin trâu 6000mAh, hiệu năng mạnh mẽ, giá bình dân Vietnet24h - Samsung vừa giới thiệu mẫu smartphone Galaxy M15 5G với những nâng cấp đáng giá như dung lượng pin lớn 6000mAh, kết nối 5G, hứa hẹn trở thành đối thủ mạnh trong phân khúc giá rẻ.
iPhone 16 Plus: Dung lượng pin giảm nhưng tối ưu năng lượng Vietnet24h - Apple có thể giảm dung lượng pin của iPhone 16 Plus, tuy nhiên những cải tiến về mặt công nghệ sẽ đảm bảo hiệu suất năng lượng hiệu quả.
Đánh giá Apple Vision Pro: Tương lai của điện toán và giải trí (phần 1) Vietnet24h - Apple Vision Pro, có giá khởi điểm 3.500 USD, ra mắt tại Mỹ vào thứ Sáu (2/2/2024). Đây là tiện ích mới quan trọng đầu tiên kể từ khi Apple Watch ra mắt vào tháng 4 năm 2015.
Cảnh báo các chiêu trò lừa đảo dịp Tết 2024 Vietnet24h - Cục An toàn thông tin, Bộ Thông tin và Truyền thông cảnh báo những chiêu trò lừa đảo qua mạng đang ngày càng tinh vi, người dân cần chú ý đề phòng trong dịp Tết cận kề.
Microsoft tố cáo nhóm người Việt tiếp tay lừa đảo Vietnet24h - Nhóm ba người Việt bị cáo buộc tạo và bán hơn 750 triệu tài khoản Microsoft phục vụ lừa đảo, thu về hàng triệu USD bất hợp pháp.
Cách tiết kiệm tiền khi đi du lịch trong kỳ nghỉ bằng cách theo dõi giá chuyến bay với Google Vietnet24h - Google Flights có một tính năng sẽ theo dõi giá vé máy bay cho bạn.
Sử dụng tính năng ẩn này của Google để phát hiện và xóa thông tin cá nhân của bạn trong tìm kiếm Vietnet24h - Google có tính năng thông báo cho bạn khi thông tin cá nhân của bạn được đăng trực tuyến.