Tiêu dùng thông minh
Emo của Alibaba: khi ảnh tĩnh có thể cất tiếng hát
Phan Khôi - Thứ Tư, 13/03/2024 9:41 CH
Vietnet24h - EMO, một sản phẩm trí tuệ nhân tạo (AI) sáng tạo, trao cho ảnh tĩnh khả năng hát, tạo ra những trải nghiệm âm nhạc độc đáo và hấp dẫn chưa từng có.
Alibaba, đứng đầu trong lĩnh vực công nghệ, đã đặt dấu ấn mạnh mẽ trong thế giới trí tuệ nhân tạo (AI) với sự ra đời của sản phẩm đột phá EMO (Emotive Portrait Alive). Được phát triển bởi nhóm nghiên cứu tại Viện Điện toán Thông minh (IIC) của Alibaba, EMO là kết quả của nỗ lực nghiên cứu sâu từ các nhà khoa học hàng đầu như LinRui Tian, Qi Wang, LieFeng Bo, và Bang.
 
EMO có khả năng "hô biến" hình ảnh tĩnh thành video có khả năng nói và hát như thật. Nói một cách đơn giản, AI của Alibaba có thể chuyển đổi một bức tranh tĩnh và âm thanh giọng nói thành một video chân thực với biểu cảm tự nhiên, với đặc điểm nổi bật là miệng tạo ra bởi AI trông vô cùng tự nhiên.
 
Trong các video mà Alibaba đã công bố, chúng ta đã thấy hình ảnh trở nên sống động và bắt đầu hát các bài hát chỉ trong vài giây. Một trong những ví dụ đáng chú ý nhất là bức tranh Mona Lisa biểu diễn đoạn độc thoại của nhân vật Rosalind trong vở kịch "As You Like It" của William Shakespeare.
 
EMO không chỉ là một bước tiến lớn trong việc biến đổi hình ảnh tĩnh thành video mà còn mở ra nhiều khả năng mới cho ngành công nghiệp công nghệ. Có lẽ chúng ta sẽ được chứng kiến những ứng dụng thú vị và độc đáo mà EMO mang lại trong tương lai.
Công nghệ EMO của Alibaba được phát triển thông qua một quá trình đào tạo sâu với hơn 250 giờ video đa dạng, đa ngôn ngữ, bao gồm các bài phát biểu, phim và biểu diễn âm nhạc. Thay vì phụ thuộc vào mô hình 3D truyền thống, hệ thống này trực tiếp tạo ra khung hình video thông qua mô hình khuếch tán.
 
EMO sử dụng công nghệ nhận diện khuôn mặt và xử lý ngôn ngữ tự nhiên để tạo ra hình ảnh và âm thanh đồng bộ, mang lại trải nghiệm thực tế ảo chưa từng có. Alibaba cho biết họ đã huấn luyện AI với một lượng lớn dữ liệu về hình ảnh, âm thanh và video để tạo ra biểu cảm khuôn mặt chân thực thông qua mô hình khuếch tán riêng biệt có tên là Audio2Video.
 
Đại diện của nhóm nghiên cứu lý giải rằng mục tiêu của họ là vượt qua thách thức lớn hiện nay về tính chân thực và biểu cảm khi chuyển đổi hình ảnh và âm thanh thành video. Họ tập trung vào mối liên hệ và sắc thái giữa tín hiệu âm thanh và chuyển động trên khuôn mặt, áp dụng phương pháp tổng hợp, bỏ qua các mô hình 3D trung gian hoặc các điểm mốc trên khuôn mặt để tạo ra khung hình video liền mạch và bảo toàn tính nhất quán, mang lại cho video động tính biểu cảm và sống động như thật.
iPhone 16 Pro và 16 Pro Max: Sự tiến bộ vượt trội với nút chụp như máy ảnh chuyên nghiệp Vietnet24h - Trong một bước tiến đầy bất ngờ, Apple đã hé lộ thiết kế mới nhất của mình cho chiếc iPhone 16 Pro. Điểm nhấn đáng chú ý nhất chính là nút chụp được thiết kế giống như trên máy ảnh truyền thống.
Dự đoán của Jensen Huang về thời điểm xuất hiện của AGI chỉ là suy đoán Vietnet24h - CEO Jensen Huang thừa nhận rằng dự đoán về thời điểm xuất hiện của AGI chỉ là suy đoán và chỉ thời gian mới có thể trả lời liệu dự đoán của ông có chính xác hay không.
Tin khác cùng chuyên mục
Tin đọc nhiều
Samsung Galaxy A56 5G, Galaxy A36 5G và Galaxy A26 5G chính thức có mặt trên toàn cầu Vietnet24h - Samsung Electronics vừa chính thức công bố sự ra mắt toàn cầu[1] của Galaxy A56 5G, Galaxy A36 5G và Galaxy A26 5G, đánh dấu bước tiến quan trọng trong hành trình mở ra vô vàn trải nghiệm mới cho người dùng nhờ công nghệ AI di động tiên tiến.
Chờ đợi AI: Khi smartphone mắc kẹt trong kỳ vọng Vietnet24h - AI được kỳ vọng sẽ cách mạng hóa smartphone, nhưng thực tế, nó chỉ dừng lại ở việc tối ưu ảnh, dịch thuật hay hỗ trợ một số tác vụ cơ bản. Trong khi đó, các cải tiến về camera, pin và thiết kế lại giậm chân tại chỗ. Liệu chúng ta có đang lãng phí cả một thế hệ phần cứng để chờ đợi AI hoàn thiện?
Điện thoại gập Pura X của Huawei thúc đẩy sự thay thế của Apple và Google Vietnet24h - Huawei đã ra mắt điện thoại thông minh có thể gập lại Pura X vào thứ năm tuần này với mức giá khởi điểm là 7.499 Nhân dân tệ Trung Quốc (1.037 đô la).
Google công bố bản cập nhật AI chăm sóc sức khỏe mới cho mục Tìm kiếm Vietnet24h - Công ty cho biết họ đã mở rộng các bảng kiến ​​thức để bao gồm thêm "hàng nghìn" chủ đề về sức khỏe và các bảng kiến ​​thức này sẽ có mặt ở nhiều quốc gia và ngôn ngữ hơn.
Công nghệ màn hình chấm lượng tử của Samsung đạt chứng nhận không chứa Cadmium từ SGS Vietnet24h - Chứng nhận từ SGS xác nhận rằng màng chấm lượng tử có trong sản phẩm không chứa cadmium và đáp ứng các tiêu chuẩn theo quy định RoHS
Meta’s Community Notes sẽ sử dụng công nghệ nguồn mở từ X của Elon Musk Vietnet24h - Meta cho biết hôm thứ Năm rằng công cụ kiểm duyệt nội dung cộng đồng mới mang tên Community Notes sẽ sử dụng thuật toán nguồn mở từ X.
Apple hoãn cải tiến Siri AI đến năm 2026 Vietnet24h - Hôm qua, thứ Sáu (7/3), Apple đã thông báo rằng, họ sẽ trì hoãn các tính năng sẽ hỗ trợ Siri với khả năng làm việc với các ứng dụng khác cho đến năm sau. Tính năng đó dự kiến ​​sẽ được phát hành vào mùa xuân này.
Công ty khởi nghiệp điện thoại thông minh Nothing cố gắng khuấy động thị trường với chiếc điện thoại giá 400 đô la Vietnet24h - Công ty khởi nghiệp công nghệ tiêu dùng Nothing đã ra mắt điện thoại thông minh Phone (3a) mới vào thứ ba (4/3).
Microsoft ra mắt trợ lý AI kích hoạt bằng giọng nói mới dành cho bác sĩ Vietnet24h - Hôm nay, thứ Ha (3/3)i, Microsoft đã công bố một trợ lý AI chăm sóc sức khỏe mới có tên Dragon Copilot, được xây dựng dựa trên các giải pháp nghe chính tả và lắng nghe xung quanh hiện có.
Xiaomi ra mắt điện thoại giá 1.600 đô la khi giá cổ phiếu tăng 300% lên mức cao kỷ lục Vietnet24h - Xiaomi đã ra mắt Xiaomi 15 và Xiaomi 15 Ultra vào Chủ Nhật tại Đại hội Thế giới Di động (MWC) 2025. Xiaomi 15 có giá khởi điểm là 999 euro (1.047 đô la) và Xiaomi 15 Ultra có giá khởi điểm là 1.499 euro (1.571 đô la).
Giải pháp đánh bay hôi miệng, lấy lại tự tin trong giao tiếp Vietnet24h - Hôi miệng không chỉ là vấn đề về sức khỏe mà còn ảnh hưởng trực tiếp đến sự tự tin và giao tiếp hàng ngày, đặc biệt đối với những người làm công việc tư vấn, kinh doanh hoặc giao tiếp trực tiếp. Mùi hôi khó chịu từ miệng khiến bạn gặp khó khăn trong các cuộc trò chuyện, khiến người khác ngại ngùng và ảnh hưởng đến mối quan hệ xã hội. Tuy nhiên, đừng lo lắng, vì những giải pháp đơn giản có thể giúp bạn khắc phục tình trạng này một cách hiệu quả.
Giới chức Mỹ kiện TikTok vì lo ngại thanh thiếu niên bị ảnh hưởng bởi nghiện mạng xã hội Vietnet24h - TikTok, nền tảng video nổi tiếng, đã trở thành mục tiêu của các vụ kiện từ 13 bang ở Mỹ, với cáo buộc gây nghiện cho thanh thiếu niên và làm tổn hại đến sức khỏe tâm thần của họ thông qua những thuật toán được thiết kế để tăng thời gian sử dụng.
Cách sử dụng ChatGPT vừa ra mắt chế độ giọng nói nâng cao cho trò chuyện âm thanh của OpenAI Vietnet24h - Mặc dù công cụ này phản hồi nhanh và có thể nói bằng nhiều giọng khác nhau, nhưng bạn có thể gặp phải giới hạn về tốc độ nếu sử dụng nhiều lần trong một ngày.
Đánh giá sơ bộ về iPhone 16 mới ra lò của Apple Vietnet24h - iPhone 16 Pro Max có thời lượng pin tốt hơn và camera tuyệt vời, nhưng Apple Intelligence vẫn chưa xuất hiện
Apple Watch Series 10 chỉ có những nâng cấp nhỏ, nhưng điểm cộng lớn là sạc nhanh hơn Vietnet24h - Apple Watch là một phần của bộ phận Thiết bị đeo, Gia đình và Phụ kiện của công ty, đã báo cáo doanh thu 8,1 tỷ đô la trong quý tài chính thứ ba, giảm 2% so với một năm trước.
Apple phát hành iOS 18 cho iPhone, nhưng không bao gồm Apple Intelligence Vietnet24h - Đây là bản cập nhật iPhone lớn nhất trong năm của Apple, nhưng bản cập nhật này không bao gồm Apple Intelligence, hệ thống AI sắp ra mắt của công ty.
Lý do nhiều người không ưa chuộng smartphone màn hình gập Vietnet24h - Đã nhiều năm trôi qua kể từ khi smartphone màn hình gập lần đầu tiên xuất hiện, nhưng doanh số của thiết bị đầy sáng tạo này vẫn chưa thể cạnh tranh với smartphone thông thường. Dù các thương hiệu liên tục thúc đẩy sản phẩm ra thị trường, nhiều người vẫn tỏ ra không mặn mà với dòng sản phẩm này. Vậy điều gì khiến smartphone màn hình gập chưa thể đạt được thành công mong đợi? Hãy cùng khám phá.
Liệu trẻ em có nên dùng Apple Watch? Vietnet24h - Apple vừa tung ra một trang web tiếp thị mới, quảng cáo Apple Watch như một cách để các bậc cha mẹ giữ liên lạc với con cái của họ.
Đánh giá sơ bộ về máy tính bảng Surface Pro của Microsoft Vietnet24h - Phiên bản thứ 11 của máy tính bảng chuyển đổi Surface Pro của Microsoft dựa trên chip Qualcomm tiêu thụ năng lượng, dẫn đến thời lượng pin hơn 8 giờ trong các thử nghiệm ban đầu.
Cảnh báo: mạng lưới lừa đảo với chiêu thức giả mạo ứng dụng bảo hiểm xã hội số Vietnet24h - Trong bối cảnh không gian mạng ngày càng trở nên phức tạp, Cục An toàn thông tin, thuộc Bộ Thông tin và Truyền thông, đã phát đi một thông báo khẩn cấp về những chiêu trò lừa đảo mới mẻ, đặc biệt là các vụ việc giả mạo ứng dụng VssID - Bảo hiểm xã hội số.