Tiêu điểm công nghệ
Emo của Alibaba: khi ảnh tĩnh có thể cất tiếng hát
Phan Khôi - Thứ Tư, 13/03/2024 9:41 CH
Vietnet24h - EMO, một sản phẩm trí tuệ nhân tạo (AI) sáng tạo, trao cho ảnh tĩnh khả năng hát, tạo ra những trải nghiệm âm nhạc độc đáo và hấp dẫn chưa từng có.
Alibaba, đứng đầu trong lĩnh vực công nghệ, đã đặt dấu ấn mạnh mẽ trong thế giới trí tuệ nhân tạo (AI) với sự ra đời của sản phẩm đột phá EMO (Emotive Portrait Alive). Được phát triển bởi nhóm nghiên cứu tại Viện Điện toán Thông minh (IIC) của Alibaba, EMO là kết quả của nỗ lực nghiên cứu sâu từ các nhà khoa học hàng đầu như LinRui Tian, Qi Wang, LieFeng Bo, và Bang.
 
EMO có khả năng "hô biến" hình ảnh tĩnh thành video có khả năng nói và hát như thật. Nói một cách đơn giản, AI của Alibaba có thể chuyển đổi một bức tranh tĩnh và âm thanh giọng nói thành một video chân thực với biểu cảm tự nhiên, với đặc điểm nổi bật là miệng tạo ra bởi AI trông vô cùng tự nhiên.
 
Trong các video mà Alibaba đã công bố, chúng ta đã thấy hình ảnh trở nên sống động và bắt đầu hát các bài hát chỉ trong vài giây. Một trong những ví dụ đáng chú ý nhất là bức tranh Mona Lisa biểu diễn đoạn độc thoại của nhân vật Rosalind trong vở kịch "As You Like It" của William Shakespeare.
 
EMO không chỉ là một bước tiến lớn trong việc biến đổi hình ảnh tĩnh thành video mà còn mở ra nhiều khả năng mới cho ngành công nghiệp công nghệ. Có lẽ chúng ta sẽ được chứng kiến những ứng dụng thú vị và độc đáo mà EMO mang lại trong tương lai.
Công nghệ EMO của Alibaba được phát triển thông qua một quá trình đào tạo sâu với hơn 250 giờ video đa dạng, đa ngôn ngữ, bao gồm các bài phát biểu, phim và biểu diễn âm nhạc. Thay vì phụ thuộc vào mô hình 3D truyền thống, hệ thống này trực tiếp tạo ra khung hình video thông qua mô hình khuếch tán.
 
EMO sử dụng công nghệ nhận diện khuôn mặt và xử lý ngôn ngữ tự nhiên để tạo ra hình ảnh và âm thanh đồng bộ, mang lại trải nghiệm thực tế ảo chưa từng có. Alibaba cho biết họ đã huấn luyện AI với một lượng lớn dữ liệu về hình ảnh, âm thanh và video để tạo ra biểu cảm khuôn mặt chân thực thông qua mô hình khuếch tán riêng biệt có tên là Audio2Video.
 
Đại diện của nhóm nghiên cứu lý giải rằng mục tiêu của họ là vượt qua thách thức lớn hiện nay về tính chân thực và biểu cảm khi chuyển đổi hình ảnh và âm thanh thành video. Họ tập trung vào mối liên hệ và sắc thái giữa tín hiệu âm thanh và chuyển động trên khuôn mặt, áp dụng phương pháp tổng hợp, bỏ qua các mô hình 3D trung gian hoặc các điểm mốc trên khuôn mặt để tạo ra khung hình video liền mạch và bảo toàn tính nhất quán, mang lại cho video động tính biểu cảm và sống động như thật.
iPhone 16 Pro và 16 Pro Max: Sự tiến bộ vượt trội với nút chụp như máy ảnh chuyên nghiệp Vietnet24h - Trong một bước tiến đầy bất ngờ, Apple đã hé lộ thiết kế mới nhất của mình cho chiếc iPhone 16 Pro. Điểm nhấn đáng chú ý nhất chính là nút chụp được thiết kế giống như trên máy ảnh truyền thống.
Dự đoán của Jensen Huang về thời điểm xuất hiện của AGI chỉ là suy đoán Vietnet24h - CEO Jensen Huang thừa nhận rằng dự đoán về thời điểm xuất hiện của AGI chỉ là suy đoán và chỉ thời gian mới có thể trả lời liệu dự đoán của ông có chính xác hay không.
Tin khác cùng chuyên mục
Tin đọc nhiều
Hướng dẫn cách trao đổi số chỉ bằng cách chạm các iPhone lại với nhau Vietnet24h - Bạn có thể trao đổi thông tin liên lạc bằng cách giữ iPhone của bạn cạnh nhau. Cả hai iPhone đều cần được cập nhật lên iOS 17.
Windows 12 sẽ phát hành vào năm 2024 Vietnet24h - Theo một số báo cáo rò rỉ, Microsoft đang phát triển Windows 12 và dự kiến sẽ phát hành vào năm 2024.
Apple đặt mã QR siêu nhỏ kiểm soát số lượng màn hình lỗi Vietnet24h - Apple đã chi hàng triệu USD để thêm mã vạch (QR) vào màn hình iPhone nhằm tránh bị tính phí hàng trăm triệu USD bởi các nhà cung cấp gian dối trong báo cáo lượng màn hình lỗi của quá trình sản xuất.
LG ra mắt thiết bị giải trí xách tay LG StanbyME Go Vietnet24h - Công ty LG Electronics Việt Nam (LG) vừa trình làng thiết bị giải trí xách tay LG StanbyME Go, mở ra khái niệm “picnic công nghệ” với trải nghiệm linh hoạt và chủ động, không giới hạn không gian.
iPhone 15 Pro modem Qualcomm và khung smartphone dễ sửa chữa hơn Vietnet24h - iPhone 15 Pro và iPhone 15 Pro Max của Apple có thiết kế khung mới, có thể giúp việc sửa chữa màn hình hoặc thay pin của thiết bị trở nên dễ dàng hơn.
Đánh giá Apple iPhone 15 Pro: Phần 2 Vietnet24h - Hai chiếc iPhone Pro là những bản nâng cấp lớn qua từng năm, với những cải tiến thú vị về những tính năng mới.
Đánh giá Apple iPhone 15 Pro: Phần 1 Vietnet24h - Hai chiếc iPhone Pro là những bản nâng cấp lớn qua từng năm, với những cải tiến về camera, thân máy được cải tiến và nút bấm mới.
Thêm tính năng cảnh báo thiết bị định vị xung quanh trên Android 14 Vietnet24h - Unknown Tracker Alerts (UTA), tính năng vừa được Google bổ sung trên Android 14, sẽ thông báo cho người dùng có thiết bị theo dõi ở gần đó hay không.
Ứng dụng trò chuyện Bing của Microsoft hiện cho phép bạn tìm kiếm bằng hình ảnh Vietnet24h - Hôm nay, Microsoft đã công bố một bản cập nhật quan trọng cho chatbot trí tuệ nhân tạo của mình: tìm kiếm trực quan.
Những tính năng đáng kinh ngạc của thiết bị đeo Apple Vision Pro Vietnet24h - Tai nghe Vision Pro của Apple đã khơi dậy sự quan tâm trở lại đối với những thiết bị đeo thực tế ảo.
Samsung dự kiến ​​sẽ giới thiệu vi xử lý Exynos mới trên dòng Galaxy tiếp theo Vietnet24h - Theo các nguồn tin trong ngành vào thứ Sáu tuần qua (17/5), Samsung Electronics dự kiến ​​​​sẽ giới thiệu bộ vi xử lý di động Exynos 2500 hàng đầu mới của mình được sản xuất bằng quy trình 3 nanomet tiên tiến cho dòng điện thoại thông minh Galaxy S25 sắp ra mắt.
Apple Vision Pro: Toàn cầu hóa thị trường Vietnet24h - Apple đẩy mạnh toàn cầu hóa thị trường Vision Pro, mang đến sản phẩm thực tế hỗn hợp cho người dùng trên khắp thế giới.
Samsung tăng gấp đôi đầu tư vào Việt Nam Vietnet24h - Samsung Electronics đã cam kết tăng chi tiêu hàng năm tại Việt Nam lên 1 tỷ USD khi quốc gia này nổi lên như một cơ sở chiến lược cho sản xuất trong khu vực.
SEMI cung cấp đào tạo trực tuyến cho các kỹ sư công nghệ bán dẫn Vietnet24h - Đại học SEMI đang cung cấp các chương trình chứng nhận khóa học trực tuyến được thiết kế để thúc đẩy nhanh quá trình phát triển nghề nghiệp bán dẫn.
Tóm tắt về hội nghị nhà phát triển thường niên Google I/O: Cập nhật Gemini AI, tính năng tìm kiếm mới và hơn thế nữa Vietnet24h - Google vào thứ Ba đã tổ chức hội nghị nhà phát triển I/O hàng năm. Công ty đã công bố một loạt sản phẩm trí tuệ nhân tạo, từ tính năng tìm kiếm và trò chuyện mới đến phần cứng AI dành cho khách hàng trên nền tảng đám mây.
Nikkei đưa tin Arm có kế hoạch ra mắt chip AI vào năm 2025 Vietnet24h - Công ty Arm có trụ sở tại Anh sẽ thành lập một bộ phận chip AI và đặt mục tiêu xây dựng nguyên mẫu vào mùa xuân năm 2025.
Apple cung cấp năng lượng cho máy chủ AI bằng chip của mình Vietnet24h - Apple đang đưa chip của mình vào các máy chủ điện toán đám mây có khả năng xử lý các tác vụ AI nâng cao trên các thiết bị của mình.
Apple công bố iPad Pro mới với máy tính bảng M4, iPad Air Vietnet24h - Apple đã công bố phiên bản mới của máy tính bảng iPad Air và iPad Pro vào thứ Ba vửa qua.
Samsung ra mắt chip di động 3nm đầu tiên trên thế giới sử dụng AI Vietnet24h - Samsung Electronics đã tạo nên đột phá khi tích hợp AI vào thiết kế chip, cho ra đời chip di động 3nm đầu tiên, mở ra kỷ nguyên mới trong ngành bán dẫn.
TSMC trình làng công nghệ A16 mới, hướng tới sản xuất vào năm 2026 Vietnet24h - Công ty Sản xuất Chất bán dẫn Đài Loan (TSMC) hôm thứ Tư tuần trước đã ra mắt quy trình bán dẫn A16, được cho là "công nghệ tiếp theo" và là một bước tiến từ quy trình N2 tiên tiến nhất hiện đang trên đà bắt đầu sản xuất vào năm tới.
TCL gập ba: khả năng gập ba hướng, xác thực khuôn mặt dưới màn hình Vietnet24h - TCL đã giới thiệu smartphone gập ba đầu tiên trên thế giới tại SID 2024, với màn hình 7,85 inch khi được mở hoàn toàn. Thiết bị có thể gập thành hình chữ Z hoặc chữ G, hoặc mở rộng như một máy tính bảng, mang lại trải nghiệm đa dạng cho người dùng.
Robot thu hoạch cà chua tự động Vietnet24h - Artemy là robot thu hoạch cà chua hoàn toàn tự động, theo nhà sản xuất Certhon Build.
Samsung Electro-Mechanics giảm gói chip L/S xuống còn 5/5um Vietnet24h - Samsung Electro-Mechanics đã giảm độ rộng dòng/khoảng cách dòng (L/S) của gói chip xuống còn 5 micromet.
Emo của Alibaba: khi ảnh tĩnh có thể cất tiếng hát Vietnet24h - EMO, một sản phẩm trí tuệ nhân tạo (AI) sáng tạo, trao cho ảnh tĩnh khả năng hát, tạo ra những trải nghiệm âm nhạc độc đáo và hấp dẫn chưa từng có.
Oppo trình làng nguyên mẫu kính thực tế tăng cường có trợ lý giọng nói Vietnet24h - Oppo đã ra mắt Oppo Air Glass 3, một bộ kính thực tế tăng cường (AR) nguyên mẫu có trợ lý giọng nói tại Mobile World Congress ở Barcelona.
Lenovo giới thiệu laptop màn hình trong suốt tại MWC 2024 Vietnet24h - Tại MWC 2024, Lenovo đã trình diễn ý tưởng laptop màn hình trong suốt mới có tên ThinkBook Transparent Display Laptop. Điểm nhấn của chiếc laptop này là nó sở hữu viền màn hình siêu mỏng và được tích hợp trí tuệ nhân tạo. Đây cũng được coi là một trong những thiết bị độc đáo nhất được trưng bày tại MWC 2024.
Bệnh nhân cấy chip não Neuralink đã điều khiển được chuột máy tính bằng suy nghĩ Vietnet24h - Tỉ phú Elon Musk cho biết người đầu tiên được cấy chip não từ Công ty Neuralink của ông đã bình phục hoàn toàn, và có thể điều khiển chuột máy tính bằng suy nghĩ.
Tianhe-3: Siêu máy tính bí ẩn của Trung Quốc Vietnet24h - Khám phá bí ẩn đằng sau siêu máy tính Tianhe-3, một dự án bí mật của Trung Quốc đang làm thay đổi cục diện công nghệ trên thế giới.
Samsung và SK Hynix mở rộng sử dụng EUV để tăng nhu cầu về khí CO2 Vietnet24h - Samsung và SK Hynix đang mở rộng việc sử dụng kỹ thuật in thạch bản cực tím (EUV) khi họ chuyển sang sản xuất DRAM ngày càng tiên tiến hơn.
Công ty Neuralink của Musk lần đầu cấy chip não lên người Vietnet24h - Nhà sáng lập Neuralink - tỷ phú Elon Musk cho biết hôm 28/1 vừa rồi, bệnh nhân đầu tiên đã được cấy ghép chip não từ công ty khởi nghiệp chip não Neuralink và bệnh nhân này đang hồi phục tốt.