Công nghệ
Emo của Alibaba: khi ảnh tĩnh có thể cất tiếng hát
Phan Khôi - Thứ Tư, 13/03/2024 9:41 CH
Vietnet24h - EMO, một sản phẩm trí tuệ nhân tạo (AI) sáng tạo, trao cho ảnh tĩnh khả năng hát, tạo ra những trải nghiệm âm nhạc độc đáo và hấp dẫn chưa từng có.
Alibaba, đứng đầu trong lĩnh vực công nghệ, đã đặt dấu ấn mạnh mẽ trong thế giới trí tuệ nhân tạo (AI) với sự ra đời của sản phẩm đột phá EMO (Emotive Portrait Alive). Được phát triển bởi nhóm nghiên cứu tại Viện Điện toán Thông minh (IIC) của Alibaba, EMO là kết quả của nỗ lực nghiên cứu sâu từ các nhà khoa học hàng đầu như LinRui Tian, Qi Wang, LieFeng Bo, và Bang.
 
EMO có khả năng "hô biến" hình ảnh tĩnh thành video có khả năng nói và hát như thật. Nói một cách đơn giản, AI của Alibaba có thể chuyển đổi một bức tranh tĩnh và âm thanh giọng nói thành một video chân thực với biểu cảm tự nhiên, với đặc điểm nổi bật là miệng tạo ra bởi AI trông vô cùng tự nhiên.
 
Trong các video mà Alibaba đã công bố, chúng ta đã thấy hình ảnh trở nên sống động và bắt đầu hát các bài hát chỉ trong vài giây. Một trong những ví dụ đáng chú ý nhất là bức tranh Mona Lisa biểu diễn đoạn độc thoại của nhân vật Rosalind trong vở kịch "As You Like It" của William Shakespeare.
 
EMO không chỉ là một bước tiến lớn trong việc biến đổi hình ảnh tĩnh thành video mà còn mở ra nhiều khả năng mới cho ngành công nghiệp công nghệ. Có lẽ chúng ta sẽ được chứng kiến những ứng dụng thú vị và độc đáo mà EMO mang lại trong tương lai.
Công nghệ EMO của Alibaba được phát triển thông qua một quá trình đào tạo sâu với hơn 250 giờ video đa dạng, đa ngôn ngữ, bao gồm các bài phát biểu, phim và biểu diễn âm nhạc. Thay vì phụ thuộc vào mô hình 3D truyền thống, hệ thống này trực tiếp tạo ra khung hình video thông qua mô hình khuếch tán.
 
EMO sử dụng công nghệ nhận diện khuôn mặt và xử lý ngôn ngữ tự nhiên để tạo ra hình ảnh và âm thanh đồng bộ, mang lại trải nghiệm thực tế ảo chưa từng có. Alibaba cho biết họ đã huấn luyện AI với một lượng lớn dữ liệu về hình ảnh, âm thanh và video để tạo ra biểu cảm khuôn mặt chân thực thông qua mô hình khuếch tán riêng biệt có tên là Audio2Video.
 
Đại diện của nhóm nghiên cứu lý giải rằng mục tiêu của họ là vượt qua thách thức lớn hiện nay về tính chân thực và biểu cảm khi chuyển đổi hình ảnh và âm thanh thành video. Họ tập trung vào mối liên hệ và sắc thái giữa tín hiệu âm thanh và chuyển động trên khuôn mặt, áp dụng phương pháp tổng hợp, bỏ qua các mô hình 3D trung gian hoặc các điểm mốc trên khuôn mặt để tạo ra khung hình video liền mạch và bảo toàn tính nhất quán, mang lại cho video động tính biểu cảm và sống động như thật.
iPhone 16 Pro và 16 Pro Max: Sự tiến bộ vượt trội với nút chụp như máy ảnh chuyên nghiệp Vietnet24h - Trong một bước tiến đầy bất ngờ, Apple đã hé lộ thiết kế mới nhất của mình cho chiếc iPhone 16 Pro. Điểm nhấn đáng chú ý nhất chính là nút chụp được thiết kế giống như trên máy ảnh truyền thống.
Dự đoán của Jensen Huang về thời điểm xuất hiện của AGI chỉ là suy đoán Vietnet24h - CEO Jensen Huang thừa nhận rằng dự đoán về thời điểm xuất hiện của AGI chỉ là suy đoán và chỉ thời gian mới có thể trả lời liệu dự đoán của ông có chính xác hay không.
Tin khác cùng chuyên mục
Tin đọc nhiều
Samsung đang nghiên cứu thiết kế TriFold rộng hơn trong hồ sơ bằng sáng chế Vietnet24h - Theo một hồ sơ bằng sáng chế được công bố hôm thứ Tư, Samsung Electronics đã nghiên cứu một phiên bản rộng hơn của chiếc Galaxy Z TriFold.
Hiểu thể nào là đúng về Start Up? Vietnet24h - Không ít người vẫn hiểu sai rằng startup đơn giản chỉ là một công ty mới thành lập hoặc doanh nghiệp nhỏ.
DeepSeek V4 chạy trên chip Huawei: Bước tiến lớn của Trung Quốc trong cuộc đua AI và bán dẫn Vietnet24h - Cuộc cạnh tranh công nghệ toàn cầu đang chứng kiến một bước ngoặt đáng chú ý khi mô hình AI thế hệ mới DeepSeek V4 của Trung Quốc được cho là sẽ vận hành trên chip do Huawei phát triển.
Doanh nghiệp điện tử – bán dẫn cần chuẩn bị gì để đạt Giấy chứng nhận doanh nghiệp khoa học và công nghệ? Vietnet24h - Trong bối cảnh Việt Nam đẩy mạnh chiến lược phát triển công nghiệp công nghệ cao, bán dẫn và AI, Giấy chứng nhận doanh nghiệp khoa học và công nghệ (DN KH&CN) đang trở thành một “tấm vé chiến lược” giúp doanh nghiệp điện tử – bán dẫn bước lên nấc thang cao hơn trong chuỗi giá trị.
Camera sau của Galaxy S26 sẽ có thông số kỹ thuật tương tự như S25. Vietnet24h - Samsung đang lên kế hoạch trang bị camera sau có thông số kỹ thuật tương tự cho mẫu Galaxy S26 tiêu chuẩn ra mắt năm sau với tên gọi Galaxy S25.
Phần mềm mới của Nvidia có thể giúp theo dõi xem các chip AI của hãng được sử dụng đến đâu. Vietnet24h - Dịch vụ tùy chọn mới của Nvidia sẽ cung cấp dữ liệu định vị địa lý, giúp xác định quốc gia mà các GPU cụ thể đang hoạt động.
Digital Twin – “Bản sao số” đang cách mạng hóa công nghiệp và đời sống Việt Nam Vietnet24h - Trong kỷ nguyên Công nghiệp 4.0 và Chuyển đổi số quốc gia, khái niệm Digital Twin (Bản sao số) đang nổi lên như một “vũ khí bí mật” giúp doanh nghiệp tối ưu vận hành, giảm chi phí và dự đoán tương lai với độ chính xác chưa từng có.
SAMSUNG GALAXY Z FLIP 7 “ĐỐI ĐẦU” IPHONE 17 PRO: “SIÊU PHẨM” NÀO XỨNG ĐÁNG 1.099 USD NHẤT NĂM 2025? Vietnet24h - Điện thoại gập không còn là “hàng thử nghiệm” nữa! Chúng đang “chiến đấu sòng phẳng” với các flagship truyền thống.
Meta Connect 2025: Kính thông minh tích hợp AI chiếm vị trí trung tâm Vietnet24h - Meta đã chi hàng tỷ đô la để cố gắng đưa thực tế ảo (VR) trở thành xu hướng với người tiêu dùng. Khi chuyển hướng chiến lược metaverse sang kính thông minh, các nhà đầu tư sẽ theo dõi phản ứng của công chúng.
Virtual Twin: mô hình kỹ thuật số mô phỏng chính xác một thực thể vật lý hoặc hệ thống trong thế giới thực Vietnet24h - Virtual Twin (Song sinh số) là một mô hình kỹ thuật số được tạo ra để mô phỏng chính xác một thực thể vật lý hoặc hệ thống trong thế giới thực, như sản phẩm, quy trình sản xuất, hoặc thậm chí là toàn bộ nhà máy, thành phố.
Nhà máy Samsung Taylor đi vào hoạt động, với chip của Tesla sẵn sàng cho việc sản xuất Vietnet24h - Samsung Electronics sắp bắt đầu hoạt động tại nhà máy sản xuất chip của mình ở Taylor, Texas, với các công tác chuẩn bị đang được tiến hành để sản xuất chip trí tuệ nhân tạo (AI) cho Tesla bằng quy trình 2 nanomet.
Tập đoàn Hyundai Motor tái cấu trúc danh mục sản phẩm hướng đến trí tuệ nhân tạo vật lý Vietnet24h - Tập đoàn Hyundai Motor đang đẩy nhanh quá trình tái cấu trúc kinh doanh sâu rộng bằng cách sắp xếp lại danh mục đầu tư của các công ty con chủ chốt xoay quanh lĩnh vực robot và trí tuệ nhân tạo (AI) vật lý.
Apple tránh được lệnh cấm nhập khẩu Apple Watch tại Mỹ sau phán quyết mới Vietnet24h - Apple vừa giành chiến thắng pháp lý quan trọng khi cơ quan thương mại Mỹ bác đề nghị áp lệnh cấm nhập khẩu mới đối với Apple Watch, giúp hãng tiếp tục bán các mẫu đồng hồ thông minh tại thị trường lớn nhất của mình.
Qualcomm mở rộng đầu tư công nghệ lõi tại Việt Nam, thúc đẩy hệ sinh thái 6G và AI Vietnet24h - Tập đoàn bán dẫn Mỹ Qualcomm đang mở rộng chiến lược đầu tư vào các lĩnh vực công nghệ lõi tại Việt Nam, bao gồm 6G, trí tuệ nhân tạo (AI), ô tô thông minh và thiết bị kết nối.
Cadence và Nvidia đang hợp tác phát triển trí tuệ nhân tạo cho robot Vietnet24h - Trong bối cảnh cuộc đua phát triển robot thông minh ngày càng tăng tốc, Cadence Design Systems và Nvidia vừa công bố mở rộng hợp tác nhằm thúc đẩy phát triển trí tuệ nhân tạo cho robot.
Việc sản xuất iPhone gập bị hoãn lại, nhưng kế hoạch ra mắt vào mùa thu năm 2026 vẫn được giữ nguyên Vietnet24h - Việc sản xuất iPhone Fold đang chậm tiến độ, nhưng thiết bị vẫn dự kiến ​​ra mắt vào mùa thu năm 2026, theo báo cáo của DigiTimes.
TSMC dự kiến ​​sẽ đạt lợi nhuận kỷ lục trong quý thứ tư liên tiếp nhờ nhu cầu AI không ngừng tăng cao Vietnet24h - Trong bối cảnh làn sóng trí tuệ nhân tạo tiếp tục bùng nổ trên quy mô toàn cầu, TSMC một lần nữa khẳng định vị thế trung tâm của mình trong chuỗi giá trị bán dẫn khi được dự báo ghi nhận quý thứ tư liên tiếp đạt lợi nhuận kỷ lục.
Samsung Galaxy thể hiện thiết kế lấy con người làm trung tâm với S26 và Buds 4 Vietnet24h - Hãng Samsung Electronics hôm thứ Năm cho biết, thiết kế mới cho dòng điện thoại thông minh và tai nghe Galaxy của hãng sẽ lấy con người làm trung tâm, nhằm mục đích cho phép công nghệ và dữ liệu hòa quyện liền mạch hơn vào cuộc sống hàng ngày của người dùng.
Meta ra mắt mô hình AI mới, nỗ lực bắt kịp Google và OpenAI sau khi đã chi hàng tỷ đô la Vietnet24h - Trong cuộc đua trí tuệ nhân tạo đang ngày càng khốc liệt, Meta Platforms vừa chính thức trình làng mô hình AI quy mô lớn đầu tiên kể từ sau thương vụ đầu tư trị giá 14 tỷ USD nhằm đưa Alexandr Wang về dẫn dắt chiến lược AI.
Samsung Electronics ra mắt mảng kinh doanh xưởng sản xuất chip quang tử silicon Vietnet24h - Bộ phận sản xuất chip của Samsung Electronics đã chính thức tuyên bố gia nhập thị trường quang tử silicon.
Robot AI vật lý do Hàn Quốc sản xuất được ứng dụng trong chăm sóc tim mạch Vietnet24h - Trung tâm Y tế Asan sử dụng robot hỗ trợ can thiệp mạch vành qua da để điều trị bệnh nhân.
Cuộc đua robot hình người: “bàn tay” mới là chiến trường quyết định, không phải trí tuệ Vietnet24h - Thế giới đang bị cuốn vào cuộc cạnh tranh phát triển robot hình người với trọng tâm là AI và năng lực xử lý.
Mô hình AI dự đoán hương vị kim chi và mức độ lên men Vietnet24h - Viện nghiên cứu kim chi hàng đầu của Hàn Quốc đã phát triển một mô hình trí tuệ nhân tạo (AI) mới có thể dự đoán hương vị của kim chi dựa trên các điều kiện lên men, bao gồm nhiệt độ và vi khuẩn hiện diện.
Samsung Display giới thiệu các khái niệm AI và OLED thế hệ tiếp theo Vietnet24h - Samsung Display đã giới thiệu các sản phẩm concept cho các thiết bị trí tuệ nhân tạo (AI) thế hệ tiếp theo sử dụng công nghệ OLED tại một sự kiện truyền thông hôm thứ Hai (giờ địa phương) trước thềm CES 2026.
Từ “robot trình diễn” đến nền tảng mở: Unitree và bước ngoặt mới của ngành robot tiêu dùng Vietnet24h - Việc Unitree Robotics công bố nền tảng cho phép người dùng điều khiển robot thông qua smartphone không đơn thuần là một cải tiến giao diện người dùng.
Tàu vũ trụ thương mại đầu tiên của Hàn Quốc dự kiến ​​phóng vào ngày 22 tháng 11 tại Brazil Vietnet24h - HANBIT-Nano, tên lửa đẩy thương mại đầu tiên của Hàn Quốc do Innospace phát triển, sẽ được phóng vào lúc 3 giờ chiều ngày 22 tháng 11 tại Brazil (giờ địa phương), công ty cho biết hôm thứ Sáu (7/11).
Tương Lai Robot Hình Người: Từ “CMO” Đến Người Bạn Đồng Hành Của Nhân Loại Vietnet24h - Boston, ngày 3/10/2025 – Trong một động thái gây chấn động, robot hình người Uri – từng là Unitree G1 – vừa được bổ nhiệm làm Giám đốc Marketing (CMO) cho Series, nền tảng mạng xã hội cạnh tranh trực tiếp với LinkedIn.
PCIM Asia Shanghai 2025: Cuộc Cách Mạng Công Nghệ Điện Tử Công Suất – Phỏng Vấn Độc Quyền Với CEO EPC Về Tương Lai GaN Và AI Vietnet24h - Phóng viên Vietnet24h đã có cơ hội phỏng vấn độc quyền ông Alexander Lidow, Tiến sĩ khoa học, Tổng Giám đốc điều hành EPC (Efficient Power Conversion) – một trong những nhà tiên phong về công nghệ Gallium Nitride (GaN).
Triển Lãm Robot Tại Thượng Hải 2025: Đa Robot, Đa Nhiệm Vụ Và Tương Lai Việc Làm Tự Động Hóa Vietnet24h - Thượng Hải, Trung Quốc, ngày 27/9/2025 – Trong khuôn khổ China International Industry Fair (CIIF) 2025, Triển lãm Robot (Robot Show) đang diễn ra sôi nổi từ ngày 23 đến 27/9 tại Trung tâm Triển lãm và Hội nghị Quốc gia (National Exhibition and Convention Center, địa chỉ: 333 Songze Avenue, Quận Thanh Phổ, Thượng Hải).
Mark Zuckerberg ra mắt kính Meta Ray-Ban Display giá 799 đô la Vietnet24h - Hôm thứ Tư, Mark Zuckerberg đã ra mắt chiếc kính Meta Ray-Ban Display trị giá 799 đô la, chiếc kính thông minh đầu tiên của công ty truyền thông xã hội này dành cho người tiêu dùng với màn hình tích hợp.