Công nghệ
Emo của Alibaba: khi ảnh tĩnh có thể cất tiếng hát
Phan Khôi - Thứ Tư, 13/03/2024 9:41 CH
Vietnet24h - EMO, một sản phẩm trí tuệ nhân tạo (AI) sáng tạo, trao cho ảnh tĩnh khả năng hát, tạo ra những trải nghiệm âm nhạc độc đáo và hấp dẫn chưa từng có.
Alibaba, đứng đầu trong lĩnh vực công nghệ, đã đặt dấu ấn mạnh mẽ trong thế giới trí tuệ nhân tạo (AI) với sự ra đời của sản phẩm đột phá EMO (Emotive Portrait Alive). Được phát triển bởi nhóm nghiên cứu tại Viện Điện toán Thông minh (IIC) của Alibaba, EMO là kết quả của nỗ lực nghiên cứu sâu từ các nhà khoa học hàng đầu như LinRui Tian, Qi Wang, LieFeng Bo, và Bang.
 
EMO có khả năng "hô biến" hình ảnh tĩnh thành video có khả năng nói và hát như thật. Nói một cách đơn giản, AI của Alibaba có thể chuyển đổi một bức tranh tĩnh và âm thanh giọng nói thành một video chân thực với biểu cảm tự nhiên, với đặc điểm nổi bật là miệng tạo ra bởi AI trông vô cùng tự nhiên.
 
Trong các video mà Alibaba đã công bố, chúng ta đã thấy hình ảnh trở nên sống động và bắt đầu hát các bài hát chỉ trong vài giây. Một trong những ví dụ đáng chú ý nhất là bức tranh Mona Lisa biểu diễn đoạn độc thoại của nhân vật Rosalind trong vở kịch "As You Like It" của William Shakespeare.
 
EMO không chỉ là một bước tiến lớn trong việc biến đổi hình ảnh tĩnh thành video mà còn mở ra nhiều khả năng mới cho ngành công nghiệp công nghệ. Có lẽ chúng ta sẽ được chứng kiến những ứng dụng thú vị và độc đáo mà EMO mang lại trong tương lai.
Công nghệ EMO của Alibaba được phát triển thông qua một quá trình đào tạo sâu với hơn 250 giờ video đa dạng, đa ngôn ngữ, bao gồm các bài phát biểu, phim và biểu diễn âm nhạc. Thay vì phụ thuộc vào mô hình 3D truyền thống, hệ thống này trực tiếp tạo ra khung hình video thông qua mô hình khuếch tán.
 
EMO sử dụng công nghệ nhận diện khuôn mặt và xử lý ngôn ngữ tự nhiên để tạo ra hình ảnh và âm thanh đồng bộ, mang lại trải nghiệm thực tế ảo chưa từng có. Alibaba cho biết họ đã huấn luyện AI với một lượng lớn dữ liệu về hình ảnh, âm thanh và video để tạo ra biểu cảm khuôn mặt chân thực thông qua mô hình khuếch tán riêng biệt có tên là Audio2Video.
 
Đại diện của nhóm nghiên cứu lý giải rằng mục tiêu của họ là vượt qua thách thức lớn hiện nay về tính chân thực và biểu cảm khi chuyển đổi hình ảnh và âm thanh thành video. Họ tập trung vào mối liên hệ và sắc thái giữa tín hiệu âm thanh và chuyển động trên khuôn mặt, áp dụng phương pháp tổng hợp, bỏ qua các mô hình 3D trung gian hoặc các điểm mốc trên khuôn mặt để tạo ra khung hình video liền mạch và bảo toàn tính nhất quán, mang lại cho video động tính biểu cảm và sống động như thật.
iPhone 16 Pro và 16 Pro Max: Sự tiến bộ vượt trội với nút chụp như máy ảnh chuyên nghiệp Vietnet24h - Trong một bước tiến đầy bất ngờ, Apple đã hé lộ thiết kế mới nhất của mình cho chiếc iPhone 16 Pro. Điểm nhấn đáng chú ý nhất chính là nút chụp được thiết kế giống như trên máy ảnh truyền thống.
Dự đoán của Jensen Huang về thời điểm xuất hiện của AGI chỉ là suy đoán Vietnet24h - CEO Jensen Huang thừa nhận rằng dự đoán về thời điểm xuất hiện của AGI chỉ là suy đoán và chỉ thời gian mới có thể trả lời liệu dự đoán của ông có chính xác hay không.
Tin khác cùng chuyên mục
Tin đọc nhiều
MediaTek ra mắt bộ xử lý AI cho Chromebook Plus Vietnet24h - MediaTek Inc., nhà thiết kế IC lớn nhất tại Đài Loan, đã giới thiệu bộ xử lý mới -- Kompanio Ultra -- vào thứ Hai, công ty mô tả đây là cột mốc mới nhất trong Chromebook hiệu suất cao, chạy bằng trí tuệ nhân tạo.
Chuẩn GPMI của Trung Quốc: ‘Một dây cáp cho mọi thiết bị’ Vietnet24h - GPMI được thiết kế để tối giản hóa kết nối số bằng cách gộp cả dữ liệu và điện năng vào một sợi cáp duy nhất. Nếu được phổ biến, đây có thể là bước ngoặt định hình lại hệ sinh thái điện tử trong tương lai.
Rò rỉ cách Apple sẽ làm cho màn hình bên trong của iPhone gập trở nên quen thuộc với người dùng iPad Vietnet24h - Chiếc điện thoại có thể gập đầu tiên của Apple dự kiến ​​sẽ được sản xuất hàng loạt vào cuối năm sau và có thể ra mắt vào quý 4 năm 2026 hoặc quý 1 năm 2027.
Alibaba cung cấp miễn phí mô hình tạo video AI trên toàn cầu Vietnet24h - Gã khổng lồ Trung Quốc cho biết họ đang mở mã nguồn bốn mô hình thuộc dòng Wan2.1, phiên bản mới nhất của mô hình AI nền tảng của công ty, có khả năng tạo hình ảnh và video từ dữ liệu đầu vào là văn bản và hình ảnh.
Từ Gmail đến Word, cài đặt quyền riêng tư và AI của bạn đang bước vào một mối quan hệ mới Vietnet24h - Các chương trình như Gmail, Microsoft và Facebook đã tồn tại trong nhiều năm qua đã âm thầm kích hoạt và tích hợp các tính năng AI.
AI trong Gmail, Word: Tiện ích hay mối đe dọa quyền riêng tư? Vietnet24h - AI đang dần xâm nhập vào mọi ngóc ngách của cuộc sống số, từ email đến sổ sách kế toán. Tuy nhiên, sự thiếu rõ ràng trong chính sách bảo mật khiến nhiều chuyên gia cảnh báo về nguy cơ dữ liệu cá nhân bị lạm dụng.
OpenAI bật mí 5 mẹo dùng ChatGPT mà bạn chưa biết Vietnet24h - Nick Turley, chuyên gia của OpenAI, tiết lộ các tính năng như tải tập tin, tạo GPT tùy chỉnh và sử dụng giọng nói, hứa hẹn thay đổi cách người dùng tương tác với ChatGPT.
Ghi âm cuộc gọi và cải tiến camera: Những điểm nổi bật trong iOS 18.1 của Apple Vietnet24h - Vào tối 28 tháng 10, Apple phát hành phiên bản iOS 18.1, mang đến tính năng ghi âm cuộc gọi lần đầu tiên cho người dùng iPhone. Cùng với đó là những cải tiến cho camera và giao diện, hứa hẹn sẽ nâng cao trải nghiệm người dùng trên các thiết bị mới.
Orion sắp ra mắt: OpenAI mở ra chương mới cho trí tuệ nhân tạo Vietnet24h - Với việc ra mắt mô hình AI mới mang tên Orion vào tháng 12/2024, OpenAI đang tạo ra những bước tiến mạnh mẽ trong lĩnh vực công nghệ. Orion được kỳ vọng sẽ có sức mạnh vượt trội gấp 100 lần GPT-4, đánh dấu một cột mốc quan trọng trong hành trình phát triển trí tuệ nhân tạo tổng quát.
Chỉnh sửa ảnh thông minh với Microsoft Paint nhờ AI Vietnet24h - Microsoft Paint không ngừng cải tiến với sự ra mắt của Generative Fill và Generative Erase. Hai tính năng mới này giúp người dùng dễ dàng thêm hoặc xóa các chi tiết trong ảnh, mang lại trải nghiệm chỉnh sửa ảnh phong phú và trực quan hơn bao giờ hết.
Galaxy S25 Edge đạt được độ bền chưa từng có với kính Gorilla Glass Ceramic 2 của Corning Vietnet24h - Samsung Electronics đã công bố vào ngày 9 tháng 5 rằng họ đã áp dụng kính gốm cho thiết bị di động mới của Corning.
CEO Apple Tim Cook tiết lộ những gì Apple cần để sản xuất iPhone tại Hoa Kỳ Vietnet24h - Trong khi thảm họa thuế quan đã mang lại sắc đỏ cho thị trường và sự hỗn loạn cho nền kinh tế toàn cầu, mục tiêu cuối cùng theo Tổng thống Donald Trump và những người ủng hộ ông là đưa hoạt động sản xuất trở lại Hoa Kỳ.
Đòn giáng mạnh vào Google khi Apple muốn thêm tìm kiếm AI vào Safari Vietnet24h - Apple đang "tích cực xem xét" việc định hình lại trình duyệt web Safari trên các thiết bị của mình để tập trung vào các công cụ tìm kiếm hỗ trợ AI.
Công ty mẹ của Facebook là Meta ra mắt ứng dụng trợ lý AI, tiếp tục cạnh tranh với OpenAI và Google Vietnet24h - Vào thứ Ba, công ty mẹ của Facebook là Meta Platforms đã ra mắt một ứng dụng riêng cho trợ lý Meta AI của mình, tương tự như những ứng dụng do OpenAI do Microsoft hậu thuẫn và Google của Alphabet cung cấp.
ĐÓN XEM TRIỂN LÃM QUỐC TẾ ĐIỆN TỬ & THIẾT BỊ THÔNG MINH VIỆT NAM 2025 (IEAE) Vietnet24h - Triển lãm Quốc tế Điện tử và Thiết bị thông minh Việt Nam 2025 (IEAE) sẽ được tổ chức từ ngày 29 đến 31 tháng 5 năm 2025 tại Trung tâm Hội chợ và Triển lãm Sài Gòn (SECC) – 799 Nguyễn Văn Linh, Quận 7, thành phố Hồ Chí Minh.
CEO của Nvidia, Jensen Huang cảnh báo Trung Quốc "không tụt hậu" về AI Vietnet24h - CEO của Nvidia, Jensen Huang cho biết "Trung Quốc không hề tụt hậu" trong lĩnh vực trí tuệ nhân tạo và Huawei là "một trong những công ty công nghệ đáng gờm nhất thế giới".
Với iPhone 17, Apple chơi lớn: Tự chủ chip, mở rộng AI, dứt khoát chia tay “Plus” Vietnet24h - Việc khai tử phiên bản Plus để nhường chỗ cho mẫu Air siêu mỏng là dấu hiệu cho thấy Apple đang tái cấu trúc danh mục iPhone. Cùng lúc, hãng đẩy mạnh nội địa hóa linh kiện, nâng cấp phần cứng và tích hợp AI sâu rộng nhằm giữ vị thế dẫn đầu trong cuộc đua công nghệ.
Bên trong nhà máy sản xuất chip hoàn toàn tự động của LG Innotek: Robot, AI và không bụi Vietnet24h - LG Innotek đã mở cửa "Dream Factory" tiên tiến của mình tại Gumi, tỉnh Gyeongsang Bắc, lần đầu tiên cho giới truyền thông địa phương, thể hiện động thái đầy tham vọng của công ty nhằm định vị mình là một công ty lớn trong thị trường chất nền bán dẫn thế hệ tiếp theo.
Nvidia cho biết họ tuân thủ luật xuất khẩu của Hoa Kỳ một ngày sau khi ngừng bán chip AI cho Trung Quốc Vietnet24h - Nvidia cho biết hôm thứ Tư rằng họ tuân thủ theo chỉ đạo của chính phủ Hoa Kỳ về nơi họ có thể bán chip AI của mình "theo đúng nghĩa đen".
Điện thoại thông minh, màn hình máy tính và linh kiện điện tử được miễn thuế quan mới nhất của Trump Vietnet24h - Theo thông báo của Cơ quan Hải quan và Bảo vệ Biên giới Hoa Kỳ được đăng vào cuối ngày thứ Sáu (11/4), các thiết bị điện tử nhập khẩu vào Hoa Kỳ sẽ được miễn thuế quan có đi có lại của Tổng thống Donald Trump.
Neuralink: cấy chip não, biên tập video và đăng YouTube bằng suy nghĩ Vietnet24h - Trong một bước đột phá ấn tượng, Bradford Smith, người mắc bệnh ALS, đã chứng minh khả năng tuyệt vời của công nghệ giao diện não-máy tính (BCI) khi có thể biên tập video và đăng tải lên YouTube chỉ bằng suy nghĩ, mà không cần sự trợ giúp từ bất kỳ thiết bị hay người khác. Đây không chỉ là sự tiến bộ trong lĩnh vực công nghệ mà còn mang lại hy vọng mới cho những người khuyết tật vận động.
LG Display công bố màn hình OLED màu xanh huỳnh quang thương mại đầu tiên trên thế giới Vietnet24h - LG Display đã xác minh thành công hiệu suất sản xuất của tấm nền điốt phát quang hữu cơ phát quang màu xanh lam (OLED) cho dây chuyền sản xuất hàng loạt lần đầu tiên trên thế giới, công ty cho biết hôm thứ Năm (1/5).
Người Trung Quốc chuẩn bị bay như Iron Man! Vietnet24h - Một thiết bị bay cá nhân vừa được trình diễn tại Hàng Châu khiến nhiều người liên tưởng đến các bộ phim siêu anh hùng. Nhưng lần này, không phải Hollywood mà chính các nhà khoa học Trung Quốc mới là người hiện thực hóa giấc mơ bay cá nhân.
Công nghệ cấy ghép não được FDA chấp thuận cho Precision Neuroscience Vietnet24h - Precision Neuroscience thông báo rằng một thành phần cốt lõi của hệ thống cấy ghép não đã được Cục Quản lý Thực phẩm và Dược phẩm Hoa Kỳ chấp thuận.
Từ ghi hình kép đến UX sáng tạo: iPhone 17 Pro có thể mở ra chương mới trong thiết kế trải nghiệm Vietnet24h - Không chỉ là tính năng mới, ghi hình kép trên iPhone 17 Pro là phép thử đầu tiên cho cách Apple xây dựng trải nghiệm người dùng kiểu mới – nơi cảm xúc, phản ứng và câu chuyện của người quay trở thành trung tâm của mọi khung hình.
Kim loại lỏng: Apple đang thử nghiệm cho iPhone gập, bền hơn titan 2,5 lần Vietnet24h - Công nghệ bản lề kim loại lỏng có thể giúp iPhone gập không chỉ bền hơn mà còn có thiết kế sang trọng hơn. Liệu đây có phải là bước tiến lớn trong công nghệ smartphone gập?
Apple áp dụng kim loại lỏng cho iPhone gập, mở ra kỷ nguyên mới Vietnet24h - Apple được cho là sẽ sử dụng kim loại lỏng để chế tạo bản lề cho iPhone gập, giúp tăng độ bền và hạn chế nếp gấp màn hình. Công nghệ này có thể tạo ra bước đột phá trên thị trường smartphone gập.
Amazon sẽ mang công nghệ quét lòng bàn tay đến các cơ sở y tế NYU Langone Vietnet24h - Bệnh nhân của NYU Langone Health sẽ có thể đăng ký lịch hẹn bằng Amazon One, công nghệ quét lòng bàn tay của công ty.
Lenovo hé lộ máy tính xách tay màn hình gập chạy bằng năng lượng mặt trời trong khái niệm mới nhất Vietnet24h - Lenovo đã tiết lộ khái niệm Lenovo ThinkBook ‘flip’, một chiếc máy tính xách tay có màn hình có thể gập lại. Khi mở hoàn toàn, toàn màn hình có kích thước 18 inch.
Meta công bố kính thông minh nghiên cứu thử nghiệm Aria Gen 2 Vietnet24h - Meta đã tiết lộ phiên bản mới nhất của loại kính thử nghiệm nhằm hỗ trợ nghiên cứu về trí tuệ nhân tạo, robot và nhận thức của máy móc.