Công nghệ độc lạ
Emo của Alibaba: khi ảnh tĩnh có thể cất tiếng hát
Phan Khôi - Thứ Tư, 13/03/2024 9:41 CH
Vietnet24h - EMO, một sản phẩm trí tuệ nhân tạo (AI) sáng tạo, trao cho ảnh tĩnh khả năng hát, tạo ra những trải nghiệm âm nhạc độc đáo và hấp dẫn chưa từng có.
Alibaba, đứng đầu trong lĩnh vực công nghệ, đã đặt dấu ấn mạnh mẽ trong thế giới trí tuệ nhân tạo (AI) với sự ra đời của sản phẩm đột phá EMO (Emotive Portrait Alive). Được phát triển bởi nhóm nghiên cứu tại Viện Điện toán Thông minh (IIC) của Alibaba, EMO là kết quả của nỗ lực nghiên cứu sâu từ các nhà khoa học hàng đầu như LinRui Tian, Qi Wang, LieFeng Bo, và Bang.
 
EMO có khả năng "hô biến" hình ảnh tĩnh thành video có khả năng nói và hát như thật. Nói một cách đơn giản, AI của Alibaba có thể chuyển đổi một bức tranh tĩnh và âm thanh giọng nói thành một video chân thực với biểu cảm tự nhiên, với đặc điểm nổi bật là miệng tạo ra bởi AI trông vô cùng tự nhiên.
 
Trong các video mà Alibaba đã công bố, chúng ta đã thấy hình ảnh trở nên sống động và bắt đầu hát các bài hát chỉ trong vài giây. Một trong những ví dụ đáng chú ý nhất là bức tranh Mona Lisa biểu diễn đoạn độc thoại của nhân vật Rosalind trong vở kịch "As You Like It" của William Shakespeare.
 
EMO không chỉ là một bước tiến lớn trong việc biến đổi hình ảnh tĩnh thành video mà còn mở ra nhiều khả năng mới cho ngành công nghiệp công nghệ. Có lẽ chúng ta sẽ được chứng kiến những ứng dụng thú vị và độc đáo mà EMO mang lại trong tương lai.
Công nghệ EMO của Alibaba được phát triển thông qua một quá trình đào tạo sâu với hơn 250 giờ video đa dạng, đa ngôn ngữ, bao gồm các bài phát biểu, phim và biểu diễn âm nhạc. Thay vì phụ thuộc vào mô hình 3D truyền thống, hệ thống này trực tiếp tạo ra khung hình video thông qua mô hình khuếch tán.
 
EMO sử dụng công nghệ nhận diện khuôn mặt và xử lý ngôn ngữ tự nhiên để tạo ra hình ảnh và âm thanh đồng bộ, mang lại trải nghiệm thực tế ảo chưa từng có. Alibaba cho biết họ đã huấn luyện AI với một lượng lớn dữ liệu về hình ảnh, âm thanh và video để tạo ra biểu cảm khuôn mặt chân thực thông qua mô hình khuếch tán riêng biệt có tên là Audio2Video.
 
Đại diện của nhóm nghiên cứu lý giải rằng mục tiêu của họ là vượt qua thách thức lớn hiện nay về tính chân thực và biểu cảm khi chuyển đổi hình ảnh và âm thanh thành video. Họ tập trung vào mối liên hệ và sắc thái giữa tín hiệu âm thanh và chuyển động trên khuôn mặt, áp dụng phương pháp tổng hợp, bỏ qua các mô hình 3D trung gian hoặc các điểm mốc trên khuôn mặt để tạo ra khung hình video liền mạch và bảo toàn tính nhất quán, mang lại cho video động tính biểu cảm và sống động như thật.
iPhone 16 Pro và 16 Pro Max: Sự tiến bộ vượt trội với nút chụp như máy ảnh chuyên nghiệp Vietnet24h - Trong một bước tiến đầy bất ngờ, Apple đã hé lộ thiết kế mới nhất của mình cho chiếc iPhone 16 Pro. Điểm nhấn đáng chú ý nhất chính là nút chụp được thiết kế giống như trên máy ảnh truyền thống.
Dự đoán của Jensen Huang về thời điểm xuất hiện của AGI chỉ là suy đoán Vietnet24h - CEO Jensen Huang thừa nhận rằng dự đoán về thời điểm xuất hiện của AGI chỉ là suy đoán và chỉ thời gian mới có thể trả lời liệu dự đoán của ông có chính xác hay không.
Tin khác cùng chuyên mục
Tin đọc nhiều
MediaTek ra mắt bộ xử lý AI cho Chromebook Plus Vietnet24h - MediaTek Inc., nhà thiết kế IC lớn nhất tại Đài Loan, đã giới thiệu bộ xử lý mới -- Kompanio Ultra -- vào thứ Hai, công ty mô tả đây là cột mốc mới nhất trong Chromebook hiệu suất cao, chạy bằng trí tuệ nhân tạo.
Chuẩn GPMI của Trung Quốc: ‘Một dây cáp cho mọi thiết bị’ Vietnet24h - GPMI được thiết kế để tối giản hóa kết nối số bằng cách gộp cả dữ liệu và điện năng vào một sợi cáp duy nhất. Nếu được phổ biến, đây có thể là bước ngoặt định hình lại hệ sinh thái điện tử trong tương lai.
Rò rỉ cách Apple sẽ làm cho màn hình bên trong của iPhone gập trở nên quen thuộc với người dùng iPad Vietnet24h - Chiếc điện thoại có thể gập đầu tiên của Apple dự kiến ​​sẽ được sản xuất hàng loạt vào cuối năm sau và có thể ra mắt vào quý 4 năm 2026 hoặc quý 1 năm 2027.
Alibaba cung cấp miễn phí mô hình tạo video AI trên toàn cầu Vietnet24h - Gã khổng lồ Trung Quốc cho biết họ đang mở mã nguồn bốn mô hình thuộc dòng Wan2.1, phiên bản mới nhất của mô hình AI nền tảng của công ty, có khả năng tạo hình ảnh và video từ dữ liệu đầu vào là văn bản và hình ảnh.
Từ Gmail đến Word, cài đặt quyền riêng tư và AI của bạn đang bước vào một mối quan hệ mới Vietnet24h - Các chương trình như Gmail, Microsoft và Facebook đã tồn tại trong nhiều năm qua đã âm thầm kích hoạt và tích hợp các tính năng AI.
AI trong Gmail, Word: Tiện ích hay mối đe dọa quyền riêng tư? Vietnet24h - AI đang dần xâm nhập vào mọi ngóc ngách của cuộc sống số, từ email đến sổ sách kế toán. Tuy nhiên, sự thiếu rõ ràng trong chính sách bảo mật khiến nhiều chuyên gia cảnh báo về nguy cơ dữ liệu cá nhân bị lạm dụng.
OpenAI bật mí 5 mẹo dùng ChatGPT mà bạn chưa biết Vietnet24h - Nick Turley, chuyên gia của OpenAI, tiết lộ các tính năng như tải tập tin, tạo GPT tùy chỉnh và sử dụng giọng nói, hứa hẹn thay đổi cách người dùng tương tác với ChatGPT.
Ghi âm cuộc gọi và cải tiến camera: Những điểm nổi bật trong iOS 18.1 của Apple Vietnet24h - Vào tối 28 tháng 10, Apple phát hành phiên bản iOS 18.1, mang đến tính năng ghi âm cuộc gọi lần đầu tiên cho người dùng iPhone. Cùng với đó là những cải tiến cho camera và giao diện, hứa hẹn sẽ nâng cao trải nghiệm người dùng trên các thiết bị mới.
Orion sắp ra mắt: OpenAI mở ra chương mới cho trí tuệ nhân tạo Vietnet24h - Với việc ra mắt mô hình AI mới mang tên Orion vào tháng 12/2024, OpenAI đang tạo ra những bước tiến mạnh mẽ trong lĩnh vực công nghệ. Orion được kỳ vọng sẽ có sức mạnh vượt trội gấp 100 lần GPT-4, đánh dấu một cột mốc quan trọng trong hành trình phát triển trí tuệ nhân tạo tổng quát.
Chỉnh sửa ảnh thông minh với Microsoft Paint nhờ AI Vietnet24h - Microsoft Paint không ngừng cải tiến với sự ra mắt của Generative Fill và Generative Erase. Hai tính năng mới này giúp người dùng dễ dàng thêm hoặc xóa các chi tiết trong ảnh, mang lại trải nghiệm chỉnh sửa ảnh phong phú và trực quan hơn bao giờ hết.
Bên trong nhà máy sản xuất chip hoàn toàn tự động của LG Innotek: Robot, AI và không bụi Vietnet24h - LG Innotek đã mở cửa "Dream Factory" tiên tiến của mình tại Gumi, tỉnh Gyeongsang Bắc, lần đầu tiên cho giới truyền thông địa phương, thể hiện động thái đầy tham vọng của công ty nhằm định vị mình là một công ty lớn trong thị trường chất nền bán dẫn thế hệ tiếp theo.
Nvidia cho biết họ tuân thủ luật xuất khẩu của Hoa Kỳ một ngày sau khi ngừng bán chip AI cho Trung Quốc Vietnet24h - Nvidia cho biết hôm thứ Tư rằng họ tuân thủ theo chỉ đạo của chính phủ Hoa Kỳ về nơi họ có thể bán chip AI của mình "theo đúng nghĩa đen".
Điện thoại thông minh, màn hình máy tính và linh kiện điện tử được miễn thuế quan mới nhất của Trump Vietnet24h - Theo thông báo của Cơ quan Hải quan và Bảo vệ Biên giới Hoa Kỳ được đăng vào cuối ngày thứ Sáu (11/4), các thiết bị điện tử nhập khẩu vào Hoa Kỳ sẽ được miễn thuế quan có đi có lại của Tổng thống Donald Trump.
Các nhà phân tích cảnh báo Apple sẽ không còn phao cứu sinh khi cuộc chiến thương mại Mỹ - Trung ngày càng leo thang Vietnet24h - Apple đang phụ thuộc quá nhiều vào Trung Quốc, nơi chứng kiến ​​mức thuế quan tiếp tục tăng lên tới mức kỷ lục là 145%.
Ông Trump tạm thời hạ thuế quan đối ứng với Việt Nam và các nước khác xuống 10% trong thời gian tạm dừng 90 ngày Vietnet24h - Tổng thống Hoa Kỳ Donald Trump hôm thứ Tư đã hạ thuế quan "có đi có lại" đối với Việt Nam và các đối tác thương mại khác xuống còn 10 phần trăm trong cái mà ông gọi là tạm dừng kéo dài trong 90 ngày, trong khi tăng thuế đối với Trung Quốc lên 125 phần trăm sau động thái trả đũa của Trung Quốc.
Intel bước vào giai đoạn rủi ro khi tiến hành sản xuất chip quy trình 18A Vietnet24h - Ông Kevin O’Buckley, phó chủ tịch cấp cao của Foundry Services, cho biết tại hội nghị Intel Vision 2025 ngày 1/4 vừa qua rằng Intel đã bước vào sản xuất rủi ro trên quy trình 18A.
Meta phát hành mô hình AI mới Llama 4 Vietnet24h - Meta Platforms đã phát hành phiên bản mới nhất của mô hình ngôn ngữ lớn (LLM) Llama vào thứ Bảy, được gọi là Llama 4 Scout và Llama 4 Maverick.
Cerebras Systems, Ranovus giành được hợp đồng quân sự trị giá 45 triệu đô la của Hoa Kỳ để đẩy nhanh kết nối chip Vietnet24h - Cerebras Systems, một công ty chip AI có trụ sở tại Thung lũng Silicon và công ty khởi nghiệp chip Canada Ranovus cho biết hôm thứ Ba (1/4) rằng, họ đã được quân đội Hoa Kỳ trao hợp đồng trị giá 45 triệu đô la để tăng tốc kết nối giữa các chip điện toán.
iOS 19 lộ diện tại WWDC 2025: Bản cập nhật quan trọng nhất của iPhone Vietnet24h - WWDC 2025 sẽ là nơi Apple chính thức công bố iOS 19 – phiên bản hứa hẹn sẽ thay đổi cách người dùng tương tác với iPhone, với thiết kế trong suốt và tinh tế hơn bao giờ hết.
Alibaba ra mắt mô hình AI nguồn mở mới cho 'các tác nhân AI tiết kiệm chi phí' Vietnet24h - Công ty cho biết “Qwen2.5-Omni-7B” mới là một mô hình đa phương thức có thể xử lý văn bản, hình ảnh, âm thanh và video, đồng thời tạo ra văn bản thời gian thực và phản hồi giọng nói tự nhiên.
Công nghệ cấy ghép não được FDA chấp thuận cho Precision Neuroscience Vietnet24h - Precision Neuroscience thông báo rằng một thành phần cốt lõi của hệ thống cấy ghép não đã được Cục Quản lý Thực phẩm và Dược phẩm Hoa Kỳ chấp thuận.
Từ ghi hình kép đến UX sáng tạo: iPhone 17 Pro có thể mở ra chương mới trong thiết kế trải nghiệm Vietnet24h - Không chỉ là tính năng mới, ghi hình kép trên iPhone 17 Pro là phép thử đầu tiên cho cách Apple xây dựng trải nghiệm người dùng kiểu mới – nơi cảm xúc, phản ứng và câu chuyện của người quay trở thành trung tâm của mọi khung hình.
Kim loại lỏng: Apple đang thử nghiệm cho iPhone gập, bền hơn titan 2,5 lần Vietnet24h - Công nghệ bản lề kim loại lỏng có thể giúp iPhone gập không chỉ bền hơn mà còn có thiết kế sang trọng hơn. Liệu đây có phải là bước tiến lớn trong công nghệ smartphone gập?
Apple áp dụng kim loại lỏng cho iPhone gập, mở ra kỷ nguyên mới Vietnet24h - Apple được cho là sẽ sử dụng kim loại lỏng để chế tạo bản lề cho iPhone gập, giúp tăng độ bền và hạn chế nếp gấp màn hình. Công nghệ này có thể tạo ra bước đột phá trên thị trường smartphone gập.
Amazon sẽ mang công nghệ quét lòng bàn tay đến các cơ sở y tế NYU Langone Vietnet24h - Bệnh nhân của NYU Langone Health sẽ có thể đăng ký lịch hẹn bằng Amazon One, công nghệ quét lòng bàn tay của công ty.
Lenovo hé lộ máy tính xách tay màn hình gập chạy bằng năng lượng mặt trời trong khái niệm mới nhất Vietnet24h - Lenovo đã tiết lộ khái niệm Lenovo ThinkBook ‘flip’, một chiếc máy tính xách tay có màn hình có thể gập lại. Khi mở hoàn toàn, toàn màn hình có kích thước 18 inch.
Meta công bố kính thông minh nghiên cứu thử nghiệm Aria Gen 2 Vietnet24h - Meta đã tiết lộ phiên bản mới nhất của loại kính thử nghiệm nhằm hỗ trợ nghiên cứu về trí tuệ nhân tạo, robot và nhận thức của máy móc.
Smartphone gập ba: Samsung chạm đỉnh công nghệ, người dùng chạm đáy túi tiền Vietnet24h - Với tham vọng thay đổi cách người dùng trải nghiệm thiết bị di động, Samsung sắp ra mắt điện thoại gập ba. Dù mang thiết kế tiên phong, giá bán lên đến 2.800 USD sẽ là rào cản lớn để sản phẩm đến tay người dùng đại chúng.
Samsung Display sẽ ra mắt màn hình gập 18,1 inch tại CES Vietnet24h - Samsung Display cho biết hôm Chủ Nhật rằng họ sẽ ra mắt màn hình OLED có thể gập 18,1 inch đầu tiên trên thế giới tại CES 2025, dự kiến ​​sẽ khai mạc vào thứ Ba (7/1) tại Las Vegas.
Khí quyển của TRAPPIST-1: một phát hiện thú vị về sự tồn tại sự sống ngoài trái đất Vietnet24h - TRAPPIST-1b, hành tinh cách Trái đất 40 năm ánh sáng, đã gây bất ngờ khi các nhà khoa học phát hiện rằng nó có khí quyển dày đặc và một lớp sương mù đặc biệt, mở ra triển vọng mới trong nghiên cứu sự sống ngoài hành tinh.