Tiêu dùng
AI mới của Microsoft có khả năng giả giọng của con người chỉ trong 3 giây
Mộc Đức - Thứ Tư, 18/01/2023 10:00 SA
Vietnet24h - Công cụ AI sao chép giọng nói của Microsoft, được gọi là Vall-E, có thể bắt chước chính xác giọng nói của con người, chỉ với 3 giây nghe thử.

Công cụ AI sao chép giọng nói của Microsoft, được gọi là Vall-E. AI này được đào tạo 60.000 giờ phân tích các giọng nói từ hơn 7.000 diễn giả, gấp 100 lần so với các hệ thống hiện có.

Ars Technica báo cáo rằng Vall-E xây dựng trên một công nghệ có tên là EnCodec mà Meta đã công bố vào tháng 10 năm 2022. Nó hoạt động bằng cách phân tích giọng nói của một người, chia nhỏ thông tin thành các thành phần và sử dụng quá trình máy học để tổng hợp âm thanh của giọng nói nếu người đó đang nói. Ngay cả sau khi chỉ nghe một đoạn mẫu dài 3 giây, Vall-E có thể tái tạo âm sắc và giai điệu cảm xúc của người nói như thật.

Kết quả thử nghiệm cho thấy Vall-E vượt trội đáng kể so với hệ thống TTS zero-shot tiên tiến nhất [AI tái tạo giọng nói mà nó chưa từng nghe thấy] về độ truyền cảm từ giọng nói và độ tương đồng của người nói. Ngoài ra, VALL-E có thể hiểu và bắt chước cảm xúc của người nói và môi trường âm thanh của dấu nhắc âm thanh trong quá trình tổng hợp.

Bạn có thể nghe các ví dụ về cách tạo lại giọng nói của Vall-E trên GitHub. Các nhà nghiên cứu của Microsoft tin rằng Vall-E có thể được sử dụng như một công cụ chuyển văn bản thành giọng nói, một cách chỉnh sửa lời nói và một hệ thống tạo âm thanh bằng cách kết hợp nó với các AI thế hệ mới khác như GPT-3.

Microsoft đã chia sẻ một bộ sưu tập phong phú các mẫu do VALL-E tạo ra để bạn có thể tự mình nghe thấy khả năng mô phỏng giọng nói có khả năng như thế nào, nhưng kết quả hiện tại là một túi hỗn hợp. Đôi khi, công cụ này gặp sự cố khi tạo lại các dấu, kể cả những dấu tinh tế từ các mẫu nguồn mà người nói phát ra âm thanh Ailen và khả năng thay đổi cảm xúc của một cụm từ nhất định đôi khi gây cười. Nhưng thông thường, các mẫu do VALL-E tạo ra có âm thanh tự nhiên, ấm áp và hầu như không thể phân biệt được với loa gốc trong ba clip nguồn thứ hai.

Ở dạng hiện tại, được đào tạo trên Libri-light, VALL-E bị giới hạn trong việc mô phỏng giọng nói bằng tiếng Anh và mặc dù hiệu suất vẫn chưa hoàn hảo, nhưng chắc chắn nó sẽ cải thiện khi bộ dữ liệu mẫu được mở rộng hơn nữa. Tuy nhiên, việc cải thiện VALL-E sẽ tùy thuộc vào các nhà nghiên cứu của Microsoft vì nhóm không phát hành mã nguồn của công cụ. Trong một bài báo nghiên cứu được phát hành gần đây trình bày chi tiết về sự phát triển của VALL-E, những người tạo ra nó hoàn toàn hiểu những rủi ro mà nó gây ra:

“ Vì VALL-E có thể tổng hợp giọng nói để duy trì danh tính của người nói nên nó có thể tiềm ẩn rủi ro khi sử dụng sai, chẳng hạn như nhận dạng giọng nói giả mạo hoặc mạo danh một người nói cụ thể. Để giảm thiểu những rủi ro như vậy, có thể xây dựng mô hình phát hiện để phân biệt xem clip âm thanh có được tổng hợp bởi VALL-E hay không. Chúng tôi cũng sẽ áp dụng các Nguyên tắc Trí tuệ nhân tạo của Microsoft vào thực tiễn khi tiếp tục phát triển các mô hình”, theo Microsoft.

Samsung và Naver hợp tác phát triển chip AI Vietnet24h - Thứ Ba tuần này, Samsung Electronics cho biết, công ty sẽ hợp tác với gã khổng lồ internet Naver của Hàn Quốc để phát triển các giải pháp bán dẫn thế hệ tiếp theo cho các hệ thống trí tuệ nhân tạo tiên tiến.
Tin khác cùng chuyên mục
Tin đọc nhiều
Robot hình người vượt qua vận động viên tại bán marathon Bắc Kinh, cho thấy bước tiến nhanh của AI vật lý Vietnet24h - Các robot hình người đã gây bất ngờ khi chạy nhanh hơn con người tại giải bán marathon tổ chức ở Bắc Kinh ngày 19/4, đánh dấu bước tiến đáng kể của công nghệ robot Trung Quốc trong lĩnh vực trí tuệ nhân tạo và robot hình người.
Coway giới thiệu máy lọc không khí đa chức năng với khả năng loại bỏ vi nhựa Vietnet24h - Hôm thứ Sáu, Coway cho biết máy lọc không khí kiêm hút ẩm kết hợp của hãng, Noble Dehumidifying Air Purifier, mang lại hiệu suất lọc tiên tiến, bao gồm cả việc loại bỏ bụi siêu mịn và vi nhựa trong không khí.
Cơ hội đăng ký trải nghiệm Galaxy S26 series trong 26 ngày từ Samsung Việt Nam Vietnet24h - Samsung Việt Nam chính thức giới thiệu chương trình “Galaxy S26 Series – 26 ngày đặc quyền trải nghiệm”, như một cách tiếp cận mới giúp người dùng dễ dàng hơn trong hành trình lựa chọn smartphone.
Màn ra mắt điện thoại gập của Apple đã khơi mào cuộc đua điện thoại màn hình rộng Vietnet24h - Samsung và Huawei đẩy mạnh thiết kế kiểu máy tính bảng trong khi Apple hướng đến màn hình không nếp gấp.
Apple Watch Series 11 giảm giá 100 đô la cho hầu hết các mẫu vỏ nhôm trên Amazon Vietnet24h - Apple tiếp tục giảm mạnh giá Apple Watch Series 11, đưa mẫu smartwatch mới nhất của hãng về mức giá hấp dẫn nhất từ trước đến nay, tạo cơ hội tốt cho người dùng đang cân nhắc nâng cấp thiết bị đeo thông minh.
Điện thoại gập ba TriFold của Samsung trở lại thị trường Mỹ Vietnet24h - Samsung Electronics đã nối lại việc bán mẫu điện thoại siêu cao cấp Galaxy Z TriFold tại Mỹ, điều mà giới chuyên gia trong ngành cho rằng có thể là đợt phát hành cuối cùng của thiết bị thử nghiệm này.
Samsung chia sẻ tầm nhìn ứng dụng AI kiến tạo nền tảng sống khỏe Vietnet24h - Tầm nhìn ứng dụng AI trong chăm sóc sức khỏe nhằm xóa bỏ khoảng cách giữa nhận thức và hành động của người Việt được Samsung nhấn mạnh tại buổi livestream trao đổi "Bác sĩ số kiến tạo tương lai - Khỏe mạnh cùng AI".
Samsung Galaxy Watch Ultra 2 dự kiến ​​ra mắt với hai phiên bản: Khám phá sự khác biệt giữa phiên bản 4G và 5G Vietnet24h - Trong bối cảnh thị trường thiết bị đeo thông minh đang bước vào giai đoạn cạnh tranh mới, Samsung được cho là đang chuẩn bị ra mắt Galaxy Watch Ultra 2 với hai phiên bản kết nối 4G và 5G.
Samsung AI TV 2026 đã có mặt tại Việt Nam Vietnet24h - Dải sản phẩm AI TV 2026 tiên phong công nghệ đỉnh cao. tích hợp Vision AI Companion trên toàn bộ danh mục, từ Micro RGB, OLED, Neo QLED, Mini LED đến Crystal UHD
Meta ra mắt hai mẫu kính thông minh Ray-Ban giá 499 đô la Vietnet24h - Hôm thứ Ba, Meta Platforms đã ra mắt hai mẫu kính thông minh Ray-Ban có độ mới, mở rộng phạm vi sản phẩm của mình trong lĩnh vực vốn đã trở thành một trong số ít những thành công đột phá trong cuộc đua thiết bị công nghệ trí tuệ nhân tạo.
Phán quyết về AI khiến các luật sư Mỹ đưa ra cảnh báo: Các cuộc trò chuyện của bạn có thể bị sử dụng chống lại bạn Vietnet24h - Một phán quyết mới của tòa án liên bang Mỹ đang làm dấy lên những cảnh báo mạnh mẽ từ giới luật sư và chuyên gia pháp lý: các cuộc trò chuyện với chatbot AI như ChatGPT hay Claude có thể trở thành bằng chứng trước tòa, thay vì được bảo mật như người dùng vẫn nghĩ.
Tổng hợp các mẫu laptop HP tốt nhất 2026 Vietnet24h - Trong bối cảnh thị trường laptop ngày càng phân hóa theo nhu cầu sử dụng, các bài đánh giá từ ZDNet cho thấy HP đang theo đuổi một chiến lược sản phẩm rất rõ ràng: không cố tạo ra một thiết bị “toàn năng”, mà tập trung xây dựng từng dòng máy tối ưu cho từng nhóm người dùng cụ thể.
OnePlus pin 9.000mAh: “Quái vật pin” mới khiến người dùng không thể quay lại smartphone truyền thống Vietnet24h - Thị trường smartphone đang chứng kiến một xu hướng mới: cuộc đua dung lượng pin.
Hướng dẫn chuẩn bị điện thoại trước khi đổi máy: Tránh mất dữ liệu và bảo vệ quyền riêng tư Vietnet24h - Khi nâng cấp lên điện thoại mới, nhiều người lựa chọn bán lại hoặc đổi máy cũ để tiết kiệm chi phí.
Google Photos nâng cấp tìm kiếm AI: Người dùng chủ động chọn tốc độ hay trí tuệ Vietnet24h - Google vừa triển khai bản nâng cấp mới cho ứng dụng Google Photos, bổ sung tính năng chuyển đổi (toggle) cho phép người dùng lựa chọn giữa chế độ tìm kiếm nhanh truyền thống và tìm kiếm thông minh dựa trên AI.
Camera trong nhà: Tiện ích công nghệ hay “lỗ hổng” bảo mật mới của kỷ nguyên số? Vietnet24h - Làn sóng lắp đặt camera trong nhà đang bùng nổ cùng với sự phổ biến của hệ sinh thái nhà thông minh.
Anh siết chặt thời gian sử dụng màn hình của trẻ em: Xu hướng quản lý công nghệ đang bước sang giai đoạn mới Vietnet24h - Chính phủ Anh vừa ban hành hướng dẫn quốc gia nhằm hạn chế thời gian sử dụng thiết bị số của trẻ nhỏ.
Galaxy Z TriFold: Một tuyệt phẩm kỹ thuật – nhưng chưa phải sản phẩm cho thị trường Vietnet24h - TriFold là một bước nhảy vọt về kỹ thuật. Với thiết kế hai bản lề và màn hình gập ba, thiết bị mở ra kích thước gần 10 inch – tiệm cận tablet – nhưng vẫn có thể bỏ túi.
Samsung tổ chức sự kiện ra mắt Galaxy S26 series tại Việt Nam Vietnet24h - Công ty Điện tử Samsung Việt Nam chính thức tổ chức sự kiện ra mắt thế hệ Galaxy S26 series mới tại Thiskyhall Sala (TP.HCM). Sự kiện thu hút sự tham gia của hơn 600 khách mời, bao gồm các đối tác, đại diện cơ quan báo chí – truyền thông, chuyên gia công nghệ và nhà sáng tạo nội dung.
OnePlus 15R – LỰA CHỌN HÀI HOÀ GIỮA MÀN HÌNH 165 HZ VÀ PIN LỚN Vietnet24h - Điểm nổi bật nhất của 15R là màn hình 165 Hz và viên pin dung lượng lớn, hai yếu tố tạo nên trải nghiệm hàng ngày vượt trội so với số đông smartphone cùng phân khúc.