Tiêu dùng
AI mới của Microsoft có khả năng giả giọng của con người chỉ trong 3 giây
Mộc Đức - Thứ Tư, 18/01/2023 10:00 SA
Vietnet24h - Công cụ AI sao chép giọng nói của Microsoft, được gọi là Vall-E, có thể bắt chước chính xác giọng nói của con người, chỉ với 3 giây nghe thử.

Công cụ AI sao chép giọng nói của Microsoft, được gọi là Vall-E. AI này được đào tạo 60.000 giờ phân tích các giọng nói từ hơn 7.000 diễn giả, gấp 100 lần so với các hệ thống hiện có.

Ars Technica báo cáo rằng Vall-E xây dựng trên một công nghệ có tên là EnCodec mà Meta đã công bố vào tháng 10 năm 2022. Nó hoạt động bằng cách phân tích giọng nói của một người, chia nhỏ thông tin thành các thành phần và sử dụng quá trình máy học để tổng hợp âm thanh của giọng nói nếu người đó đang nói. Ngay cả sau khi chỉ nghe một đoạn mẫu dài 3 giây, Vall-E có thể tái tạo âm sắc và giai điệu cảm xúc của người nói như thật.

Kết quả thử nghiệm cho thấy Vall-E vượt trội đáng kể so với hệ thống TTS zero-shot tiên tiến nhất [AI tái tạo giọng nói mà nó chưa từng nghe thấy] về độ truyền cảm từ giọng nói và độ tương đồng của người nói. Ngoài ra, VALL-E có thể hiểu và bắt chước cảm xúc của người nói và môi trường âm thanh của dấu nhắc âm thanh trong quá trình tổng hợp.

Bạn có thể nghe các ví dụ về cách tạo lại giọng nói của Vall-E trên GitHub. Các nhà nghiên cứu của Microsoft tin rằng Vall-E có thể được sử dụng như một công cụ chuyển văn bản thành giọng nói, một cách chỉnh sửa lời nói và một hệ thống tạo âm thanh bằng cách kết hợp nó với các AI thế hệ mới khác như GPT-3.

Microsoft đã chia sẻ một bộ sưu tập phong phú các mẫu do VALL-E tạo ra để bạn có thể tự mình nghe thấy khả năng mô phỏng giọng nói có khả năng như thế nào, nhưng kết quả hiện tại là một túi hỗn hợp. Đôi khi, công cụ này gặp sự cố khi tạo lại các dấu, kể cả những dấu tinh tế từ các mẫu nguồn mà người nói phát ra âm thanh Ailen và khả năng thay đổi cảm xúc của một cụm từ nhất định đôi khi gây cười. Nhưng thông thường, các mẫu do VALL-E tạo ra có âm thanh tự nhiên, ấm áp và hầu như không thể phân biệt được với loa gốc trong ba clip nguồn thứ hai.

Ở dạng hiện tại, được đào tạo trên Libri-light, VALL-E bị giới hạn trong việc mô phỏng giọng nói bằng tiếng Anh và mặc dù hiệu suất vẫn chưa hoàn hảo, nhưng chắc chắn nó sẽ cải thiện khi bộ dữ liệu mẫu được mở rộng hơn nữa. Tuy nhiên, việc cải thiện VALL-E sẽ tùy thuộc vào các nhà nghiên cứu của Microsoft vì nhóm không phát hành mã nguồn của công cụ. Trong một bài báo nghiên cứu được phát hành gần đây trình bày chi tiết về sự phát triển của VALL-E, những người tạo ra nó hoàn toàn hiểu những rủi ro mà nó gây ra:

“ Vì VALL-E có thể tổng hợp giọng nói để duy trì danh tính của người nói nên nó có thể tiềm ẩn rủi ro khi sử dụng sai, chẳng hạn như nhận dạng giọng nói giả mạo hoặc mạo danh một người nói cụ thể. Để giảm thiểu những rủi ro như vậy, có thể xây dựng mô hình phát hiện để phân biệt xem clip âm thanh có được tổng hợp bởi VALL-E hay không. Chúng tôi cũng sẽ áp dụng các Nguyên tắc Trí tuệ nhân tạo của Microsoft vào thực tiễn khi tiếp tục phát triển các mô hình”, theo Microsoft.

Samsung và Naver hợp tác phát triển chip AI Vietnet24h - Thứ Ba tuần này, Samsung Electronics cho biết, công ty sẽ hợp tác với gã khổng lồ internet Naver của Hàn Quốc để phát triển các giải pháp bán dẫn thế hệ tiếp theo cho các hệ thống trí tuệ nhân tạo tiên tiến.
Tin khác cùng chuyên mục
Tin đọc nhiều
Kiểm soát thời gian sử dụng công nghệ cho trẻ em: Bài học kinh nghiệm từ Pháp Vietnet24h - Một báo cáo chuyên sâu của Pháp đã khám phá các phương pháp hiệu quả nhất để kiểm soát thời gian sử dụng công nghệ của trẻ em, bảo vệ chúng khỏi những tác động tiêu cực tiềm ẩn.
Smart Ring của Apple có thể phát hiện chơi 'oẳn tù tì' Vietnet24h - Thiết bị đeo của Apple nhận bằng sáng chế có thể phân biệt nhiều cử chỉ ngón tay khác nhau.
Samsung ra mắt dải sản phẩm TV AI đỉnh cao 2024 tại Việt Nam Vietnet24h - Dòng sản phẩm 2024 đại diện cho thời đại TV AI thông minh vượt bậc, mang trải nghiệm nghe nhìn vượt chuẩn, an toàn và tiết kiệm điện cho người dùng.
Microsoft cho biết mô hình định giá chatbot bảo mật AI mới cho phép khách hàng 'mua những gì họ cần' Vietnet24h - Microsoft Copilot for Security sẽ có giá 4 USD cho mỗi “đơn vị tính toán bảo mật” khi nó ra mắt vào tháng 4.
iPhone 16 Pro và 16 Pro Max: Sự tiến bộ vượt trội với nút chụp như máy ảnh chuyên nghiệp Vietnet24h - Trong một bước tiến đầy bất ngờ, Apple đã hé lộ thiết kế mới nhất của mình cho chiếc iPhone 16 Pro. Điểm nhấn đáng chú ý nhất chính là nút chụp được thiết kế giống như trên máy ảnh truyền thống.
Liệu Samsung sẽ đưa Galaxy AI vào điện thoại giá rẻ? Vietnet24h - Ngày càng có nhiều dự đoán về việc liệu các mẫu điện thoại thông minh tầm trung có trang bị các tính năng trí tuệ nhân tạo mới nhất của gã khổng lồ công nghệ hay không.
Microsoft giới thiệu chatbot Copilot AI dành cho nhân viên tài chính trên Excel và Outlook Vietnet24h - Microsoft đang tung ra Copilot for Finance, công ty cho biết sẽ có thể thực hiện một số hành động phổ biến dành riêng cho vai trò trong Excel và Outlook.
Samsung giới thiệu smartphone dạng vòng tay tại MWC 2024 Vietnet24h - Samsung vừa chính thức trình làng nguyên mẫu smartphone độc đáo tại triển lãm di động MWC 2024, được đặt tên là Cling Band.
Xiaomi của Trung Quốc ra mắt điện thoại cao cấp thách thức Samsung và ra mắt xe điện tại châu Âu Vietnet24h - Xiaomi đã ra mắt Xiaomi 14 cho thị trường toàn cầu tại Mobile World Congress ở Barcelona, sau khi ra mắt sản phẩm này vào tuần này tại Trung Quốc.
Người Việt Nam đầu tiên sở hữu TV MICRO LED siêu đắt đỏ, trị giá 3,5 tỷ của Samsung Vietnet24h - Mẫu TV cao cấp nhất và đắt đỏ nhất của Samsung, được đánh giá sẽ tái định nghĩa khả năng hiển thị đỉnh cao của một thiết bị nghe nhìn, khẳng định đẳng cấp của chủ nhân sở hữu
Samsung Galaxy M15 5G ra mắt: Pin trâu 6000mAh, hiệu năng mạnh mẽ, giá bình dân Vietnet24h - Samsung vừa giới thiệu mẫu smartphone Galaxy M15 5G với những nâng cấp đáng giá như dung lượng pin lớn 6000mAh, kết nối 5G, hứa hẹn trở thành đối thủ mạnh trong phân khúc giá rẻ.
iPhone 16 Plus: Dung lượng pin giảm nhưng tối ưu năng lượng Vietnet24h - Apple có thể giảm dung lượng pin của iPhone 16 Plus, tuy nhiên những cải tiến về mặt công nghệ sẽ đảm bảo hiệu suất năng lượng hiệu quả.
Đánh giá Apple Vision Pro: Tương lai của điện toán và giải trí (phần 1) Vietnet24h - Apple Vision Pro, có giá khởi điểm 3.500 USD, ra mắt tại Mỹ vào thứ Sáu (2/2/2024). Đây là tiện ích mới quan trọng đầu tiên kể từ khi Apple Watch ra mắt vào tháng 4 năm 2015.
Cảnh báo các chiêu trò lừa đảo dịp Tết 2024 Vietnet24h - Cục An toàn thông tin, Bộ Thông tin và Truyền thông cảnh báo những chiêu trò lừa đảo qua mạng đang ngày càng tinh vi, người dân cần chú ý đề phòng trong dịp Tết cận kề.
Microsoft tố cáo nhóm người Việt tiếp tay lừa đảo Vietnet24h - Nhóm ba người Việt bị cáo buộc tạo và bán hơn 750 triệu tài khoản Microsoft phục vụ lừa đảo, thu về hàng triệu USD bất hợp pháp.
Cách tiết kiệm tiền khi đi du lịch trong kỳ nghỉ bằng cách theo dõi giá chuyến bay với Google Vietnet24h - Google Flights có một tính năng sẽ theo dõi giá vé máy bay cho bạn.
Sử dụng tính năng ẩn này của Google để phát hiện và xóa thông tin cá nhân của bạn trong tìm kiếm Vietnet24h - Google có tính năng thông báo cho bạn khi thông tin cá nhân của bạn được đăng trực tuyến.
iPhone 15 Pro nhẹ hơn, đa năng hơn nhưng thiếu yếu tố đổi mới Vietnet24h - Dòng điện thoại thông minh hàng đầu mới nhất của Apple – iPhone 15, iPhone 15 Plus, iPhone 15 Pro và iPhone 15 Pro Max – đã ra mắt được vài tuần. Dưới đây là những đánh gia sơ bộ từ người dùng Hàn Quốc.
Một số tiện ích thú vị để thêm gia vị cho cuộc trò chuyện nhóm trên iPhone của bạn Vietnet24h - Bạn có thể tạo biểu tượng cảm xúc nhãn dán ảnh để chèn vào iMessages của mình bằng bản cập nhật iPhone iOS 17 mới của Apple.
Netflix ngừng cung cấp dịch vụ miễn phí ở Việt Nam Vietnet24h - Vào tối ngày 2/10, Netflix đã gửi một số email tới người dùng Việt Nam rằng họ sẽ ngừng cung cấp gói miễn phí từ tháng 11/2023. Theo đó, người dùng đang sử dụng gói miễn phí sẽ phải nâng cấp lên gói cao hơn để tiếp tục xem phim trên nền tảng này.