Tư vấn tiêu dùng
AI mới của Microsoft có khả năng giả giọng của con người chỉ trong 3 giây
Mộc Đức - Thứ Tư, 18/01/2023 10:00 SA
Vietnet24h - Công cụ AI sao chép giọng nói của Microsoft, được gọi là Vall-E, có thể bắt chước chính xác giọng nói của con người, chỉ với 3 giây nghe thử.

Công cụ AI sao chép giọng nói của Microsoft, được gọi là Vall-E. AI này được đào tạo 60.000 giờ phân tích các giọng nói từ hơn 7.000 diễn giả, gấp 100 lần so với các hệ thống hiện có.

Ars Technica báo cáo rằng Vall-E xây dựng trên một công nghệ có tên là EnCodec mà Meta đã công bố vào tháng 10 năm 2022. Nó hoạt động bằng cách phân tích giọng nói của một người, chia nhỏ thông tin thành các thành phần và sử dụng quá trình máy học để tổng hợp âm thanh của giọng nói nếu người đó đang nói. Ngay cả sau khi chỉ nghe một đoạn mẫu dài 3 giây, Vall-E có thể tái tạo âm sắc và giai điệu cảm xúc của người nói như thật.

Kết quả thử nghiệm cho thấy Vall-E vượt trội đáng kể so với hệ thống TTS zero-shot tiên tiến nhất [AI tái tạo giọng nói mà nó chưa từng nghe thấy] về độ truyền cảm từ giọng nói và độ tương đồng của người nói. Ngoài ra, VALL-E có thể hiểu và bắt chước cảm xúc của người nói và môi trường âm thanh của dấu nhắc âm thanh trong quá trình tổng hợp.

Bạn có thể nghe các ví dụ về cách tạo lại giọng nói của Vall-E trên GitHub. Các nhà nghiên cứu của Microsoft tin rằng Vall-E có thể được sử dụng như một công cụ chuyển văn bản thành giọng nói, một cách chỉnh sửa lời nói và một hệ thống tạo âm thanh bằng cách kết hợp nó với các AI thế hệ mới khác như GPT-3.

Microsoft đã chia sẻ một bộ sưu tập phong phú các mẫu do VALL-E tạo ra để bạn có thể tự mình nghe thấy khả năng mô phỏng giọng nói có khả năng như thế nào, nhưng kết quả hiện tại là một túi hỗn hợp. Đôi khi, công cụ này gặp sự cố khi tạo lại các dấu, kể cả những dấu tinh tế từ các mẫu nguồn mà người nói phát ra âm thanh Ailen và khả năng thay đổi cảm xúc của một cụm từ nhất định đôi khi gây cười. Nhưng thông thường, các mẫu do VALL-E tạo ra có âm thanh tự nhiên, ấm áp và hầu như không thể phân biệt được với loa gốc trong ba clip nguồn thứ hai.

Ở dạng hiện tại, được đào tạo trên Libri-light, VALL-E bị giới hạn trong việc mô phỏng giọng nói bằng tiếng Anh và mặc dù hiệu suất vẫn chưa hoàn hảo, nhưng chắc chắn nó sẽ cải thiện khi bộ dữ liệu mẫu được mở rộng hơn nữa. Tuy nhiên, việc cải thiện VALL-E sẽ tùy thuộc vào các nhà nghiên cứu của Microsoft vì nhóm không phát hành mã nguồn của công cụ. Trong một bài báo nghiên cứu được phát hành gần đây trình bày chi tiết về sự phát triển của VALL-E, những người tạo ra nó hoàn toàn hiểu những rủi ro mà nó gây ra:

“ Vì VALL-E có thể tổng hợp giọng nói để duy trì danh tính của người nói nên nó có thể tiềm ẩn rủi ro khi sử dụng sai, chẳng hạn như nhận dạng giọng nói giả mạo hoặc mạo danh một người nói cụ thể. Để giảm thiểu những rủi ro như vậy, có thể xây dựng mô hình phát hiện để phân biệt xem clip âm thanh có được tổng hợp bởi VALL-E hay không. Chúng tôi cũng sẽ áp dụng các Nguyên tắc Trí tuệ nhân tạo của Microsoft vào thực tiễn khi tiếp tục phát triển các mô hình”, theo Microsoft.

Samsung và Naver hợp tác phát triển chip AI Vietnet24h - Thứ Ba tuần này, Samsung Electronics cho biết, công ty sẽ hợp tác với gã khổng lồ internet Naver của Hàn Quốc để phát triển các giải pháp bán dẫn thế hệ tiếp theo cho các hệ thống trí tuệ nhân tạo tiên tiến.
Tin khác cùng chuyên mục
Tin đọc nhiều
Realme C75: Điện thoại "nồi đồng cối đá" chuẩn IP69 sắp có mặt tại Việt Nam Vietnet24h - Với khả năng chịu tia nước áp lực cao và chống bụi tuyệt đối, realme C75 trở thành thiết bị phổ thông đầu tiên tại Việt Nam đạt chuẩn IP69. Đây là bước tiến đột phá của realme trong việc nâng tầm trải nghiệm người dùng.
Sức hút mới của Steam Deck: Phiên bản OLED màu trắng giới hạn chính thức lên kệ Vietnet24h - Valve vừa công bố Steam Deck OLED phiên bản màu trắng với số lượng có hạn, mở ra một cơ hội mới cho những tín đồ của thiết bị chơi game cầm tay. Với vẻ ngoài thanh lịch và những tính năng đỉnh cao, đây là lựa chọn lý tưởng cho những game thủ muốn sở hữu một chiếc máy chơi game độc đáo và mạnh mẽ.
Galaxy S25 Ultra ra mắt với thiết kế mới, chip mạnh và bản cập nhật Android liền mạch Vietnet24h - Hình ảnh kết xuất Galaxy S25 Ultra tiết lộ diện mạo mới và sức mạnh phần cứng đầy ấn tượng. Thiết kế mềm mại, RAM lên đến 16GB cùng phần mềm liền mạch giúp dòng Galaxy S25 nổi bật hơn trên thị trường smartphone cao cấp.
Huawei Watch D2: chăm sóc sức khỏe toàn diện với công nghệ đo huyết áp 24/7 Vietnet24h - Với công nghệ đo huyết áp động ABPM, Huawei Watch D2 không chỉ cung cấp chỉ số sức khỏe liên tục mà còn giúp người dùng nhận diện và quản lý huyết áp một cách chủ động. Thiết bị mang lại một giải pháp sức khỏe tối ưu, hiện đại cho người dùng toàn cầu.
Tổng quan về sản phẩm thiên nhiên CAREOX - mang cuộc sống xanh đến mọi nhà Vietnet24h - Chuyển đổi từ sản phẩm hóa chất sang sinh học đang trở thành xu hướng tất yếu để bảo vệ sức khỏe và môi trường. CAREOX, sản phẩm tẩy rửa sinh học của German Oekotec Việt Nam, là minh chứng cho nỗ lực này với khả năng làm sạch, diệt khuẩn và khử mùi toàn diện nhờ công nghệ điện phân tách màng tiên tiến từ CHLB Đức.
Khám phá Macbook Pro 2024 với chip M4 max: cỗ máy đồ họa siêu việt Vietnet24h - Apple đã chính thức trình làng chip M4 Max, sản phẩm mạnh nhất trong dòng vi xử lý M4, đi kèm với MacBook Pro 2024. Sự kết hợp này mang đến hiệu suất đồ họa ấn tượng, hứa hẹn sẽ đáp ứng mọi nhu cầu của người dùng sáng tạo.
Trải nghiệm sáng tạo không giới hạn với Galaxy Z Flip6 Vietnet24h - Được trang bị nhiều tính năng độc đáo và công nghệ tiên tiến, Galaxy Z Flip6 mang đến cho người trẻ những công cụ cần thiết để ghi lại khoảnh khắc sống động và thể hiện phong cách cá nhân một cách ấn tượng.
Apple phát hành bản xem trước mới của AI, bao gồm tích hợp ChatGPT Vietnet24h - Hôm thứ Tư, Apple đã phát hành phiên bản beta của một loạt tính năng Apple Intelligence, bao gồm cả tính năng tích hợp ChatGPT được mong đợi từ lâu.
Microsoft cải thiện Windows Update: thời gian cài đặt giảm tới 45% Vietnet24h - Windows 11 24H2 được tinh chỉnh để tối ưu hóa hiệu suất hệ thống, với quy trình cập nhật nhanh và ít tiêu tốn tài nguyên hơn, ngay cả trên các thiết bị cũ kỹ.
SKT ra mắt phiên bản PC của dịch vụ AI cung cấp quyền truy cập vào nhiều mô hình ngôn ngữ lớn (LLM) Vietnet24h - Phiên bản PC cho phép người dùng so sánh các LLM khác nhau mà không cần quá trình sao chép và dán, đồng thời cung cấp khả năng chuyển đổi giữa các mô hình liền mạch để phản ánh bối cảnh của các cuộc đối thoại với mô hình trước đó khi tiếp tục các cuộc trò chuyện với một mô hình khác.
Giải pháp đánh bay hôi miệng, lấy lại tự tin trong giao tiếp Vietnet24h - Hôi miệng không chỉ là vấn đề về sức khỏe mà còn ảnh hưởng trực tiếp đến sự tự tin và giao tiếp hàng ngày, đặc biệt đối với những người làm công việc tư vấn, kinh doanh hoặc giao tiếp trực tiếp. Mùi hôi khó chịu từ miệng khiến bạn gặp khó khăn trong các cuộc trò chuyện, khiến người khác ngại ngùng và ảnh hưởng đến mối quan hệ xã hội. Tuy nhiên, đừng lo lắng, vì những giải pháp đơn giản có thể giúp bạn khắc phục tình trạng này một cách hiệu quả.
Giới chức Mỹ kiện TikTok vì lo ngại thanh thiếu niên bị ảnh hưởng bởi nghiện mạng xã hội Vietnet24h - TikTok, nền tảng video nổi tiếng, đã trở thành mục tiêu của các vụ kiện từ 13 bang ở Mỹ, với cáo buộc gây nghiện cho thanh thiếu niên và làm tổn hại đến sức khỏe tâm thần của họ thông qua những thuật toán được thiết kế để tăng thời gian sử dụng.
Cách sử dụng ChatGPT vừa ra mắt chế độ giọng nói nâng cao cho trò chuyện âm thanh của OpenAI Vietnet24h - Mặc dù công cụ này phản hồi nhanh và có thể nói bằng nhiều giọng khác nhau, nhưng bạn có thể gặp phải giới hạn về tốc độ nếu sử dụng nhiều lần trong một ngày.
Đánh giá sơ bộ về iPhone 16 mới ra lò của Apple Vietnet24h - iPhone 16 Pro Max có thời lượng pin tốt hơn và camera tuyệt vời, nhưng Apple Intelligence vẫn chưa xuất hiện
Apple Watch Series 10 chỉ có những nâng cấp nhỏ, nhưng điểm cộng lớn là sạc nhanh hơn Vietnet24h - Apple Watch là một phần của bộ phận Thiết bị đeo, Gia đình và Phụ kiện của công ty, đã báo cáo doanh thu 8,1 tỷ đô la trong quý tài chính thứ ba, giảm 2% so với một năm trước.
Apple phát hành iOS 18 cho iPhone, nhưng không bao gồm Apple Intelligence Vietnet24h - Đây là bản cập nhật iPhone lớn nhất trong năm của Apple, nhưng bản cập nhật này không bao gồm Apple Intelligence, hệ thống AI sắp ra mắt của công ty.
Lý do nhiều người không ưa chuộng smartphone màn hình gập Vietnet24h - Đã nhiều năm trôi qua kể từ khi smartphone màn hình gập lần đầu tiên xuất hiện, nhưng doanh số của thiết bị đầy sáng tạo này vẫn chưa thể cạnh tranh với smartphone thông thường. Dù các thương hiệu liên tục thúc đẩy sản phẩm ra thị trường, nhiều người vẫn tỏ ra không mặn mà với dòng sản phẩm này. Vậy điều gì khiến smartphone màn hình gập chưa thể đạt được thành công mong đợi? Hãy cùng khám phá.
Liệu trẻ em có nên dùng Apple Watch? Vietnet24h - Apple vừa tung ra một trang web tiếp thị mới, quảng cáo Apple Watch như một cách để các bậc cha mẹ giữ liên lạc với con cái của họ.
Đánh giá sơ bộ về máy tính bảng Surface Pro của Microsoft Vietnet24h - Phiên bản thứ 11 của máy tính bảng chuyển đổi Surface Pro của Microsoft dựa trên chip Qualcomm tiêu thụ năng lượng, dẫn đến thời lượng pin hơn 8 giờ trong các thử nghiệm ban đầu.
Cảnh báo: mạng lưới lừa đảo với chiêu thức giả mạo ứng dụng bảo hiểm xã hội số Vietnet24h - Trong bối cảnh không gian mạng ngày càng trở nên phức tạp, Cục An toàn thông tin, thuộc Bộ Thông tin và Truyền thông, đã phát đi một thông báo khẩn cấp về những chiêu trò lừa đảo mới mẻ, đặc biệt là các vụ việc giả mạo ứng dụng VssID - Bảo hiểm xã hội số.