Tiêu dùng
AI mới của Microsoft có khả năng giả giọng của con người chỉ trong 3 giây
Mộc Đức - Thứ Tư, 18/01/2023 10:00 SA
Vietnet24h - Công cụ AI sao chép giọng nói của Microsoft, được gọi là Vall-E, có thể bắt chước chính xác giọng nói của con người, chỉ với 3 giây nghe thử.

Công cụ AI sao chép giọng nói của Microsoft, được gọi là Vall-E. AI này được đào tạo 60.000 giờ phân tích các giọng nói từ hơn 7.000 diễn giả, gấp 100 lần so với các hệ thống hiện có.

Ars Technica báo cáo rằng Vall-E xây dựng trên một công nghệ có tên là EnCodec mà Meta đã công bố vào tháng 10 năm 2022. Nó hoạt động bằng cách phân tích giọng nói của một người, chia nhỏ thông tin thành các thành phần và sử dụng quá trình máy học để tổng hợp âm thanh của giọng nói nếu người đó đang nói. Ngay cả sau khi chỉ nghe một đoạn mẫu dài 3 giây, Vall-E có thể tái tạo âm sắc và giai điệu cảm xúc của người nói như thật.

Kết quả thử nghiệm cho thấy Vall-E vượt trội đáng kể so với hệ thống TTS zero-shot tiên tiến nhất [AI tái tạo giọng nói mà nó chưa từng nghe thấy] về độ truyền cảm từ giọng nói và độ tương đồng của người nói. Ngoài ra, VALL-E có thể hiểu và bắt chước cảm xúc của người nói và môi trường âm thanh của dấu nhắc âm thanh trong quá trình tổng hợp.

Bạn có thể nghe các ví dụ về cách tạo lại giọng nói của Vall-E trên GitHub. Các nhà nghiên cứu của Microsoft tin rằng Vall-E có thể được sử dụng như một công cụ chuyển văn bản thành giọng nói, một cách chỉnh sửa lời nói và một hệ thống tạo âm thanh bằng cách kết hợp nó với các AI thế hệ mới khác như GPT-3.

Microsoft đã chia sẻ một bộ sưu tập phong phú các mẫu do VALL-E tạo ra để bạn có thể tự mình nghe thấy khả năng mô phỏng giọng nói có khả năng như thế nào, nhưng kết quả hiện tại là một túi hỗn hợp. Đôi khi, công cụ này gặp sự cố khi tạo lại các dấu, kể cả những dấu tinh tế từ các mẫu nguồn mà người nói phát ra âm thanh Ailen và khả năng thay đổi cảm xúc của một cụm từ nhất định đôi khi gây cười. Nhưng thông thường, các mẫu do VALL-E tạo ra có âm thanh tự nhiên, ấm áp và hầu như không thể phân biệt được với loa gốc trong ba clip nguồn thứ hai.

Ở dạng hiện tại, được đào tạo trên Libri-light, VALL-E bị giới hạn trong việc mô phỏng giọng nói bằng tiếng Anh và mặc dù hiệu suất vẫn chưa hoàn hảo, nhưng chắc chắn nó sẽ cải thiện khi bộ dữ liệu mẫu được mở rộng hơn nữa. Tuy nhiên, việc cải thiện VALL-E sẽ tùy thuộc vào các nhà nghiên cứu của Microsoft vì nhóm không phát hành mã nguồn của công cụ. Trong một bài báo nghiên cứu được phát hành gần đây trình bày chi tiết về sự phát triển của VALL-E, những người tạo ra nó hoàn toàn hiểu những rủi ro mà nó gây ra:

“ Vì VALL-E có thể tổng hợp giọng nói để duy trì danh tính của người nói nên nó có thể tiềm ẩn rủi ro khi sử dụng sai, chẳng hạn như nhận dạng giọng nói giả mạo hoặc mạo danh một người nói cụ thể. Để giảm thiểu những rủi ro như vậy, có thể xây dựng mô hình phát hiện để phân biệt xem clip âm thanh có được tổng hợp bởi VALL-E hay không. Chúng tôi cũng sẽ áp dụng các Nguyên tắc Trí tuệ nhân tạo của Microsoft vào thực tiễn khi tiếp tục phát triển các mô hình”, theo Microsoft.

Samsung và Naver hợp tác phát triển chip AI Vietnet24h - Thứ Ba tuần này, Samsung Electronics cho biết, công ty sẽ hợp tác với gã khổng lồ internet Naver của Hàn Quốc để phát triển các giải pháp bán dẫn thế hệ tiếp theo cho các hệ thống trí tuệ nhân tạo tiên tiến.
Tin khác cùng chuyên mục
Tin đọc nhiều
Apple sắp mở rộng việc sử dụng modem 5G độc quyền cho dòng iPhone 18: Một sự thay đổi mang tính chiến lược Vietnet24h - Apple được biết đến là hãng sử dụng modem 5G C1X độc quyền của mình trên iPhone Air, trong khi vẫn sử dụng modem Qualcomm cho iPhone 17 và iPhone 17 Pro.
Amazon ra mắt máy bán thuốc theo toa tại các phòng khám One Medical ở Los Angeles Vietnet24h - Amazon đang triển khai các ki-ốt bán thuốc theo toa tại một số phòng khám One Medical ở khu vực Los Angeles.
Ứng dụng tạo video chỉ dành cho người được mời Sora của OpenAI đứng đầu App Store của Apple Vietnet24h - Ứng dụng Sora mới của OpenAI đã giành được vị trí hàng đầu trên App Store của Apple, vượt qua Google Gemini và ChatGPT của chính công ty khởi nghiệp này.
OpenAI’s Sora 2: Thách thức giới hạn an toàn và kiểm duyệt với những video chân thực đến kinh ngạc Vietnet24h - OpenAI, gã khổng lồ công nghệ đứng sau ChatGPT, vừa khuấy động làng công nghệ toàn cầu với ứng dụng video TikTok-style mới, được cung cấp bởi mô hình AI tiên tiến Sora 2. Với khả năng tạo ra những video dài hơn, chân thực hơn và sống động đến mức khó tin.
Amazon Ra Mắt Loạt Thiết Bị Echo Mới Tích Hợp Alexa+ Giá Chỉ Từ 99 USD Vietnet24h - Amazon chính thức giới thiệu dòng thiết bị loa thông minh và màn hình kích hoạt bằng giọng nói mới, được nâng cấp với trợ lý ảo Alexa+ tích hợp trí tuệ nhân tạo thế hệ mới (Generative AI).
iPhone 18 Sẵn Sàng Định Nghĩa Lại Kết Nối Vietnet24h - Apple Tăng Tốc: Dòng iPhone 18 Sẽ Sử Dụng Modem 5G Tự Phát Triển Trong Bước Chuyển Hướng Chiến Lược
iPhone 17 Pro: bằng 6 ngày lương ở Singapore, nhưng tương đương 60 ngày lương ở Hà Nội! Vietnet24h - Một nghiên cứu mới đây cho thấy, trong khi một người lao động trung bình ở Singapore chỉ cần 6 ngày làm việc để sở hữu iPhone 17 Pro, thì tại Hà Nội, con số này lên tới 60 ngày – một khoảng cách kinh tế đáng kinh ngạc!
“Lên đỉnh” công nghệ cùng kính thông minh Meta Ray-Ban Display 799 USD – Tương lai AI đeo trên mắt! Vietnet24h - Meta vừa “thả bom” tại Connect 2025 với kính thông minh Meta Ray-Ban Display giá 799 USD, khiến cả thế giới công nghệ “đứng ngồi không yên”.
Google bổ sung Gemini vào Chrome cho tất cả người dùng nhằm thúc đẩy tìm kiếm bằng AI Vietnet24h - Google thông báo rằng Gemini AI dành cho Chrome sẽ được cung cấp rộng rãi cho người dùng tại Hoa Kỳ.
Apple, Google và Meta đang cố gắng hoàn thiện một tiện ích khoa học viễn tưởng: Máy dịch đa năng Vietnet24h - Apple, Google và Meta đang tận dụng những tiến bộ trong AI để mang các tính năng dịch thuật mới vào các thiết bị phần cứng mới nhất của họ.
Apple Watch Series 11 Đối Đầu Series 10: Bước Tiến Nhỏ, Hiệu Quả Lớn Vietnet24h - Apple tiếp tục giữ đúng nhịp độ ra mắt thường niên với Apple Watch Series 11, đã trình làng vào tháng 9 vừa qua.
Samsung Galaxy S24 Plus Giảm Sốc 10 Triệu: Flagship Cao Cấp Giá Tầm Trung, Dùng Tốt Đến 2031! Vietnet24h - Hà Nội, ngày 3/10/2025 – Với mức giá giảm từ 27 triệu xuống chỉ còn 16 triệu đồng, Samsung Galaxy S24 Plus đang gây bão tại Việt Nam, trở thành “ngôi sao” flagship giá rẻ, ngang ngửa máy tầm trung nhưng hiệu năng và trải nghiệm vượt xa.
Phong trào toàn cầu bảo vệ trẻ em trực tuyến thúc đẩy làn sóng công nghệ an toàn AI Vietnet24h - Một phong trào toàn cầu nhằm bảo vệ trẻ em an toàn trực tuyến đang ngày càng phát triển, với các quy định mới nghiêm ngặt được đưa ra tại Vương quốc Anh và Hoa Kỳ.
Galaxy Watch8 series trở thành trợ thủ công nghệ mới của các tín đồ biohacking Vietnet24h - Biohacking hay ‘hack tuổi sinh học’ là việc biến dữ liệu sức khỏe cá nhân thành những thay đổi nhỏ mỗi ngày nhằm cải thiện thể chất và kéo dài tuổi thọ.
Apple cân nhắc khôi phục dịch vụ sửa chữa iPad tại cửa hàng vào cuối năm Vietnet24h - Apple đang đẩy mạnh dịch vụ khách hàng bằng cách có thể thay đổi cách thức xử lý việc sửa chữa iPad tại Hoa Kỳ.
Galaxy S26 Pro tỏa sáng trong báo cáo về pin, trong khi S26 Edge gặp nhiều thách thức Vietnet24h - Tin đồn đang lan truyền rằng dòng Galaxy S26 sắp ra mắt có thể sẽ giới thiệu bốn mẫu máy ấn tượng, phá vỡ bộ ba truyền thống.
Chỉ vài phút sau động đất, thế giới đã biết liệu có sóng thần hay không Vietnet24h - Cảnh báo sớm sóng thần từng là điều xa xỉ, nhưng ngày nay các nhà khoa học chỉ mất vài phút để phát tín hiệu giúp hàng triệu người có cơ hội sống sót – nhờ hệ thống quan sát đáy biển, dữ liệu vệ tinh và AI.
Mua Motorola Razr+ (2025) tại Amazon ngay hôm nay với mức giá tốt thứ hai từ trước đến nay Vietnet24h - Motorola Razr+ (2025) đã trở thành tâm điểm chú ý trong thế giới điện thoại thông minh, và hiện tại, nó đang thu hút sự chú ý vì tất cả những lý do chính đáng.
Hơn 1.200 website giả mạo bị phát hiện mỗi ngày: Tội phạm mạng chuyển hướng tấn công người dùng cá nhân Vietnet24h - Số liệu từ các tổ chức giám sát an ninh mạng cho thấy, mỗi ngày có hàng nghìn tên miền giả mạo được đăng ký nhằm mục đích đánh cắp dữ liệu người dùng. Đáng chú ý, các website “nhái” thường sao chép hoàn toàn giao diện của ngân hàng, dịch vụ đặt phòng, trang mua sắm, khiến nạn nhân dễ dàng sập bẫy nếu không kiểm tra kỹ.
iPad Air M512 2GB giảm giá hấp dẫn nhất từ ​​trước đến nay trên Amazon Vietnet24h - Bạn có thể mua cùng một mẫu iPad Air M2 512GB 11 inch với mức giảm giá đáng kinh ngạc là 33%, tương đương với khoản tiết kiệm hào phóng là 350 đô la.