Tiêu dùng
AI mới của Microsoft có khả năng giả giọng của con người chỉ trong 3 giây
Mộc Đức - Thứ Tư, 18/01/2023 10:00 SA
Vietnet24h - Công cụ AI sao chép giọng nói của Microsoft, được gọi là Vall-E, có thể bắt chước chính xác giọng nói của con người, chỉ với 3 giây nghe thử.

Công cụ AI sao chép giọng nói của Microsoft, được gọi là Vall-E. AI này được đào tạo 60.000 giờ phân tích các giọng nói từ hơn 7.000 diễn giả, gấp 100 lần so với các hệ thống hiện có.

Ars Technica báo cáo rằng Vall-E xây dựng trên một công nghệ có tên là EnCodec mà Meta đã công bố vào tháng 10 năm 2022. Nó hoạt động bằng cách phân tích giọng nói của một người, chia nhỏ thông tin thành các thành phần và sử dụng quá trình máy học để tổng hợp âm thanh của giọng nói nếu người đó đang nói. Ngay cả sau khi chỉ nghe một đoạn mẫu dài 3 giây, Vall-E có thể tái tạo âm sắc và giai điệu cảm xúc của người nói như thật.

Kết quả thử nghiệm cho thấy Vall-E vượt trội đáng kể so với hệ thống TTS zero-shot tiên tiến nhất [AI tái tạo giọng nói mà nó chưa từng nghe thấy] về độ truyền cảm từ giọng nói và độ tương đồng của người nói. Ngoài ra, VALL-E có thể hiểu và bắt chước cảm xúc của người nói và môi trường âm thanh của dấu nhắc âm thanh trong quá trình tổng hợp.

Bạn có thể nghe các ví dụ về cách tạo lại giọng nói của Vall-E trên GitHub. Các nhà nghiên cứu của Microsoft tin rằng Vall-E có thể được sử dụng như một công cụ chuyển văn bản thành giọng nói, một cách chỉnh sửa lời nói và một hệ thống tạo âm thanh bằng cách kết hợp nó với các AI thế hệ mới khác như GPT-3.

Microsoft đã chia sẻ một bộ sưu tập phong phú các mẫu do VALL-E tạo ra để bạn có thể tự mình nghe thấy khả năng mô phỏng giọng nói có khả năng như thế nào, nhưng kết quả hiện tại là một túi hỗn hợp. Đôi khi, công cụ này gặp sự cố khi tạo lại các dấu, kể cả những dấu tinh tế từ các mẫu nguồn mà người nói phát ra âm thanh Ailen và khả năng thay đổi cảm xúc của một cụm từ nhất định đôi khi gây cười. Nhưng thông thường, các mẫu do VALL-E tạo ra có âm thanh tự nhiên, ấm áp và hầu như không thể phân biệt được với loa gốc trong ba clip nguồn thứ hai.

Ở dạng hiện tại, được đào tạo trên Libri-light, VALL-E bị giới hạn trong việc mô phỏng giọng nói bằng tiếng Anh và mặc dù hiệu suất vẫn chưa hoàn hảo, nhưng chắc chắn nó sẽ cải thiện khi bộ dữ liệu mẫu được mở rộng hơn nữa. Tuy nhiên, việc cải thiện VALL-E sẽ tùy thuộc vào các nhà nghiên cứu của Microsoft vì nhóm không phát hành mã nguồn của công cụ. Trong một bài báo nghiên cứu được phát hành gần đây trình bày chi tiết về sự phát triển của VALL-E, những người tạo ra nó hoàn toàn hiểu những rủi ro mà nó gây ra:

“ Vì VALL-E có thể tổng hợp giọng nói để duy trì danh tính của người nói nên nó có thể tiềm ẩn rủi ro khi sử dụng sai, chẳng hạn như nhận dạng giọng nói giả mạo hoặc mạo danh một người nói cụ thể. Để giảm thiểu những rủi ro như vậy, có thể xây dựng mô hình phát hiện để phân biệt xem clip âm thanh có được tổng hợp bởi VALL-E hay không. Chúng tôi cũng sẽ áp dụng các Nguyên tắc Trí tuệ nhân tạo của Microsoft vào thực tiễn khi tiếp tục phát triển các mô hình”, theo Microsoft.

Samsung và Naver hợp tác phát triển chip AI Vietnet24h - Thứ Ba tuần này, Samsung Electronics cho biết, công ty sẽ hợp tác với gã khổng lồ internet Naver của Hàn Quốc để phát triển các giải pháp bán dẫn thế hệ tiếp theo cho các hệ thống trí tuệ nhân tạo tiên tiến.
Tin khác cùng chuyên mục
Tin đọc nhiều
Gemini cách mạng hóa Android Auto: Giới thiệu trợ lý AI thông minh hơn, đàm thoại tốt hơn cho việc lái xe rảnh tay hiệu quả Vietnet24h - Gemini, một AI đàm thoại mới, được thiết lập để nâng cao trải nghiệm Android Auto bằng cách cải thiện khả năng ra lệnh bằng giọng nói.
Đánh giá Grok 4.1 – Phiên bản mới nhất từ xAI Vietnet24h - Grok 4.1 là bản cập nhật lớn cho Grok 4 (ra mắt hồi tháng 7/2025), được xAI (công ty của Elon Musk) công bố chính thức vào ngày 17/11/2025.
Công ty khởi nghiệp AI Hyprnote tìm cách định nghĩa lại việc ghi chú trong doanh nghiệp Vietnet24h - Hyprnote, một công ty khởi nghiệp có trụ sở tại Seoul do CEO Jung Ji-heon và Giám đốc Công nghệ Lee Yoo-jong sáng lập, đang tìm cách cung cấp một lựa chọn cho các công ty ghi chú và quản lý thông tin một cách an toàn.
Google “lột xác” Fitbit: Giao diện Material 3 siêu biểu cảm, AI Coach chính thức ra mắt người dùng Premium Vietnet24h - Thiết kế lại này kết hợp phong cách Material 3 Expressive (M3E) của Google vào ứng dụng Android, cùng với một số điều chỉnh điều hướng.
LG Uplus ra mắt trợ lý cuộc gọi ixi-O AI được hỗ trợ bởi Google Vietnet24h - LG Uplus, một trong ba công ty viễn thông lớn của Hàn Quốc, đã ra mắt ixi-O, trợ lý cuộc gọi AI thời gian thực được nâng cấp, được hỗ trợ bởi mô hình ngôn ngữ lớn mới nhất của Google Cloud, vào thứ Năm (13/11).
Màn hình gập tiếp theo của Samsung: Ba cách Vietnet24h - Ra mắt tại hội nghị thượng đỉnh APEC ở Gyeongju, điện thoại gập ba của Samsung báo hiệu chương tiếp theo trong đổi mới màn hình gập.
Cách mạng hóa hành trình rèn luyện sức khỏe của bạn với Huấn luyện viên sức khỏe cá nhân tiên tiến được hỗ trợ bởi AI của Fitbit Vietnet24h - Fitbit ra mắt bản xem trước công khai của Huấn luyện viên Sức khỏe Cá nhân chạy bằng Gemini.
Samsung, Google, Qualcomm hợp tác để cạnh tranh với Apple trong cuộc đua XR Vietnet24h - Hôm thứ Tư tuần này (22/10), Samsung Electronics đã ra mắt Dự án Moohan, chiếc kính thực tế mở rộng được mong đợi từ lâu, đánh dấu bước tiến táo bạo của hãng vào cuộc đua công nghệ nhập vai đầy rủi ro mà Vision Pro của Apple đang thống trị.
Lần đầu tiên OpenAI “đánh thẳng” vào Google Chrome: trình duyệt AI mới và cơn sóng đầu tư toàn cầu Vietnet24h - OpenAI vừa chính thức phát hành trình duyệt web trên nền tảng trí tuệ nhân tạo mang tên ChatGPT Atlas — một bước đi rõ ràng nhằm thách thức vị thế thống trị của Google Chrome trong thị trường trình duyệt.
Honda Motor Co., Ltd. tung sản phẩm cắt cỏ “phi người lái” tại Mỹ – bước đột phá trong thiết bị cảnh quan chuyên nghiệp Vietnet24h - Hãng Honda vừa công bố sẽ ra mắt toàn cầu dòng máy cắt cỏ ngồi lái sử dụng pin mang tên ProZision tại triển lãm Equip Exposition 2025 diễn ra từ 21‑24/10/2025 tại Louisville, Kentucky (Mỹ).
Đánh giá iPhone Air: Thiết kế siêu mỏng có đáng để đánh đổi không? Vietnet24h - Apple lần đầu tiên trình làng iPhone Air với thiết kế siêu mỏng chỉ 5,6 mm — điểm nhấn lớn về mặt thẩm mỹ và cảm giác cầm. Tuy nhiên, mức độ mỏng này đi kèm với một số “hy sinh” đáng kể so với dòng Pro của hãng.
EVA Air cấm ký gửi tai nghe Bluetooth Vietnet24h - Theo hãng hàng không, các thiết bị điện tử như tai nghe Bluetooth phải được để trong hành lý xách tay.
Oppo Find X9 Pro: Siêu phẩm “điên rồ” nhất 2025, pin 7.500 mAh, camera 200 MP, giá gần 42 triệu đồng Vietnet24h - Siêu phẩm Trung Quốc này mang đến pin 7.500 mAh trong thân máy mỏng 8 mm, màn hình sáng 3.600 nits, camera tele 200 MP cùng hiệu năng “khủng” từ chip MediaTek Dimensity 9500.
Đánh giá iPad Pro 13 inch (M5): Siêu mạnh, siêu thừa, siêu đắt! Vietnet24h - Apple lại tiếp tục “đốt tiền” vào chip khủng cho thiết bị bị… kìm hãm bởi hệ điều hành. iPad Pro 13 inch (M5) chính là minh chứng rõ nhất.
Google Pixel Watch 4: Kẻ Thay Đổi Cuộc Chơi Trong Ngành Đồng Hồ Thông Minh Vietnet24h - Google Pixel Watch 4 đánh dấu bước đột phá, khắc phục các hạn chế của các phiên bản trước, mang đến trải nghiệm đồng hồ thông minh hoàn chỉnh.
Apple Watch Series 11 Đối Đầu Series 10: Bước Tiến Nhỏ, Hiệu Quả Lớn Vietnet24h - Apple tiếp tục giữ đúng nhịp độ ra mắt thường niên với Apple Watch Series 11, đã trình làng vào tháng 9 vừa qua.
Samsung Galaxy S24 Plus Giảm Sốc 10 Triệu: Flagship Cao Cấp Giá Tầm Trung, Dùng Tốt Đến 2031! Vietnet24h - Hà Nội, ngày 3/10/2025 – Với mức giá giảm từ 27 triệu xuống chỉ còn 16 triệu đồng, Samsung Galaxy S24 Plus đang gây bão tại Việt Nam, trở thành “ngôi sao” flagship giá rẻ, ngang ngửa máy tầm trung nhưng hiệu năng và trải nghiệm vượt xa.
Phong trào toàn cầu bảo vệ trẻ em trực tuyến thúc đẩy làn sóng công nghệ an toàn AI Vietnet24h - Một phong trào toàn cầu nhằm bảo vệ trẻ em an toàn trực tuyến đang ngày càng phát triển, với các quy định mới nghiêm ngặt được đưa ra tại Vương quốc Anh và Hoa Kỳ.
Galaxy Watch8 series trở thành trợ thủ công nghệ mới của các tín đồ biohacking Vietnet24h - Biohacking hay ‘hack tuổi sinh học’ là việc biến dữ liệu sức khỏe cá nhân thành những thay đổi nhỏ mỗi ngày nhằm cải thiện thể chất và kéo dài tuổi thọ.
Apple cân nhắc khôi phục dịch vụ sửa chữa iPad tại cửa hàng vào cuối năm Vietnet24h - Apple đang đẩy mạnh dịch vụ khách hàng bằng cách có thể thay đổi cách thức xử lý việc sửa chữa iPad tại Hoa Kỳ.