Tiêu dùng
AI mới của Microsoft có khả năng giả giọng của con người chỉ trong 3 giây
Mộc Đức - Thứ Tư, 18/01/2023 10:00 SA
Vietnet24h - Công cụ AI sao chép giọng nói của Microsoft, được gọi là Vall-E, có thể bắt chước chính xác giọng nói của con người, chỉ với 3 giây nghe thử.

Công cụ AI sao chép giọng nói của Microsoft, được gọi là Vall-E. AI này được đào tạo 60.000 giờ phân tích các giọng nói từ hơn 7.000 diễn giả, gấp 100 lần so với các hệ thống hiện có.

Ars Technica báo cáo rằng Vall-E xây dựng trên một công nghệ có tên là EnCodec mà Meta đã công bố vào tháng 10 năm 2022. Nó hoạt động bằng cách phân tích giọng nói của một người, chia nhỏ thông tin thành các thành phần và sử dụng quá trình máy học để tổng hợp âm thanh của giọng nói nếu người đó đang nói. Ngay cả sau khi chỉ nghe một đoạn mẫu dài 3 giây, Vall-E có thể tái tạo âm sắc và giai điệu cảm xúc của người nói như thật.

Kết quả thử nghiệm cho thấy Vall-E vượt trội đáng kể so với hệ thống TTS zero-shot tiên tiến nhất [AI tái tạo giọng nói mà nó chưa từng nghe thấy] về độ truyền cảm từ giọng nói và độ tương đồng của người nói. Ngoài ra, VALL-E có thể hiểu và bắt chước cảm xúc của người nói và môi trường âm thanh của dấu nhắc âm thanh trong quá trình tổng hợp.

Bạn có thể nghe các ví dụ về cách tạo lại giọng nói của Vall-E trên GitHub. Các nhà nghiên cứu của Microsoft tin rằng Vall-E có thể được sử dụng như một công cụ chuyển văn bản thành giọng nói, một cách chỉnh sửa lời nói và một hệ thống tạo âm thanh bằng cách kết hợp nó với các AI thế hệ mới khác như GPT-3.

Microsoft đã chia sẻ một bộ sưu tập phong phú các mẫu do VALL-E tạo ra để bạn có thể tự mình nghe thấy khả năng mô phỏng giọng nói có khả năng như thế nào, nhưng kết quả hiện tại là một túi hỗn hợp. Đôi khi, công cụ này gặp sự cố khi tạo lại các dấu, kể cả những dấu tinh tế từ các mẫu nguồn mà người nói phát ra âm thanh Ailen và khả năng thay đổi cảm xúc của một cụm từ nhất định đôi khi gây cười. Nhưng thông thường, các mẫu do VALL-E tạo ra có âm thanh tự nhiên, ấm áp và hầu như không thể phân biệt được với loa gốc trong ba clip nguồn thứ hai.

Ở dạng hiện tại, được đào tạo trên Libri-light, VALL-E bị giới hạn trong việc mô phỏng giọng nói bằng tiếng Anh và mặc dù hiệu suất vẫn chưa hoàn hảo, nhưng chắc chắn nó sẽ cải thiện khi bộ dữ liệu mẫu được mở rộng hơn nữa. Tuy nhiên, việc cải thiện VALL-E sẽ tùy thuộc vào các nhà nghiên cứu của Microsoft vì nhóm không phát hành mã nguồn của công cụ. Trong một bài báo nghiên cứu được phát hành gần đây trình bày chi tiết về sự phát triển của VALL-E, những người tạo ra nó hoàn toàn hiểu những rủi ro mà nó gây ra:

“ Vì VALL-E có thể tổng hợp giọng nói để duy trì danh tính của người nói nên nó có thể tiềm ẩn rủi ro khi sử dụng sai, chẳng hạn như nhận dạng giọng nói giả mạo hoặc mạo danh một người nói cụ thể. Để giảm thiểu những rủi ro như vậy, có thể xây dựng mô hình phát hiện để phân biệt xem clip âm thanh có được tổng hợp bởi VALL-E hay không. Chúng tôi cũng sẽ áp dụng các Nguyên tắc Trí tuệ nhân tạo của Microsoft vào thực tiễn khi tiếp tục phát triển các mô hình”, theo Microsoft.

Samsung và Naver hợp tác phát triển chip AI Vietnet24h - Thứ Ba tuần này, Samsung Electronics cho biết, công ty sẽ hợp tác với gã khổng lồ internet Naver của Hàn Quốc để phát triển các giải pháp bán dẫn thế hệ tiếp theo cho các hệ thống trí tuệ nhân tạo tiên tiến.
Tin khác cùng chuyên mục
Tin đọc nhiều
Flagship sắp ra mắt của Oppo hứa hẹn sẽ mang đến những nâng cấp thú vị cho những người đam mê công nghệ Vietnet24h - Chiếc flagship mới nhất của Oppo, Find X8 Ultra, đã đặt ra một chuẩn mực cao cho điện thoại thông minh, kết hợp thiết kế 9mm thanh mảnh với một loạt camera ấn tượng và pin lâu dài.
Dyson ra mắt máy hút bụi mỏng nhất thế giới tại Seoul Vietnet24h - Dyson đã ra mắt máy hút bụi không dây mỏng nhất của mình -- PencilVac, có tay cầm đường kính 38 mm và nặng 1,8 kg -- tại sự kiện ra mắt ở Seoul vào thứ Hai.
Khám phá những tính năng mới thú vị trên ứng dụng di động dành cho Android và iPhone của NotebookLM Vietnet24h - NotebookLM đang bước vào lĩnh vực di động và sắp thay đổi cách người dùng tương tác với ghi chú khi đang di chuyển.
Xreal ra mắt chiếc kính đầu tiên chạy hệ điều hành Android XR của Google để cạnh tranh với Meta và Apple Vietnet24h - Xreal đã ra mắt Dự án Aura, được gọi là kính thực tế mở rộng chạy hệ điều hành XR của Google.
Oppo ra mắt điện thoại siêu pin cùng chip mới Vietnet24h - Oppo vừa mới ra mắt sản phẩm mới nhất của mình trong phân khúc điện thoại siêu pin, Reno 14 và Reno 14 Pro, cả hai đều mang lại độ tin cậy và hiệu suất mà không quá đắt so với phiên bản tiền nhiệm Reno 13.
Huawei ra mắt máy tính bảng có thể gập lại giá 3.300 đô la chạy HarmonyOS, phô diễn sức mạnh phần cứng Vietnet24h - Huawei đã ra mắt một chiếc máy tính xách tay màn hình gập và một chiếc MateBook Pro truyền thống hơn với công nghệ do chính mình sản xuất sau khi bị Microsoft và Intel cắt đứt quan hệ
Samsung ra mắt S25 Edge mỏng khi Apple được cho là đang chuẩn bị iPhone ‘Air’ Vietnet24h - Samsung đã ra mắt Galaxy S25 Edge, một thiết bị chỉ mỏng 5,8 mm và nặng 163 gram, trở thành một trong những điện thoại thông minh mỏng nhất trên thị trường.
FBI sắp “nhìn xuyên tường” bằng radar: Khoa học viễn tưởng hay cơn ác mộng quyền riêng tư? Vietnet24h - Một thiết bị nhỏ bằng hộp cơm có thể giúp FBI xác định người đứng sau tường bằng sóng vô tuyến. Công nghệ như mơ đang trở thành hiện thực – nhưng liệu nó sẽ phục vụ an ninh hay mở đầu kỷ nguyên giám sát công dân không giới hạn?
Dòng điện thoại thông minh OnePlus Nord Series mới thú vị sắp ra mắt Vietnet24h - OnePlus đang chuẩn bị giới thiệu sản phẩm mới nhất của mình điện thoại thông minh đội hình, Nord CE5, trong những tuần tới. Ban đầu dự kiến ​​phát hành vào tháng XNUMX, ngày ra mắt dự kiến ​​đã chuyển sang tháng XNUMX, gây phấn khích cho những người đam mê công nghệ và người tiêu dùng.
Samsung sẽ ra mắt Galaxy S25 Edge mỏng hơn vào ngày 13 tháng 5 Vietnet24h - Samsung Electronics sẽ ra mắt phiên bản mỏng hơn của điện thoại thông minh Galaxy, Galaxy S25 Edge, vào thứ Ba (13/5), mở đường cho cuộc chiến với Apple về kiểu dáng mỏng hơn.
iPad Air M512 2GB giảm giá hấp dẫn nhất từ ​​trước đến nay trên Amazon Vietnet24h - Bạn có thể mua cùng một mẫu iPad Air M2 512GB 11 inch với mức giảm giá đáng kinh ngạc là 33%, tương đương với khoản tiết kiệm hào phóng là 350 đô la.
Apple cân nhắc cho phép người dùng iPhone lựa chọn các giải pháp thay thế Siri làm trợ lý mặc định Vietnet24h - Khi Siri gặp khó khăn trong việc đưa ra câu trả lời thỏa đáng, bạn vẫn có thể gọi Google để được trợ giúp.
iPhone 13 được cập nhật tính năng nhắn tin vệ tinh qua iOS 18.5 Vietnet24h - Với iOS 18.5, Apple chính thức cho phép iPhone 13 nhắn tin vệ tinh thông qua một số nhà mạng, mở rộng khả năng kết nối không phụ thuộc hạ tầng truyền thống. Tuy nhiên, tính năng này không áp dụng với mọi thiết bị và nhà mạng, cho thấy chiến lược triển khai có chọn lọc của hãng.
Lưỡi dao deepfake: Màn lừa đảo triệu đô và cú bắt tay chết người giữa AI và tội phạm mạng Vietnet24h - Từ một vài dòng quảng cáo có khuôn mặt người nổi tiếng, đến màn giả giọng cảnh sát lừa nạn nhân nộp thuế để nhận lại khoản tiền "đã mất" – tất cả đều do AI dựng nên. Hơn 20 triệu USD đã bị đánh cắp. Kẻ thủ ác không dùng súng, mà dùng thuật toán.
Giải pháp đánh bay hôi miệng, lấy lại tự tin trong giao tiếp Vietnet24h - Hôi miệng không chỉ là vấn đề về sức khỏe mà còn ảnh hưởng trực tiếp đến sự tự tin và giao tiếp hàng ngày, đặc biệt đối với những người làm công việc tư vấn, kinh doanh hoặc giao tiếp trực tiếp. Mùi hôi khó chịu từ miệng khiến bạn gặp khó khăn trong các cuộc trò chuyện, khiến người khác ngại ngùng và ảnh hưởng đến mối quan hệ xã hội. Tuy nhiên, đừng lo lắng, vì những giải pháp đơn giản có thể giúp bạn khắc phục tình trạng này một cách hiệu quả.
Giới chức Mỹ kiện TikTok vì lo ngại thanh thiếu niên bị ảnh hưởng bởi nghiện mạng xã hội Vietnet24h - TikTok, nền tảng video nổi tiếng, đã trở thành mục tiêu của các vụ kiện từ 13 bang ở Mỹ, với cáo buộc gây nghiện cho thanh thiếu niên và làm tổn hại đến sức khỏe tâm thần của họ thông qua những thuật toán được thiết kế để tăng thời gian sử dụng.
Cách sử dụng ChatGPT vừa ra mắt chế độ giọng nói nâng cao cho trò chuyện âm thanh của OpenAI Vietnet24h - Mặc dù công cụ này phản hồi nhanh và có thể nói bằng nhiều giọng khác nhau, nhưng bạn có thể gặp phải giới hạn về tốc độ nếu sử dụng nhiều lần trong một ngày.
Đánh giá sơ bộ về iPhone 16 mới ra lò của Apple Vietnet24h - iPhone 16 Pro Max có thời lượng pin tốt hơn và camera tuyệt vời, nhưng Apple Intelligence vẫn chưa xuất hiện
Apple Watch Series 10 chỉ có những nâng cấp nhỏ, nhưng điểm cộng lớn là sạc nhanh hơn Vietnet24h - Apple Watch là một phần của bộ phận Thiết bị đeo, Gia đình và Phụ kiện của công ty, đã báo cáo doanh thu 8,1 tỷ đô la trong quý tài chính thứ ba, giảm 2% so với một năm trước.
Apple phát hành iOS 18 cho iPhone, nhưng không bao gồm Apple Intelligence Vietnet24h - Đây là bản cập nhật iPhone lớn nhất trong năm của Apple, nhưng bản cập nhật này không bao gồm Apple Intelligence, hệ thống AI sắp ra mắt của công ty.