Công nghệ độc lạ
AI mới của Microsoft có khả năng giả giọng của con người chỉ trong 3 giây
Mộc Đức - Thứ Tư, 18/01/2023 10:00 SA
Vietnet24h - Công cụ AI sao chép giọng nói của Microsoft, được gọi là Vall-E, có thể bắt chước chính xác giọng nói của con người, chỉ với 3 giây nghe thử.

Công cụ AI sao chép giọng nói của Microsoft, được gọi là Vall-E. AI này được đào tạo 60.000 giờ phân tích các giọng nói từ hơn 7.000 diễn giả, gấp 100 lần so với các hệ thống hiện có.

Ars Technica báo cáo rằng Vall-E xây dựng trên một công nghệ có tên là EnCodec mà Meta đã công bố vào tháng 10 năm 2022. Nó hoạt động bằng cách phân tích giọng nói của một người, chia nhỏ thông tin thành các thành phần và sử dụng quá trình máy học để tổng hợp âm thanh của giọng nói nếu người đó đang nói. Ngay cả sau khi chỉ nghe một đoạn mẫu dài 3 giây, Vall-E có thể tái tạo âm sắc và giai điệu cảm xúc của người nói như thật.

Kết quả thử nghiệm cho thấy Vall-E vượt trội đáng kể so với hệ thống TTS zero-shot tiên tiến nhất [AI tái tạo giọng nói mà nó chưa từng nghe thấy] về độ truyền cảm từ giọng nói và độ tương đồng của người nói. Ngoài ra, VALL-E có thể hiểu và bắt chước cảm xúc của người nói và môi trường âm thanh của dấu nhắc âm thanh trong quá trình tổng hợp.

Bạn có thể nghe các ví dụ về cách tạo lại giọng nói của Vall-E trên GitHub. Các nhà nghiên cứu của Microsoft tin rằng Vall-E có thể được sử dụng như một công cụ chuyển văn bản thành giọng nói, một cách chỉnh sửa lời nói và một hệ thống tạo âm thanh bằng cách kết hợp nó với các AI thế hệ mới khác như GPT-3.

Microsoft đã chia sẻ một bộ sưu tập phong phú các mẫu do VALL-E tạo ra để bạn có thể tự mình nghe thấy khả năng mô phỏng giọng nói có khả năng như thế nào, nhưng kết quả hiện tại là một túi hỗn hợp. Đôi khi, công cụ này gặp sự cố khi tạo lại các dấu, kể cả những dấu tinh tế từ các mẫu nguồn mà người nói phát ra âm thanh Ailen và khả năng thay đổi cảm xúc của một cụm từ nhất định đôi khi gây cười. Nhưng thông thường, các mẫu do VALL-E tạo ra có âm thanh tự nhiên, ấm áp và hầu như không thể phân biệt được với loa gốc trong ba clip nguồn thứ hai.

Ở dạng hiện tại, được đào tạo trên Libri-light, VALL-E bị giới hạn trong việc mô phỏng giọng nói bằng tiếng Anh và mặc dù hiệu suất vẫn chưa hoàn hảo, nhưng chắc chắn nó sẽ cải thiện khi bộ dữ liệu mẫu được mở rộng hơn nữa. Tuy nhiên, việc cải thiện VALL-E sẽ tùy thuộc vào các nhà nghiên cứu của Microsoft vì nhóm không phát hành mã nguồn của công cụ. Trong một bài báo nghiên cứu được phát hành gần đây trình bày chi tiết về sự phát triển của VALL-E, những người tạo ra nó hoàn toàn hiểu những rủi ro mà nó gây ra:

“ Vì VALL-E có thể tổng hợp giọng nói để duy trì danh tính của người nói nên nó có thể tiềm ẩn rủi ro khi sử dụng sai, chẳng hạn như nhận dạng giọng nói giả mạo hoặc mạo danh một người nói cụ thể. Để giảm thiểu những rủi ro như vậy, có thể xây dựng mô hình phát hiện để phân biệt xem clip âm thanh có được tổng hợp bởi VALL-E hay không. Chúng tôi cũng sẽ áp dụng các Nguyên tắc Trí tuệ nhân tạo của Microsoft vào thực tiễn khi tiếp tục phát triển các mô hình”, theo Microsoft.

Samsung và Naver hợp tác phát triển chip AI Vietnet24h - Thứ Ba tuần này, Samsung Electronics cho biết, công ty sẽ hợp tác với gã khổng lồ internet Naver của Hàn Quốc để phát triển các giải pháp bán dẫn thế hệ tiếp theo cho các hệ thống trí tuệ nhân tạo tiên tiến.
Tin khác cùng chuyên mục
Tin đọc nhiều
Thiết kế siêu mỏng "đòi hỏi" đánh đổi – iPhone 17 Air và bài toán năng lượng Vietnet24h - Việc Apple chuẩn bị trình làng iPhone 17 Air với thiết kế siêu mỏng chỉ 5,5 mm, theo tiết lộ mới nhất từ tài khoản yeux1122 trên Naver, đang tạo ra nhiều kỳ vọng về mặt thẩm mỹ – nhưng cũng đồng thời đặt ra những dấu hỏi lớn về hiệu suất pin và trải nghiệm người dùng trong thực tế.
MediaTek ra mắt bộ xử lý AI cho Chromebook Plus Vietnet24h - MediaTek Inc., nhà thiết kế IC lớn nhất tại Đài Loan, đã giới thiệu bộ xử lý mới -- Kompanio Ultra -- vào thứ Hai, công ty mô tả đây là cột mốc mới nhất trong Chromebook hiệu suất cao, chạy bằng trí tuệ nhân tạo.
Chuẩn GPMI của Trung Quốc: ‘Một dây cáp cho mọi thiết bị’ Vietnet24h - GPMI được thiết kế để tối giản hóa kết nối số bằng cách gộp cả dữ liệu và điện năng vào một sợi cáp duy nhất. Nếu được phổ biến, đây có thể là bước ngoặt định hình lại hệ sinh thái điện tử trong tương lai.
Rò rỉ cách Apple sẽ làm cho màn hình bên trong của iPhone gập trở nên quen thuộc với người dùng iPad Vietnet24h - Chiếc điện thoại có thể gập đầu tiên của Apple dự kiến ​​sẽ được sản xuất hàng loạt vào cuối năm sau và có thể ra mắt vào quý 4 năm 2026 hoặc quý 1 năm 2027.
Alibaba cung cấp miễn phí mô hình tạo video AI trên toàn cầu Vietnet24h - Gã khổng lồ Trung Quốc cho biết họ đang mở mã nguồn bốn mô hình thuộc dòng Wan2.1, phiên bản mới nhất của mô hình AI nền tảng của công ty, có khả năng tạo hình ảnh và video từ dữ liệu đầu vào là văn bản và hình ảnh.
Từ Gmail đến Word, cài đặt quyền riêng tư và AI của bạn đang bước vào một mối quan hệ mới Vietnet24h - Các chương trình như Gmail, Microsoft và Facebook đã tồn tại trong nhiều năm qua đã âm thầm kích hoạt và tích hợp các tính năng AI.
AI trong Gmail, Word: Tiện ích hay mối đe dọa quyền riêng tư? Vietnet24h - AI đang dần xâm nhập vào mọi ngóc ngách của cuộc sống số, từ email đến sổ sách kế toán. Tuy nhiên, sự thiếu rõ ràng trong chính sách bảo mật khiến nhiều chuyên gia cảnh báo về nguy cơ dữ liệu cá nhân bị lạm dụng.
OpenAI bật mí 5 mẹo dùng ChatGPT mà bạn chưa biết Vietnet24h - Nick Turley, chuyên gia của OpenAI, tiết lộ các tính năng như tải tập tin, tạo GPT tùy chỉnh và sử dụng giọng nói, hứa hẹn thay đổi cách người dùng tương tác với ChatGPT.
Ghi âm cuộc gọi và cải tiến camera: Những điểm nổi bật trong iOS 18.1 của Apple Vietnet24h - Vào tối 28 tháng 10, Apple phát hành phiên bản iOS 18.1, mang đến tính năng ghi âm cuộc gọi lần đầu tiên cho người dùng iPhone. Cùng với đó là những cải tiến cho camera và giao diện, hứa hẹn sẽ nâng cao trải nghiệm người dùng trên các thiết bị mới.
Orion sắp ra mắt: OpenAI mở ra chương mới cho trí tuệ nhân tạo Vietnet24h - Với việc ra mắt mô hình AI mới mang tên Orion vào tháng 12/2024, OpenAI đang tạo ra những bước tiến mạnh mẽ trong lĩnh vực công nghệ. Orion được kỳ vọng sẽ có sức mạnh vượt trội gấp 100 lần GPT-4, đánh dấu một cột mốc quan trọng trong hành trình phát triển trí tuệ nhân tạo tổng quát.
Samsung sẽ bổ sung model Edge vào Galaxy S26 vào năm sau Vietnet24h - Samsung đang có kế hoạch bổ sung thêm một mẫu Edge vào dòng điện thoại thông minh Galaxy S26 của mình vào năm tới,
CEO Nvidia công bố sáng kiến ​​xây dựng siêu máy tính AI cho Đài Loan Vietnet24h - CEO Nvidia Huang Jensen công bố sáng kiến xây dựng "siêu máy tính AI khổng lồ đầu tiên" cho Đài Loan vào thứ Hai (19/5).
Samsung Display ra mắt tại Computex, tiết lộ màn hình OLED CNTT thế hệ tiếp theo Vietnet24h - Samsung Display đã công bố vào ngày 20 tháng 5 việc công ty sẽ lần đầu tiên tham gia Computex, triển lãm công nghệ thông tin (CNTT) lớn nhất châu Á được tổ chức tại Đài Loan, giới thiệu một loạt các tấm nền diode phát quang hữu cơ (OLED) hàng đầu trong ngành.
Nvidia công bố công nghệ mới để giữ vị trí trung tâm trong phát triển AI Vietnet24h - Chương trình “NVLink Fusion” mới của Nvidia sẽ cho phép khách hàng và đối tác sử dụng CPU và GPU không phải của Nvidia cùng với các sản phẩm của Nvidia và NVLink.
Nvidia, Cisco, Oracle và OpenAI đang hỗ trợ dự án trung tâm dữ liệu Stargate của UAE Vietnet24h - Các gã khổng lồ công nghệ Hoa Kỳ là Nvidia, Cisco, Oracle và OpenAI đang hỗ trợ trung tâm dữ liệu trí tuệ nhân tạo “UAE Stargate” được công bố trong tuần này.
Sự chuyển dịch của Apple khỏi Trung Quốc bắt đầu với thỏa thuận chip trị giá 433 triệu đô la của Foxconn tại Ấn Độ Vietnet24h - Nhà máy này dự kiến ​​sẽ đi vào hoạt động tại tiểu bang Uttar Pradesh, miền bắc Ấn Độ vào năm 2027 và sẽ sản xuất chip điều khiển màn hình của Foxconn, được sử dụng trong thiết bị điện tử tiêu dùng.
Samsung Electronics sẽ mua lại nhà cung cấp giải pháp sưởi ấm và làm mát FläktGroup với giá 1,5 tỷ euro Vietnet24h - Hôm thứ Tư, Samsung Electronics đã công bố rằng họ sẽ mua lại toàn bộ cổ phần của FläktGroup có trụ sở tại Đức, một nhà cung cấp giải pháp sưởi ấm và làm mát hàng đầu, với giá 1,5 tỷ euro.
Đột phá thuế quan giữa Hoa Kỳ và Trung Quốc khiến cổ phiếu công nghệ và chip tăng vọt Vietnet24h - Cổ phiếu công nghệ và chip toàn cầu tăng mạnh vào thứ Hai sau khi Hoa Kỳ và Trung Quốc đồng ý tạm dừng hầu hết các mức thuế đối với hàng hóa của nhau.
Galaxy S25 Edge đạt được độ bền chưa từng có với kính Gorilla Glass Ceramic 2 của Corning Vietnet24h - Samsung Electronics đã công bố vào ngày 9 tháng 5 rằng họ đã áp dụng kính gốm cho thiết bị di động mới của Corning.
CEO Apple Tim Cook tiết lộ những gì Apple cần để sản xuất iPhone tại Hoa Kỳ Vietnet24h - Trong khi thảm họa thuế quan đã mang lại sắc đỏ cho thị trường và sự hỗn loạn cho nền kinh tế toàn cầu, mục tiêu cuối cùng theo Tổng thống Donald Trump và những người ủng hộ ông là đưa hoạt động sản xuất trở lại Hoa Kỳ.
Google, Samsung sẽ ra mắt kính thông minh XR trong năm nay Vietnet24h - Samsung bước lên vị trí dẫn đầu về phần cứng trong sự trở lại của kính thông minh Google, mở rộng vai trò trong hệ sinh thái XR đang phát triển
Neuralink: cấy chip não, biên tập video và đăng YouTube bằng suy nghĩ Vietnet24h - Trong một bước đột phá ấn tượng, Bradford Smith, người mắc bệnh ALS, đã chứng minh khả năng tuyệt vời của công nghệ giao diện não-máy tính (BCI) khi có thể biên tập video và đăng tải lên YouTube chỉ bằng suy nghĩ, mà không cần sự trợ giúp từ bất kỳ thiết bị hay người khác. Đây không chỉ là sự tiến bộ trong lĩnh vực công nghệ mà còn mang lại hy vọng mới cho những người khuyết tật vận động.
LG Display công bố màn hình OLED màu xanh huỳnh quang thương mại đầu tiên trên thế giới Vietnet24h - LG Display đã xác minh thành công hiệu suất sản xuất của tấm nền điốt phát quang hữu cơ phát quang màu xanh lam (OLED) cho dây chuyền sản xuất hàng loạt lần đầu tiên trên thế giới, công ty cho biết hôm thứ Năm (1/5).
Người Trung Quốc chuẩn bị bay như Iron Man! Vietnet24h - Một thiết bị bay cá nhân vừa được trình diễn tại Hàng Châu khiến nhiều người liên tưởng đến các bộ phim siêu anh hùng. Nhưng lần này, không phải Hollywood mà chính các nhà khoa học Trung Quốc mới là người hiện thực hóa giấc mơ bay cá nhân.
Công nghệ cấy ghép não được FDA chấp thuận cho Precision Neuroscience Vietnet24h - Precision Neuroscience thông báo rằng một thành phần cốt lõi của hệ thống cấy ghép não đã được Cục Quản lý Thực phẩm và Dược phẩm Hoa Kỳ chấp thuận.
Từ ghi hình kép đến UX sáng tạo: iPhone 17 Pro có thể mở ra chương mới trong thiết kế trải nghiệm Vietnet24h - Không chỉ là tính năng mới, ghi hình kép trên iPhone 17 Pro là phép thử đầu tiên cho cách Apple xây dựng trải nghiệm người dùng kiểu mới – nơi cảm xúc, phản ứng và câu chuyện của người quay trở thành trung tâm của mọi khung hình.
Kim loại lỏng: Apple đang thử nghiệm cho iPhone gập, bền hơn titan 2,5 lần Vietnet24h - Công nghệ bản lề kim loại lỏng có thể giúp iPhone gập không chỉ bền hơn mà còn có thiết kế sang trọng hơn. Liệu đây có phải là bước tiến lớn trong công nghệ smartphone gập?
Apple áp dụng kim loại lỏng cho iPhone gập, mở ra kỷ nguyên mới Vietnet24h - Apple được cho là sẽ sử dụng kim loại lỏng để chế tạo bản lề cho iPhone gập, giúp tăng độ bền và hạn chế nếp gấp màn hình. Công nghệ này có thể tạo ra bước đột phá trên thị trường smartphone gập.
Amazon sẽ mang công nghệ quét lòng bàn tay đến các cơ sở y tế NYU Langone Vietnet24h - Bệnh nhân của NYU Langone Health sẽ có thể đăng ký lịch hẹn bằng Amazon One, công nghệ quét lòng bàn tay của công ty.
Lenovo hé lộ máy tính xách tay màn hình gập chạy bằng năng lượng mặt trời trong khái niệm mới nhất Vietnet24h - Lenovo đã tiết lộ khái niệm Lenovo ThinkBook ‘flip’, một chiếc máy tính xách tay có màn hình có thể gập lại. Khi mở hoàn toàn, toàn màn hình có kích thước 18 inch.