Công nghệ độc lạ
AI mới của Microsoft có khả năng giả giọng của con người chỉ trong 3 giây
Mộc Đức - Thứ Tư, 18/01/2023 10:00 SA
Vietnet24h - Công cụ AI sao chép giọng nói của Microsoft, được gọi là Vall-E, có thể bắt chước chính xác giọng nói của con người, chỉ với 3 giây nghe thử.

Công cụ AI sao chép giọng nói của Microsoft, được gọi là Vall-E. AI này được đào tạo 60.000 giờ phân tích các giọng nói từ hơn 7.000 diễn giả, gấp 100 lần so với các hệ thống hiện có.

Ars Technica báo cáo rằng Vall-E xây dựng trên một công nghệ có tên là EnCodec mà Meta đã công bố vào tháng 10 năm 2022. Nó hoạt động bằng cách phân tích giọng nói của một người, chia nhỏ thông tin thành các thành phần và sử dụng quá trình máy học để tổng hợp âm thanh của giọng nói nếu người đó đang nói. Ngay cả sau khi chỉ nghe một đoạn mẫu dài 3 giây, Vall-E có thể tái tạo âm sắc và giai điệu cảm xúc của người nói như thật.

Kết quả thử nghiệm cho thấy Vall-E vượt trội đáng kể so với hệ thống TTS zero-shot tiên tiến nhất [AI tái tạo giọng nói mà nó chưa từng nghe thấy] về độ truyền cảm từ giọng nói và độ tương đồng của người nói. Ngoài ra, VALL-E có thể hiểu và bắt chước cảm xúc của người nói và môi trường âm thanh của dấu nhắc âm thanh trong quá trình tổng hợp.

Bạn có thể nghe các ví dụ về cách tạo lại giọng nói của Vall-E trên GitHub. Các nhà nghiên cứu của Microsoft tin rằng Vall-E có thể được sử dụng như một công cụ chuyển văn bản thành giọng nói, một cách chỉnh sửa lời nói và một hệ thống tạo âm thanh bằng cách kết hợp nó với các AI thế hệ mới khác như GPT-3.

Microsoft đã chia sẻ một bộ sưu tập phong phú các mẫu do VALL-E tạo ra để bạn có thể tự mình nghe thấy khả năng mô phỏng giọng nói có khả năng như thế nào, nhưng kết quả hiện tại là một túi hỗn hợp. Đôi khi, công cụ này gặp sự cố khi tạo lại các dấu, kể cả những dấu tinh tế từ các mẫu nguồn mà người nói phát ra âm thanh Ailen và khả năng thay đổi cảm xúc của một cụm từ nhất định đôi khi gây cười. Nhưng thông thường, các mẫu do VALL-E tạo ra có âm thanh tự nhiên, ấm áp và hầu như không thể phân biệt được với loa gốc trong ba clip nguồn thứ hai.

Ở dạng hiện tại, được đào tạo trên Libri-light, VALL-E bị giới hạn trong việc mô phỏng giọng nói bằng tiếng Anh và mặc dù hiệu suất vẫn chưa hoàn hảo, nhưng chắc chắn nó sẽ cải thiện khi bộ dữ liệu mẫu được mở rộng hơn nữa. Tuy nhiên, việc cải thiện VALL-E sẽ tùy thuộc vào các nhà nghiên cứu của Microsoft vì nhóm không phát hành mã nguồn của công cụ. Trong một bài báo nghiên cứu được phát hành gần đây trình bày chi tiết về sự phát triển của VALL-E, những người tạo ra nó hoàn toàn hiểu những rủi ro mà nó gây ra:

“ Vì VALL-E có thể tổng hợp giọng nói để duy trì danh tính của người nói nên nó có thể tiềm ẩn rủi ro khi sử dụng sai, chẳng hạn như nhận dạng giọng nói giả mạo hoặc mạo danh một người nói cụ thể. Để giảm thiểu những rủi ro như vậy, có thể xây dựng mô hình phát hiện để phân biệt xem clip âm thanh có được tổng hợp bởi VALL-E hay không. Chúng tôi cũng sẽ áp dụng các Nguyên tắc Trí tuệ nhân tạo của Microsoft vào thực tiễn khi tiếp tục phát triển các mô hình”, theo Microsoft.

Samsung và Naver hợp tác phát triển chip AI Vietnet24h - Thứ Ba tuần này, Samsung Electronics cho biết, công ty sẽ hợp tác với gã khổng lồ internet Naver của Hàn Quốc để phát triển các giải pháp bán dẫn thế hệ tiếp theo cho các hệ thống trí tuệ nhân tạo tiên tiến.
Tin khác cùng chuyên mục
Tin đọc nhiều
Samsung đang nghiên cứu thiết kế TriFold rộng hơn trong hồ sơ bằng sáng chế Vietnet24h - Theo một hồ sơ bằng sáng chế được công bố hôm thứ Tư, Samsung Electronics đã nghiên cứu một phiên bản rộng hơn của chiếc Galaxy Z TriFold.
Hiểu thể nào là đúng về Start Up? Vietnet24h - Không ít người vẫn hiểu sai rằng startup đơn giản chỉ là một công ty mới thành lập hoặc doanh nghiệp nhỏ.
DeepSeek V4 chạy trên chip Huawei: Bước tiến lớn của Trung Quốc trong cuộc đua AI và bán dẫn Vietnet24h - Cuộc cạnh tranh công nghệ toàn cầu đang chứng kiến một bước ngoặt đáng chú ý khi mô hình AI thế hệ mới DeepSeek V4 của Trung Quốc được cho là sẽ vận hành trên chip do Huawei phát triển.
Doanh nghiệp điện tử – bán dẫn cần chuẩn bị gì để đạt Giấy chứng nhận doanh nghiệp khoa học và công nghệ? Vietnet24h - Trong bối cảnh Việt Nam đẩy mạnh chiến lược phát triển công nghiệp công nghệ cao, bán dẫn và AI, Giấy chứng nhận doanh nghiệp khoa học và công nghệ (DN KH&CN) đang trở thành một “tấm vé chiến lược” giúp doanh nghiệp điện tử – bán dẫn bước lên nấc thang cao hơn trong chuỗi giá trị.
Camera sau của Galaxy S26 sẽ có thông số kỹ thuật tương tự như S25. Vietnet24h - Samsung đang lên kế hoạch trang bị camera sau có thông số kỹ thuật tương tự cho mẫu Galaxy S26 tiêu chuẩn ra mắt năm sau với tên gọi Galaxy S25.
Phần mềm mới của Nvidia có thể giúp theo dõi xem các chip AI của hãng được sử dụng đến đâu. Vietnet24h - Dịch vụ tùy chọn mới của Nvidia sẽ cung cấp dữ liệu định vị địa lý, giúp xác định quốc gia mà các GPU cụ thể đang hoạt động.
Digital Twin – “Bản sao số” đang cách mạng hóa công nghiệp và đời sống Việt Nam Vietnet24h - Trong kỷ nguyên Công nghiệp 4.0 và Chuyển đổi số quốc gia, khái niệm Digital Twin (Bản sao số) đang nổi lên như một “vũ khí bí mật” giúp doanh nghiệp tối ưu vận hành, giảm chi phí và dự đoán tương lai với độ chính xác chưa từng có.
SAMSUNG GALAXY Z FLIP 7 “ĐỐI ĐẦU” IPHONE 17 PRO: “SIÊU PHẨM” NÀO XỨNG ĐÁNG 1.099 USD NHẤT NĂM 2025? Vietnet24h - Điện thoại gập không còn là “hàng thử nghiệm” nữa! Chúng đang “chiến đấu sòng phẳng” với các flagship truyền thống.
Meta Connect 2025: Kính thông minh tích hợp AI chiếm vị trí trung tâm Vietnet24h - Meta đã chi hàng tỷ đô la để cố gắng đưa thực tế ảo (VR) trở thành xu hướng với người tiêu dùng. Khi chuyển hướng chiến lược metaverse sang kính thông minh, các nhà đầu tư sẽ theo dõi phản ứng của công chúng.
Virtual Twin: mô hình kỹ thuật số mô phỏng chính xác một thực thể vật lý hoặc hệ thống trong thế giới thực Vietnet24h - Virtual Twin (Song sinh số) là một mô hình kỹ thuật số được tạo ra để mô phỏng chính xác một thực thể vật lý hoặc hệ thống trong thế giới thực, như sản phẩm, quy trình sản xuất, hoặc thậm chí là toàn bộ nhà máy, thành phố.
LG và Nvidia tăng cường hợp tác để thúc đẩy hệ sinh thái AI Vietnet24h - Sự hợp tác chuyển hướng sang triển khai thực tiễn trong lĩnh vực sản xuất và công nghệ sinh học.
Nhà máy Samsung Taylor đi vào hoạt động, với chip của Tesla sẵn sàng cho việc sản xuất Vietnet24h - Samsung Electronics sắp bắt đầu hoạt động tại nhà máy sản xuất chip của mình ở Taylor, Texas, với các công tác chuẩn bị đang được tiến hành để sản xuất chip trí tuệ nhân tạo (AI) cho Tesla bằng quy trình 2 nanomet.
Tập đoàn Hyundai Motor tái cấu trúc danh mục sản phẩm hướng đến trí tuệ nhân tạo vật lý Vietnet24h - Tập đoàn Hyundai Motor đang đẩy nhanh quá trình tái cấu trúc kinh doanh sâu rộng bằng cách sắp xếp lại danh mục đầu tư của các công ty con chủ chốt xoay quanh lĩnh vực robot và trí tuệ nhân tạo (AI) vật lý.
Apple tránh được lệnh cấm nhập khẩu Apple Watch tại Mỹ sau phán quyết mới Vietnet24h - Apple vừa giành chiến thắng pháp lý quan trọng khi cơ quan thương mại Mỹ bác đề nghị áp lệnh cấm nhập khẩu mới đối với Apple Watch, giúp hãng tiếp tục bán các mẫu đồng hồ thông minh tại thị trường lớn nhất của mình.
Qualcomm mở rộng đầu tư công nghệ lõi tại Việt Nam, thúc đẩy hệ sinh thái 6G và AI Vietnet24h - Tập đoàn bán dẫn Mỹ Qualcomm đang mở rộng chiến lược đầu tư vào các lĩnh vực công nghệ lõi tại Việt Nam, bao gồm 6G, trí tuệ nhân tạo (AI), ô tô thông minh và thiết bị kết nối.
Cadence và Nvidia đang hợp tác phát triển trí tuệ nhân tạo cho robot Vietnet24h - Trong bối cảnh cuộc đua phát triển robot thông minh ngày càng tăng tốc, Cadence Design Systems và Nvidia vừa công bố mở rộng hợp tác nhằm thúc đẩy phát triển trí tuệ nhân tạo cho robot.
Việc sản xuất iPhone gập bị hoãn lại, nhưng kế hoạch ra mắt vào mùa thu năm 2026 vẫn được giữ nguyên Vietnet24h - Việc sản xuất iPhone Fold đang chậm tiến độ, nhưng thiết bị vẫn dự kiến ​​ra mắt vào mùa thu năm 2026, theo báo cáo của DigiTimes.
TSMC dự kiến ​​sẽ đạt lợi nhuận kỷ lục trong quý thứ tư liên tiếp nhờ nhu cầu AI không ngừng tăng cao Vietnet24h - Trong bối cảnh làn sóng trí tuệ nhân tạo tiếp tục bùng nổ trên quy mô toàn cầu, TSMC một lần nữa khẳng định vị thế trung tâm của mình trong chuỗi giá trị bán dẫn khi được dự báo ghi nhận quý thứ tư liên tiếp đạt lợi nhuận kỷ lục.
Samsung Galaxy thể hiện thiết kế lấy con người làm trung tâm với S26 và Buds 4 Vietnet24h - Hãng Samsung Electronics hôm thứ Năm cho biết, thiết kế mới cho dòng điện thoại thông minh và tai nghe Galaxy của hãng sẽ lấy con người làm trung tâm, nhằm mục đích cho phép công nghệ và dữ liệu hòa quyện liền mạch hơn vào cuộc sống hàng ngày của người dùng.
Meta ra mắt mô hình AI mới, nỗ lực bắt kịp Google và OpenAI sau khi đã chi hàng tỷ đô la Vietnet24h - Trong cuộc đua trí tuệ nhân tạo đang ngày càng khốc liệt, Meta Platforms vừa chính thức trình làng mô hình AI quy mô lớn đầu tiên kể từ sau thương vụ đầu tư trị giá 14 tỷ USD nhằm đưa Alexandr Wang về dẫn dắt chiến lược AI.
Robot AI vật lý do Hàn Quốc sản xuất được ứng dụng trong chăm sóc tim mạch Vietnet24h - Trung tâm Y tế Asan sử dụng robot hỗ trợ can thiệp mạch vành qua da để điều trị bệnh nhân.
Cuộc đua robot hình người: “bàn tay” mới là chiến trường quyết định, không phải trí tuệ Vietnet24h - Thế giới đang bị cuốn vào cuộc cạnh tranh phát triển robot hình người với trọng tâm là AI và năng lực xử lý.
Mô hình AI dự đoán hương vị kim chi và mức độ lên men Vietnet24h - Viện nghiên cứu kim chi hàng đầu của Hàn Quốc đã phát triển một mô hình trí tuệ nhân tạo (AI) mới có thể dự đoán hương vị của kim chi dựa trên các điều kiện lên men, bao gồm nhiệt độ và vi khuẩn hiện diện.
Samsung Display giới thiệu các khái niệm AI và OLED thế hệ tiếp theo Vietnet24h - Samsung Display đã giới thiệu các sản phẩm concept cho các thiết bị trí tuệ nhân tạo (AI) thế hệ tiếp theo sử dụng công nghệ OLED tại một sự kiện truyền thông hôm thứ Hai (giờ địa phương) trước thềm CES 2026.
Từ “robot trình diễn” đến nền tảng mở: Unitree và bước ngoặt mới của ngành robot tiêu dùng Vietnet24h - Việc Unitree Robotics công bố nền tảng cho phép người dùng điều khiển robot thông qua smartphone không đơn thuần là một cải tiến giao diện người dùng.
Tàu vũ trụ thương mại đầu tiên của Hàn Quốc dự kiến ​​phóng vào ngày 22 tháng 11 tại Brazil Vietnet24h - HANBIT-Nano, tên lửa đẩy thương mại đầu tiên của Hàn Quốc do Innospace phát triển, sẽ được phóng vào lúc 3 giờ chiều ngày 22 tháng 11 tại Brazil (giờ địa phương), công ty cho biết hôm thứ Sáu (7/11).
Tương Lai Robot Hình Người: Từ “CMO” Đến Người Bạn Đồng Hành Của Nhân Loại Vietnet24h - Boston, ngày 3/10/2025 – Trong một động thái gây chấn động, robot hình người Uri – từng là Unitree G1 – vừa được bổ nhiệm làm Giám đốc Marketing (CMO) cho Series, nền tảng mạng xã hội cạnh tranh trực tiếp với LinkedIn.
PCIM Asia Shanghai 2025: Cuộc Cách Mạng Công Nghệ Điện Tử Công Suất – Phỏng Vấn Độc Quyền Với CEO EPC Về Tương Lai GaN Và AI Vietnet24h - Phóng viên Vietnet24h đã có cơ hội phỏng vấn độc quyền ông Alexander Lidow, Tiến sĩ khoa học, Tổng Giám đốc điều hành EPC (Efficient Power Conversion) – một trong những nhà tiên phong về công nghệ Gallium Nitride (GaN).
Triển Lãm Robot Tại Thượng Hải 2025: Đa Robot, Đa Nhiệm Vụ Và Tương Lai Việc Làm Tự Động Hóa Vietnet24h - Thượng Hải, Trung Quốc, ngày 27/9/2025 – Trong khuôn khổ China International Industry Fair (CIIF) 2025, Triển lãm Robot (Robot Show) đang diễn ra sôi nổi từ ngày 23 đến 27/9 tại Trung tâm Triển lãm và Hội nghị Quốc gia (National Exhibition and Convention Center, địa chỉ: 333 Songze Avenue, Quận Thanh Phổ, Thượng Hải).
Mark Zuckerberg ra mắt kính Meta Ray-Ban Display giá 799 đô la Vietnet24h - Hôm thứ Tư, Mark Zuckerberg đã ra mắt chiếc kính Meta Ray-Ban Display trị giá 799 đô la, chiếc kính thông minh đầu tiên của công ty truyền thông xã hội này dành cho người tiêu dùng với màn hình tích hợp.