Tiêu điểm công nghệ
AI mới của Microsoft có khả năng giả giọng của con người chỉ trong 3 giây
Mộc Đức - Thứ Tư, 18/01/2023 10:00 SA
Vietnet24h - Công cụ AI sao chép giọng nói của Microsoft, được gọi là Vall-E, có thể bắt chước chính xác giọng nói của con người, chỉ với 3 giây nghe thử.

Công cụ AI sao chép giọng nói của Microsoft, được gọi là Vall-E. AI này được đào tạo 60.000 giờ phân tích các giọng nói từ hơn 7.000 diễn giả, gấp 100 lần so với các hệ thống hiện có.

Ars Technica báo cáo rằng Vall-E xây dựng trên một công nghệ có tên là EnCodec mà Meta đã công bố vào tháng 10 năm 2022. Nó hoạt động bằng cách phân tích giọng nói của một người, chia nhỏ thông tin thành các thành phần và sử dụng quá trình máy học để tổng hợp âm thanh của giọng nói nếu người đó đang nói. Ngay cả sau khi chỉ nghe một đoạn mẫu dài 3 giây, Vall-E có thể tái tạo âm sắc và giai điệu cảm xúc của người nói như thật.

Kết quả thử nghiệm cho thấy Vall-E vượt trội đáng kể so với hệ thống TTS zero-shot tiên tiến nhất [AI tái tạo giọng nói mà nó chưa từng nghe thấy] về độ truyền cảm từ giọng nói và độ tương đồng của người nói. Ngoài ra, VALL-E có thể hiểu và bắt chước cảm xúc của người nói và môi trường âm thanh của dấu nhắc âm thanh trong quá trình tổng hợp.

Bạn có thể nghe các ví dụ về cách tạo lại giọng nói của Vall-E trên GitHub. Các nhà nghiên cứu của Microsoft tin rằng Vall-E có thể được sử dụng như một công cụ chuyển văn bản thành giọng nói, một cách chỉnh sửa lời nói và một hệ thống tạo âm thanh bằng cách kết hợp nó với các AI thế hệ mới khác như GPT-3.

Microsoft đã chia sẻ một bộ sưu tập phong phú các mẫu do VALL-E tạo ra để bạn có thể tự mình nghe thấy khả năng mô phỏng giọng nói có khả năng như thế nào, nhưng kết quả hiện tại là một túi hỗn hợp. Đôi khi, công cụ này gặp sự cố khi tạo lại các dấu, kể cả những dấu tinh tế từ các mẫu nguồn mà người nói phát ra âm thanh Ailen và khả năng thay đổi cảm xúc của một cụm từ nhất định đôi khi gây cười. Nhưng thông thường, các mẫu do VALL-E tạo ra có âm thanh tự nhiên, ấm áp và hầu như không thể phân biệt được với loa gốc trong ba clip nguồn thứ hai.

Ở dạng hiện tại, được đào tạo trên Libri-light, VALL-E bị giới hạn trong việc mô phỏng giọng nói bằng tiếng Anh và mặc dù hiệu suất vẫn chưa hoàn hảo, nhưng chắc chắn nó sẽ cải thiện khi bộ dữ liệu mẫu được mở rộng hơn nữa. Tuy nhiên, việc cải thiện VALL-E sẽ tùy thuộc vào các nhà nghiên cứu của Microsoft vì nhóm không phát hành mã nguồn của công cụ. Trong một bài báo nghiên cứu được phát hành gần đây trình bày chi tiết về sự phát triển của VALL-E, những người tạo ra nó hoàn toàn hiểu những rủi ro mà nó gây ra:

“ Vì VALL-E có thể tổng hợp giọng nói để duy trì danh tính của người nói nên nó có thể tiềm ẩn rủi ro khi sử dụng sai, chẳng hạn như nhận dạng giọng nói giả mạo hoặc mạo danh một người nói cụ thể. Để giảm thiểu những rủi ro như vậy, có thể xây dựng mô hình phát hiện để phân biệt xem clip âm thanh có được tổng hợp bởi VALL-E hay không. Chúng tôi cũng sẽ áp dụng các Nguyên tắc Trí tuệ nhân tạo của Microsoft vào thực tiễn khi tiếp tục phát triển các mô hình”, theo Microsoft.

Samsung và Naver hợp tác phát triển chip AI Vietnet24h - Thứ Ba tuần này, Samsung Electronics cho biết, công ty sẽ hợp tác với gã khổng lồ internet Naver của Hàn Quốc để phát triển các giải pháp bán dẫn thế hệ tiếp theo cho các hệ thống trí tuệ nhân tạo tiên tiến.
Tin khác cùng chuyên mục
Tin đọc nhiều
LG CNS giới thiệu nền tảng nhà máy tích hợp trí tuệ nhân tạo tại triển lãm ở Mỹ Vietnet24h - LG CNS hôm thứ Tư cho biết họ đã giới thiệu các giải pháp nhà máy thông minh dựa trên trí tuệ nhân tạo (AI) tại Triển lãm Công nghệ IoT 2026 ở San Jose, khi công ty đẩy mạnh việc thâm nhập thị trường sản xuất Bắc Mỹ.
Samsung đang nghiên cứu thiết kế TriFold rộng hơn trong hồ sơ bằng sáng chế Vietnet24h - Theo một hồ sơ bằng sáng chế được công bố hôm thứ Tư, Samsung Electronics đã nghiên cứu một phiên bản rộng hơn của chiếc Galaxy Z TriFold.
Hiểu thể nào là đúng về Start Up? Vietnet24h - Không ít người vẫn hiểu sai rằng startup đơn giản chỉ là một công ty mới thành lập hoặc doanh nghiệp nhỏ.
DeepSeek V4 chạy trên chip Huawei: Bước tiến lớn của Trung Quốc trong cuộc đua AI và bán dẫn Vietnet24h - Cuộc cạnh tranh công nghệ toàn cầu đang chứng kiến một bước ngoặt đáng chú ý khi mô hình AI thế hệ mới DeepSeek V4 của Trung Quốc được cho là sẽ vận hành trên chip do Huawei phát triển.
Doanh nghiệp điện tử – bán dẫn cần chuẩn bị gì để đạt Giấy chứng nhận doanh nghiệp khoa học và công nghệ? Vietnet24h - Trong bối cảnh Việt Nam đẩy mạnh chiến lược phát triển công nghiệp công nghệ cao, bán dẫn và AI, Giấy chứng nhận doanh nghiệp khoa học và công nghệ (DN KH&CN) đang trở thành một “tấm vé chiến lược” giúp doanh nghiệp điện tử – bán dẫn bước lên nấc thang cao hơn trong chuỗi giá trị.
Camera sau của Galaxy S26 sẽ có thông số kỹ thuật tương tự như S25. Vietnet24h - Samsung đang lên kế hoạch trang bị camera sau có thông số kỹ thuật tương tự cho mẫu Galaxy S26 tiêu chuẩn ra mắt năm sau với tên gọi Galaxy S25.
Phần mềm mới của Nvidia có thể giúp theo dõi xem các chip AI của hãng được sử dụng đến đâu. Vietnet24h - Dịch vụ tùy chọn mới của Nvidia sẽ cung cấp dữ liệu định vị địa lý, giúp xác định quốc gia mà các GPU cụ thể đang hoạt động.
Digital Twin – “Bản sao số” đang cách mạng hóa công nghiệp và đời sống Việt Nam Vietnet24h - Trong kỷ nguyên Công nghiệp 4.0 và Chuyển đổi số quốc gia, khái niệm Digital Twin (Bản sao số) đang nổi lên như một “vũ khí bí mật” giúp doanh nghiệp tối ưu vận hành, giảm chi phí và dự đoán tương lai với độ chính xác chưa từng có.
SAMSUNG GALAXY Z FLIP 7 “ĐỐI ĐẦU” IPHONE 17 PRO: “SIÊU PHẨM” NÀO XỨNG ĐÁNG 1.099 USD NHẤT NĂM 2025? Vietnet24h - Điện thoại gập không còn là “hàng thử nghiệm” nữa! Chúng đang “chiến đấu sòng phẳng” với các flagship truyền thống.
Meta Connect 2025: Kính thông minh tích hợp AI chiếm vị trí trung tâm Vietnet24h - Meta đã chi hàng tỷ đô la để cố gắng đưa thực tế ảo (VR) trở thành xu hướng với người tiêu dùng. Khi chuyển hướng chiến lược metaverse sang kính thông minh, các nhà đầu tư sẽ theo dõi phản ứng của công chúng.
OpenAI và Broadcom ra mắt chip AI đầu tiên mang tên Jalapeño Vietnet24h - OpenAI vừa công bố Jalapeño – con chip AI đầu tiên do hãng tự thiết kế với sự hỗ trợ của Broadcom. Được tối ưu cho các tác vụ suy luận AI như vận hành ChatGPT, Jalapeño đánh dấu bước tiến quan trọng trong chiến lược xây dựng hạ tầng tính toán riêng và giảm sự phụ thuộc vào các bộ xử lý của Nvidia.
Sự bùng nổ của trí tuệ nhân tạo đã giúp SK Hynix vượt qua Samsung về giá trị thị trường Vietnet24h - Hôm thứ Hai, SK hynix đã vượt qua Samsung Electronics để trở thành công ty niêm yết có giá trị nhất Hàn Quốc, chấm dứt gần 26 năm thống trị của Samsung khi các nhà đầu tư tiếp tục đổ xô vào cổ phiếu liên quan đến trí tuệ nhân tạo.
SK hynix xuất xưởng các mẫu HBM4E, gia nhập cùng Samsung trong cuộc đua bộ nhớ AI thế hệ tiếp theo Vietnet24h - SK hynix cho biết chip 12 lớp của họ cung cấp dung lượng 48 gigabyte và tốc độ truyền dữ liệu lên đến 16 gigabit mỗi giây, đồng thời cải thiện hiệu suất năng lượng hơn 20% so với thế hệ HBM4 trước đó.
AI Trung Quốc giảm phụ thuộc Nvidia: 5 mô hình AI lớn chứng minh sức mạnh của chip nội địa Vietnet24h - Các biện pháp kiểm soát xuất khẩu công nghệ của Mỹ đang tạo ra một sự thay đổi sâu sắc trong hệ sinh thái AI Trung Quốc.
Hansae mở đường cho thị trường thời trang robot hình người Vietnet24h - Khi cuộc đua trí tuệ nhân tạo đang dịch chuyển từ thế giới số sang các ứng dụng vật lý, tập đoàn may mặc Hàn Quốc Hansae đã đưa ra một hướng đi hoàn toàn mới: phát triển quần áo dành cho robot hình người (humanoid).
SpaceX sau IPO lịch sử: Phố Wall chờ phép thử lớn tiếp theo của đế chế Elon Musk Vietnet24h - SpaceX đã hoàn tất đợt IPO với mức định giá thuộc nhóm cao nhất lịch sử đối với một công ty công nghệ và hàng không vũ trụ.
Nvidia bắt đầu chào bán CPU Vera cho khách hàng Trung Quốc, mở rộng cuộc chơi ngoài GPU AI Vietnet24h - Nvidia đang thực hiện bước đi chiến lược mới tại thị trường Trung Quốc khi bắt đầu giới thiệu dòng CPU máy chủ Vera tới các khách hàng lớn
Applied Materials mở rộng đại bản doanh tại Singapore, Nhật Bản định hình mô hình cáp ngầm mới cho kỷ nguyên AI Vietnet24h - Những động thái mới từ Applied Materials tại Singapore và các tập đoàn viễn thông Nhật Bản cho thấy cuộc đua AI không chỉ diễn ra trong các trung tâm dữ liệu hay nhà máy chip, mà còn lan rộng tới toàn bộ hệ sinh thái hạ tầng số toàn cầu.
Samsung Electronics sẽ đưa ChatGPT, Gemini và Claude vào hoạt động Vietnet24h - Samsung Electronics sẽ triển khai ba dịch vụ trí tuệ nhân tạo (AI) tạo sinh hàng đầu thế giới trên toàn bộ hoạt động của mình, nhằm mục đích đẩy nhanh quá trình chuyển đổi AI vượt ra ngoài việc chỉ dựa vào các mô hình và dịch vụ AI nội bộ.
IPO SpaceX có thể bùng nổ hai chữ số ngay ngày đầu niêm yết, cơn sốt lớn nhất Phố Wall năm 2026 đang hình thành Vietnet24h - Trước thềm đợt phát hành cổ phiếu lần đầu ra công chúng (IPO) được xem là lớn nhất lịch sử thị trường tài chính toàn cầu, giới đầu tư đang đặt cược mạnh vào khả năng cổ phiếu SpaceX sẽ tăng trưởng hai chữ số ngay trong phiên giao dịch đầu tiên.
Samsung Display ra mắt màn hình OLEDOS RGB độ sáng cực cao dành cho XR Vietnet24h - Công ty trưng bày các tấm nền OLEDOS RGB 1,3 inch và 0,62 inch với độ sáng 40.000 nit tại triển lãm AWE USA 2026.
Robot AI vật lý do Hàn Quốc sản xuất được ứng dụng trong chăm sóc tim mạch Vietnet24h - Trung tâm Y tế Asan sử dụng robot hỗ trợ can thiệp mạch vành qua da để điều trị bệnh nhân.
Cuộc đua robot hình người: “bàn tay” mới là chiến trường quyết định, không phải trí tuệ Vietnet24h - Thế giới đang bị cuốn vào cuộc cạnh tranh phát triển robot hình người với trọng tâm là AI và năng lực xử lý.
Mô hình AI dự đoán hương vị kim chi và mức độ lên men Vietnet24h - Viện nghiên cứu kim chi hàng đầu của Hàn Quốc đã phát triển một mô hình trí tuệ nhân tạo (AI) mới có thể dự đoán hương vị của kim chi dựa trên các điều kiện lên men, bao gồm nhiệt độ và vi khuẩn hiện diện.
Samsung Display giới thiệu các khái niệm AI và OLED thế hệ tiếp theo Vietnet24h - Samsung Display đã giới thiệu các sản phẩm concept cho các thiết bị trí tuệ nhân tạo (AI) thế hệ tiếp theo sử dụng công nghệ OLED tại một sự kiện truyền thông hôm thứ Hai (giờ địa phương) trước thềm CES 2026.
Từ “robot trình diễn” đến nền tảng mở: Unitree và bước ngoặt mới của ngành robot tiêu dùng Vietnet24h - Việc Unitree Robotics công bố nền tảng cho phép người dùng điều khiển robot thông qua smartphone không đơn thuần là một cải tiến giao diện người dùng.
Tàu vũ trụ thương mại đầu tiên của Hàn Quốc dự kiến ​​phóng vào ngày 22 tháng 11 tại Brazil Vietnet24h - HANBIT-Nano, tên lửa đẩy thương mại đầu tiên của Hàn Quốc do Innospace phát triển, sẽ được phóng vào lúc 3 giờ chiều ngày 22 tháng 11 tại Brazil (giờ địa phương), công ty cho biết hôm thứ Sáu (7/11).
Tương Lai Robot Hình Người: Từ “CMO” Đến Người Bạn Đồng Hành Của Nhân Loại Vietnet24h - Boston, ngày 3/10/2025 – Trong một động thái gây chấn động, robot hình người Uri – từng là Unitree G1 – vừa được bổ nhiệm làm Giám đốc Marketing (CMO) cho Series, nền tảng mạng xã hội cạnh tranh trực tiếp với LinkedIn.
PCIM Asia Shanghai 2025: Cuộc Cách Mạng Công Nghệ Điện Tử Công Suất – Phỏng Vấn Độc Quyền Với CEO EPC Về Tương Lai GaN Và AI Vietnet24h - Phóng viên Vietnet24h đã có cơ hội phỏng vấn độc quyền ông Alexander Lidow, Tiến sĩ khoa học, Tổng Giám đốc điều hành EPC (Efficient Power Conversion) – một trong những nhà tiên phong về công nghệ Gallium Nitride (GaN).
Triển Lãm Robot Tại Thượng Hải 2025: Đa Robot, Đa Nhiệm Vụ Và Tương Lai Việc Làm Tự Động Hóa Vietnet24h - Thượng Hải, Trung Quốc, ngày 27/9/2025 – Trong khuôn khổ China International Industry Fair (CIIF) 2025, Triển lãm Robot (Robot Show) đang diễn ra sôi nổi từ ngày 23 đến 27/9 tại Trung tâm Triển lãm và Hội nghị Quốc gia (National Exhibition and Convention Center, địa chỉ: 333 Songze Avenue, Quận Thanh Phổ, Thượng Hải).