Tiêu điểm công nghệ
AI mới của Microsoft có khả năng giả giọng của con người chỉ trong 3 giây
Mộc Đức - Thứ Tư, 18/01/2023 10:00 SA
Vietnet24h - Công cụ AI sao chép giọng nói của Microsoft, được gọi là Vall-E, có thể bắt chước chính xác giọng nói của con người, chỉ với 3 giây nghe thử.

Công cụ AI sao chép giọng nói của Microsoft, được gọi là Vall-E. AI này được đào tạo 60.000 giờ phân tích các giọng nói từ hơn 7.000 diễn giả, gấp 100 lần so với các hệ thống hiện có.

Ars Technica báo cáo rằng Vall-E xây dựng trên một công nghệ có tên là EnCodec mà Meta đã công bố vào tháng 10 năm 2022. Nó hoạt động bằng cách phân tích giọng nói của một người, chia nhỏ thông tin thành các thành phần và sử dụng quá trình máy học để tổng hợp âm thanh của giọng nói nếu người đó đang nói. Ngay cả sau khi chỉ nghe một đoạn mẫu dài 3 giây, Vall-E có thể tái tạo âm sắc và giai điệu cảm xúc của người nói như thật.

Kết quả thử nghiệm cho thấy Vall-E vượt trội đáng kể so với hệ thống TTS zero-shot tiên tiến nhất [AI tái tạo giọng nói mà nó chưa từng nghe thấy] về độ truyền cảm từ giọng nói và độ tương đồng của người nói. Ngoài ra, VALL-E có thể hiểu và bắt chước cảm xúc của người nói và môi trường âm thanh của dấu nhắc âm thanh trong quá trình tổng hợp.

Bạn có thể nghe các ví dụ về cách tạo lại giọng nói của Vall-E trên GitHub. Các nhà nghiên cứu của Microsoft tin rằng Vall-E có thể được sử dụng như một công cụ chuyển văn bản thành giọng nói, một cách chỉnh sửa lời nói và một hệ thống tạo âm thanh bằng cách kết hợp nó với các AI thế hệ mới khác như GPT-3.

Microsoft đã chia sẻ một bộ sưu tập phong phú các mẫu do VALL-E tạo ra để bạn có thể tự mình nghe thấy khả năng mô phỏng giọng nói có khả năng như thế nào, nhưng kết quả hiện tại là một túi hỗn hợp. Đôi khi, công cụ này gặp sự cố khi tạo lại các dấu, kể cả những dấu tinh tế từ các mẫu nguồn mà người nói phát ra âm thanh Ailen và khả năng thay đổi cảm xúc của một cụm từ nhất định đôi khi gây cười. Nhưng thông thường, các mẫu do VALL-E tạo ra có âm thanh tự nhiên, ấm áp và hầu như không thể phân biệt được với loa gốc trong ba clip nguồn thứ hai.

Ở dạng hiện tại, được đào tạo trên Libri-light, VALL-E bị giới hạn trong việc mô phỏng giọng nói bằng tiếng Anh và mặc dù hiệu suất vẫn chưa hoàn hảo, nhưng chắc chắn nó sẽ cải thiện khi bộ dữ liệu mẫu được mở rộng hơn nữa. Tuy nhiên, việc cải thiện VALL-E sẽ tùy thuộc vào các nhà nghiên cứu của Microsoft vì nhóm không phát hành mã nguồn của công cụ. Trong một bài báo nghiên cứu được phát hành gần đây trình bày chi tiết về sự phát triển của VALL-E, những người tạo ra nó hoàn toàn hiểu những rủi ro mà nó gây ra:

“ Vì VALL-E có thể tổng hợp giọng nói để duy trì danh tính của người nói nên nó có thể tiềm ẩn rủi ro khi sử dụng sai, chẳng hạn như nhận dạng giọng nói giả mạo hoặc mạo danh một người nói cụ thể. Để giảm thiểu những rủi ro như vậy, có thể xây dựng mô hình phát hiện để phân biệt xem clip âm thanh có được tổng hợp bởi VALL-E hay không. Chúng tôi cũng sẽ áp dụng các Nguyên tắc Trí tuệ nhân tạo của Microsoft vào thực tiễn khi tiếp tục phát triển các mô hình”, theo Microsoft.

Samsung và Naver hợp tác phát triển chip AI Vietnet24h - Thứ Ba tuần này, Samsung Electronics cho biết, công ty sẽ hợp tác với gã khổng lồ internet Naver của Hàn Quốc để phát triển các giải pháp bán dẫn thế hệ tiếp theo cho các hệ thống trí tuệ nhân tạo tiên tiến.
Tin khác cùng chuyên mục
Tin đọc nhiều
MediaTek ra mắt bộ xử lý AI cho Chromebook Plus Vietnet24h - MediaTek Inc., nhà thiết kế IC lớn nhất tại Đài Loan, đã giới thiệu bộ xử lý mới -- Kompanio Ultra -- vào thứ Hai, công ty mô tả đây là cột mốc mới nhất trong Chromebook hiệu suất cao, chạy bằng trí tuệ nhân tạo.
Chuẩn GPMI của Trung Quốc: ‘Một dây cáp cho mọi thiết bị’ Vietnet24h - GPMI được thiết kế để tối giản hóa kết nối số bằng cách gộp cả dữ liệu và điện năng vào một sợi cáp duy nhất. Nếu được phổ biến, đây có thể là bước ngoặt định hình lại hệ sinh thái điện tử trong tương lai.
Rò rỉ cách Apple sẽ làm cho màn hình bên trong của iPhone gập trở nên quen thuộc với người dùng iPad Vietnet24h - Chiếc điện thoại có thể gập đầu tiên của Apple dự kiến ​​sẽ được sản xuất hàng loạt vào cuối năm sau và có thể ra mắt vào quý 4 năm 2026 hoặc quý 1 năm 2027.
Alibaba cung cấp miễn phí mô hình tạo video AI trên toàn cầu Vietnet24h - Gã khổng lồ Trung Quốc cho biết họ đang mở mã nguồn bốn mô hình thuộc dòng Wan2.1, phiên bản mới nhất của mô hình AI nền tảng của công ty, có khả năng tạo hình ảnh và video từ dữ liệu đầu vào là văn bản và hình ảnh.
Từ Gmail đến Word, cài đặt quyền riêng tư và AI của bạn đang bước vào một mối quan hệ mới Vietnet24h - Các chương trình như Gmail, Microsoft và Facebook đã tồn tại trong nhiều năm qua đã âm thầm kích hoạt và tích hợp các tính năng AI.
AI trong Gmail, Word: Tiện ích hay mối đe dọa quyền riêng tư? Vietnet24h - AI đang dần xâm nhập vào mọi ngóc ngách của cuộc sống số, từ email đến sổ sách kế toán. Tuy nhiên, sự thiếu rõ ràng trong chính sách bảo mật khiến nhiều chuyên gia cảnh báo về nguy cơ dữ liệu cá nhân bị lạm dụng.
OpenAI bật mí 5 mẹo dùng ChatGPT mà bạn chưa biết Vietnet24h - Nick Turley, chuyên gia của OpenAI, tiết lộ các tính năng như tải tập tin, tạo GPT tùy chỉnh và sử dụng giọng nói, hứa hẹn thay đổi cách người dùng tương tác với ChatGPT.
Ghi âm cuộc gọi và cải tiến camera: Những điểm nổi bật trong iOS 18.1 của Apple Vietnet24h - Vào tối 28 tháng 10, Apple phát hành phiên bản iOS 18.1, mang đến tính năng ghi âm cuộc gọi lần đầu tiên cho người dùng iPhone. Cùng với đó là những cải tiến cho camera và giao diện, hứa hẹn sẽ nâng cao trải nghiệm người dùng trên các thiết bị mới.
Orion sắp ra mắt: OpenAI mở ra chương mới cho trí tuệ nhân tạo Vietnet24h - Với việc ra mắt mô hình AI mới mang tên Orion vào tháng 12/2024, OpenAI đang tạo ra những bước tiến mạnh mẽ trong lĩnh vực công nghệ. Orion được kỳ vọng sẽ có sức mạnh vượt trội gấp 100 lần GPT-4, đánh dấu một cột mốc quan trọng trong hành trình phát triển trí tuệ nhân tạo tổng quát.
Chỉnh sửa ảnh thông minh với Microsoft Paint nhờ AI Vietnet24h - Microsoft Paint không ngừng cải tiến với sự ra mắt của Generative Fill và Generative Erase. Hai tính năng mới này giúp người dùng dễ dàng thêm hoặc xóa các chi tiết trong ảnh, mang lại trải nghiệm chỉnh sửa ảnh phong phú và trực quan hơn bao giờ hết.
Với iPhone 17, Apple chơi lớn: Tự chủ chip, mở rộng AI, dứt khoát chia tay “Plus” Vietnet24h - Việc khai tử phiên bản Plus để nhường chỗ cho mẫu Air siêu mỏng là dấu hiệu cho thấy Apple đang tái cấu trúc danh mục iPhone. Cùng lúc, hãng đẩy mạnh nội địa hóa linh kiện, nâng cấp phần cứng và tích hợp AI sâu rộng nhằm giữ vị thế dẫn đầu trong cuộc đua công nghệ.
Bên trong nhà máy sản xuất chip hoàn toàn tự động của LG Innotek: Robot, AI và không bụi Vietnet24h - LG Innotek đã mở cửa "Dream Factory" tiên tiến của mình tại Gumi, tỉnh Gyeongsang Bắc, lần đầu tiên cho giới truyền thông địa phương, thể hiện động thái đầy tham vọng của công ty nhằm định vị mình là một công ty lớn trong thị trường chất nền bán dẫn thế hệ tiếp theo.
Nvidia cho biết họ tuân thủ luật xuất khẩu của Hoa Kỳ một ngày sau khi ngừng bán chip AI cho Trung Quốc Vietnet24h - Nvidia cho biết hôm thứ Tư rằng họ tuân thủ theo chỉ đạo của chính phủ Hoa Kỳ về nơi họ có thể bán chip AI của mình "theo đúng nghĩa đen".
Điện thoại thông minh, màn hình máy tính và linh kiện điện tử được miễn thuế quan mới nhất của Trump Vietnet24h - Theo thông báo của Cơ quan Hải quan và Bảo vệ Biên giới Hoa Kỳ được đăng vào cuối ngày thứ Sáu (11/4), các thiết bị điện tử nhập khẩu vào Hoa Kỳ sẽ được miễn thuế quan có đi có lại của Tổng thống Donald Trump.
Các nhà phân tích cảnh báo Apple sẽ không còn phao cứu sinh khi cuộc chiến thương mại Mỹ - Trung ngày càng leo thang Vietnet24h - Apple đang phụ thuộc quá nhiều vào Trung Quốc, nơi chứng kiến ​​mức thuế quan tiếp tục tăng lên tới mức kỷ lục là 145%.
Ông Trump tạm thời hạ thuế quan đối ứng với Việt Nam và các nước khác xuống 10% trong thời gian tạm dừng 90 ngày Vietnet24h - Tổng thống Hoa Kỳ Donald Trump hôm thứ Tư đã hạ thuế quan "có đi có lại" đối với Việt Nam và các đối tác thương mại khác xuống còn 10 phần trăm trong cái mà ông gọi là tạm dừng kéo dài trong 90 ngày, trong khi tăng thuế đối với Trung Quốc lên 125 phần trăm sau động thái trả đũa của Trung Quốc.
Intel bước vào giai đoạn rủi ro khi tiến hành sản xuất chip quy trình 18A Vietnet24h - Ông Kevin O’Buckley, phó chủ tịch cấp cao của Foundry Services, cho biết tại hội nghị Intel Vision 2025 ngày 1/4 vừa qua rằng Intel đã bước vào sản xuất rủi ro trên quy trình 18A.
Meta phát hành mô hình AI mới Llama 4 Vietnet24h - Meta Platforms đã phát hành phiên bản mới nhất của mô hình ngôn ngữ lớn (LLM) Llama vào thứ Bảy, được gọi là Llama 4 Scout và Llama 4 Maverick.
Cerebras Systems, Ranovus giành được hợp đồng quân sự trị giá 45 triệu đô la của Hoa Kỳ để đẩy nhanh kết nối chip Vietnet24h - Cerebras Systems, một công ty chip AI có trụ sở tại Thung lũng Silicon và công ty khởi nghiệp chip Canada Ranovus cho biết hôm thứ Ba (1/4) rằng, họ đã được quân đội Hoa Kỳ trao hợp đồng trị giá 45 triệu đô la để tăng tốc kết nối giữa các chip điện toán.
iOS 19 lộ diện tại WWDC 2025: Bản cập nhật quan trọng nhất của iPhone Vietnet24h - WWDC 2025 sẽ là nơi Apple chính thức công bố iOS 19 – phiên bản hứa hẹn sẽ thay đổi cách người dùng tương tác với iPhone, với thiết kế trong suốt và tinh tế hơn bao giờ hết.
Công nghệ cấy ghép não được FDA chấp thuận cho Precision Neuroscience Vietnet24h - Precision Neuroscience thông báo rằng một thành phần cốt lõi của hệ thống cấy ghép não đã được Cục Quản lý Thực phẩm và Dược phẩm Hoa Kỳ chấp thuận.
Từ ghi hình kép đến UX sáng tạo: iPhone 17 Pro có thể mở ra chương mới trong thiết kế trải nghiệm Vietnet24h - Không chỉ là tính năng mới, ghi hình kép trên iPhone 17 Pro là phép thử đầu tiên cho cách Apple xây dựng trải nghiệm người dùng kiểu mới – nơi cảm xúc, phản ứng và câu chuyện của người quay trở thành trung tâm của mọi khung hình.
Kim loại lỏng: Apple đang thử nghiệm cho iPhone gập, bền hơn titan 2,5 lần Vietnet24h - Công nghệ bản lề kim loại lỏng có thể giúp iPhone gập không chỉ bền hơn mà còn có thiết kế sang trọng hơn. Liệu đây có phải là bước tiến lớn trong công nghệ smartphone gập?
Apple áp dụng kim loại lỏng cho iPhone gập, mở ra kỷ nguyên mới Vietnet24h - Apple được cho là sẽ sử dụng kim loại lỏng để chế tạo bản lề cho iPhone gập, giúp tăng độ bền và hạn chế nếp gấp màn hình. Công nghệ này có thể tạo ra bước đột phá trên thị trường smartphone gập.
Amazon sẽ mang công nghệ quét lòng bàn tay đến các cơ sở y tế NYU Langone Vietnet24h - Bệnh nhân của NYU Langone Health sẽ có thể đăng ký lịch hẹn bằng Amazon One, công nghệ quét lòng bàn tay của công ty.
Lenovo hé lộ máy tính xách tay màn hình gập chạy bằng năng lượng mặt trời trong khái niệm mới nhất Vietnet24h - Lenovo đã tiết lộ khái niệm Lenovo ThinkBook ‘flip’, một chiếc máy tính xách tay có màn hình có thể gập lại. Khi mở hoàn toàn, toàn màn hình có kích thước 18 inch.
Meta công bố kính thông minh nghiên cứu thử nghiệm Aria Gen 2 Vietnet24h - Meta đã tiết lộ phiên bản mới nhất của loại kính thử nghiệm nhằm hỗ trợ nghiên cứu về trí tuệ nhân tạo, robot và nhận thức của máy móc.
Smartphone gập ba: Samsung chạm đỉnh công nghệ, người dùng chạm đáy túi tiền Vietnet24h - Với tham vọng thay đổi cách người dùng trải nghiệm thiết bị di động, Samsung sắp ra mắt điện thoại gập ba. Dù mang thiết kế tiên phong, giá bán lên đến 2.800 USD sẽ là rào cản lớn để sản phẩm đến tay người dùng đại chúng.
Samsung Display sẽ ra mắt màn hình gập 18,1 inch tại CES Vietnet24h - Samsung Display cho biết hôm Chủ Nhật rằng họ sẽ ra mắt màn hình OLED có thể gập 18,1 inch đầu tiên trên thế giới tại CES 2025, dự kiến ​​sẽ khai mạc vào thứ Ba (7/1) tại Las Vegas.
Khí quyển của TRAPPIST-1: một phát hiện thú vị về sự tồn tại sự sống ngoài trái đất Vietnet24h - TRAPPIST-1b, hành tinh cách Trái đất 40 năm ánh sáng, đã gây bất ngờ khi các nhà khoa học phát hiện rằng nó có khí quyển dày đặc và một lớp sương mù đặc biệt, mở ra triển vọng mới trong nghiên cứu sự sống ngoài hành tinh.