OpenAI tuyên bố sẽ loại bỏ một trong những giọng nói ChatGPT có tên “Sky” sau khi nó gây ra tranh cãi vì nó giống với giọng của nữ diễn viên Scarlett Johansson trong “Her”, một bộ phim về trí tuệ nhân tạo.
“Chúng tôi đã nghe thấy các câu hỏi về cách chúng tôi chọn giọng nói trong ChatGPT, đặc biệt là Sky,” công ty được Microsoft hậu thuẫn đã đăng trên X. “Chúng tôi đang nỗ lực tạm dừng việc sử dụng Sky trong khi giải quyết các vấn đề đó.”
Bộ phim khoa học viễn tưởng Her năm 2013 kể về một người đàn ông yêu hệ thống trí tuệ nhân tạo tên Samantha, do Johansson lồng tiếng.
Tin tức này xuất hiện một tuần sau khi OpenAI ra mắt một loạt giọng nói âm thanh cho ChatGPT, chatbot lan truyền của nó, một mô hình AI mới có tên GPT-4o và phiên bản ChatGPT dành cho máy tính để bàn.
Người dùng xem buổi trình diễn trực tiếp khả năng âm thanh của ChatGPT ngay lập tức bắt đầu đăng lên mạng xã hội rằng giọng nói của “Sky” nghe giống Johansson trong phim. Giám đốc điều hành OpenAI Sam Altman dường như đã đề cập đến bộ phim trong một bài đăng trên X, chỉ viết đơn giản là “cô ấy”.
Trong một bài đăng trên blog vào Chủ nhật, OpenAI đã viết rằng năm giọng nói của chatbot – Breeze, Cove, Ember, Juniper và Sky – đã được chọn thông qua quá trình tuyển chọn và ghi âm kéo dài 5 tháng. Theo công ty, các chuyên gia casting đã nhận được khoảng 400 bài gửi từ các diễn viên lồng tiếng và màn ảnh và giảm con số đó xuống còn 14. Sau đó, một nhóm nội bộ đã chọn ra năm người cuối cùng.
Công ty viết: “Giọng của Sky không phải là bắt chước của Scarlett Johansson mà thuộc về một nữ diễn viên chuyên nghiệp khác sử dụng giọng nói tự nhiên của chính cô ấy”. “Để bảo vệ quyền riêng tư của họ, chúng tôi không thể chia sẻ tên của những tài năng lồng tiếng của mình.”
OpenAI có kế hoạch thử nghiệm Chế độ giọng nói trong những tuần tới, với quyền truy cập sớm vào ChatGPT Plus cho những người đăng ký trả phí, theo các bài đăng trên blog gần đây và họ cũng có kế hoạch bổ sung thêm giọng nói mới. OpenAI cũng cho biết mô hình mới có thể phản hồi lời nhắc bằng âm thanh của người dùng “chỉ trong 232 mili giây, trung bình là 320 mili giây, tương tự như thời gian phản hồi của con người trong một cuộc trò chuyện”.
Công ty, được thành lập vào năm 2015, đã được các nhà đầu tư định giá hơn 80 tỷ USD. Nó đang chịu áp lực phải dẫn đầu thị trường AI sáng tạo trong khi tìm cách kiếm tiền khi chi số tiền lớn vào bộ xử lý và cơ sở hạ tầng để xây dựng và đào tạo các mô hình của mình.
OpenAI, Microsoft và Google đang dẫn đầu cơn sốt vàng AI khi các công ty dường như trong mọi ngành chạy đua bổ sung các chatbot và đại lý hỗ trợ AI để tránh bị các đối thủ cạnh tranh bỏ lại phía sau. Đầu tháng này, đối thủ của OpenAI là Anthropic đã công bố sản phẩm đầu tiên dành cho doanh nghiệp và một ứng dụng iPhone miễn phí.
Theo PitchBook, kỷ lục 29,1 tỷ USD đã được đầu tư vào gần 700 thương vụ AI sáng tạo vào năm 2023, tăng hơn 260% so với năm trước. Thị trường được dự đoán sẽ đạt doanh thu 1 nghìn tỷ USD trong vòng một thập kỷ.
Trong buổi thuyết trình trực tiếp tuần trước, các thành viên nhóm OpenAI đã trình diễn khả năng âm thanh của ChatGPT. Ví dụ: chatbot được yêu cầu giúp ai đó bình tĩnh trước bài phát biểu trước công chúng.
Nhà nghiên cứu Mark Chen của OpenAI đã chứng minh khả năng kể chuyện trước khi đi ngủ của mô hình và yêu cầu nó thay đổi giọng nói để kịch tính hơn hoặc giống robot hơn. Anh ấy thậm chí còn yêu cầu nó hát câu chuyện. Nhóm cũng yêu cầu nó phân tích nét mặt của người dùng để nhận xét về những cảm xúc mà người đó có thể đang trải qua.
“Này, có chuyện gì vậy? Làm thế nào tôi có thể làm cho ngày hôm nay của bạn tươi sáng hơn?” Chế độ âm thanh của ChatGPT cho biết khi người dùng chào nó.