Trong năm qua, Google và Meta cũng đã phát hành các sản phẩm phần cứng có khả năng dịch thuật thời gian thực.
Điện thoại Pixel 10 của Google có khả năng dịch những gì người nói đang nói sang ngôn ngữ của người nghe trong các cuộc gọi điện thoại. Tính năng này, được gọi là Voice Translate, được thiết kế để giữ nguyên ngữ điệu giọng nói của người nói. Voice Translate sẽ bắt đầu xuất hiện trên điện thoại của mọi người thông qua bản cập nhật phần mềm vào thứ Hai.
Trong bản demo trực tiếp của Google vào tháng 8, Voice Translate đã có thể dịch một câu của nghệ sĩ giải trí Jimmy Fallon sang tiếng Tây Ban Nha, và nó thực sự nghe giống như diễn viên hài. Tính năng của Apple không cố gắng bắt chước giọng nói của người dùng.
Trong khi đó, vào tháng 5, Meta đã công bố rằng kính Ray-Ban Meta của họ sẽ có thể dịch những gì người dùng đang nói bằng ngôn ngữ khác bằng loa của thiết bị, và người kia trong cuộc trò chuyện sẽ có thể xem các câu trả lời đã dịch được ghi lại trên điện thoại của người dùng.
Meta sẽ tổ chức buổi giới thiệu sản phẩm riêng vào thứ Tư, dự kiến công ty sẽ công bố thế hệ kính thông minh tiếp theo, với màn hình nhỏ trên một trong hai tròng kính, theo CNBC đưa tin hồi tháng 8. Hiện chưa rõ liệu Meta có công bố thêm các tính năng dịch thuật hay không.
Vào tháng 6, OpenAI đã giới thiệu chế độ trợ lý giọng nói thông minh cho ChatGPT, trong đó có tính năng dịch thuật mượt mà được tích hợp sẵn. ChatGPT được tích hợp với Siri của Apple, nhưng không ở chế độ giọng nói. OpenAI đang có kế hoạch phát hành các sản phẩm phần cứng mới cùng với cựu chuyên gia thiết kế Jony Ive của Apple trong những năm tới.
Sự trỗi dậy của dịch thuật trực tiếp cũng có thể định hình lại toàn bộ ngành công nghiệp. Biên dịch viên và phiên dịch viên là loại công việc bị đe dọa số 1 bởi AI, và 98% hoạt động công việc của biên dịch viên trùng lặp với những gì AI có thể làm, theo một nghiên cứu của Microsoft Research được công bố vào tháng 8.
Biên dịch viên chuyên dụng
Trong vài năm qua, một số thiết bị biên dịch chuyên dụng đã gia nhập thị trường, tận dụng dịch vụ di động tốc độ cao toàn cầu và cải thiện các dịch vụ biên dịch trực tuyến để tạo ra các thiết bị hoặc tai nghe dạng đĩa tích hợp tính năng dịch thuật với giá vài trăm đô la.
“Điều tôi thích ở những gì Apple đang làm là nó thực sự làm sáng tỏ mức độ cấp bách của vấn đề này”, Joe Miller, tổng giám đốc Pocketalk tại Nhật Bản, cho biết. Pocketalk là công ty sản xuất thiết bị phiên dịch trị giá 249 đô la, có thể giao tiếp giữa hai người nói hai ngôn ngữ khác nhau và dịch cuộc trò chuyện của họ sang âm thanh và văn bản.
Theo Canalys, chỉ riêng trong quý đầu tiên, Apple đã xuất xưởng khoảng 18 triệu bộ tai nghe không dây, do đó việc công ty gia nhập thị trường này sẽ giúp nhiều khách hàng hơn được tiếp cận với những cải tiến mà công nghệ dịch thuật đã đạt được trong những năm gần đây.
Mặc dù Apple đã gia nhập thị trường, các nhà sản xuất thiết bị chuyên dụng cho biết việc họ tập trung vào độ chính xác và kiến thức về ngôn ngữ học sẽ mang lại bản dịch tốt hơn so với những gì có sẵn miễn phí trên điện thoại mới.
“Chúng tôi thực sự đã thuê các nhà ngôn ngữ học”, Aleksander Alski, giám đốc Vasco Electronics tại Ba Lan, cho biết. Công ty này đã phát hành tai nghe phiên dịch có tên E1 vào tháng 1 và đang lên kế hoạch cho một mẫu tai nghe sắp ra mắt có thể bắt chước giọng nói của người dùng, giống như tính năng của Google. "Chúng tôi đã kết hợp AI với dữ liệu đầu vào của con người, và nhờ đó, chúng tôi có thể đảm bảo độ chính xác cao hơn nhiều trên tất cả các ngôn ngữ mà chúng tôi cung cấp."
Ngoài ra còn có lợi thế sân nhà. Thị trường lớn nhất của Vasco Electronics là Châu Âu, và tính năng Dịch trực tiếp của Apple hiện chưa khả dụng cho người dùng EU, Apple cho biết trên trang web của mình.
Một số sản phẩm do các công ty công nghệ giới thiệu chưa thực sự phổ biến và hiện chỉ giới hạn ở một số ít ngôn ngữ. Tính năng của Apple chỉ khả dụng ở năm ngôn ngữ, so với 95 ngôn ngữ của Pocketalk.
Miller của Pocketalk tin rằng tiềm năng của công nghệ này vượt xa việc một khách du lịch gọi một ly rượu vang ở Pháp. Ông nói rằng nó mạnh mẽ nhất khi được sử dụng tại các nơi làm việc như trường học và bệnh viện, nơi đòi hỏi các tính năng riêng tư và bảo mật vượt xa những gì Apple và Google cung cấp.
"Đây không phải là về du lịch và du lịch hạng sang," Miller nói. "Đây là về sự giao thoa giữa ngôn ngữ và sự bất đồng, khi cần phải có một cuộc thảo luận."
Apple đã không trả lời yêu cầu bình luận.