Mới đây, Google cho biết đang lên kế hoạch phát triển trí tuệ nhân tạo (AI) tích hợp 1.000 ngôn ngữ được sử dụng nhiều nhất trên thế giới nhằm cải tiến tính năng dịch thuật.
Google cũng như các đối thủ công nghệ lớn của hãng này đều muốn khai thác thông tin để giúp sản phẩm hoạt động tốt hơn và hữu dụng hơn với nhiều đối tượng nhất có thể.
Nhà nghiên cứu Johan Schalkwyk cho biết, hiện có hơn 7.000 ngôn ngữ trên toàn cầu. Tuy nhiên, Google tới nay mới chỉ cung cấp các bản dịch cho hơn 130 ngôn ngữ. Do đó, công ty này đang nhắm tới việc mở rộng đáng kể chức năng dịch thuật và muốn khai thác dữ liệu trên các ngôn ngữ mới, không chỉ từ các văn bản sẵn có trên Internet mà còn từ video, hình ảnh và các đoạn ghi âm bài phát biểu.
Nhóm nghiên cứu của Google cũng đang nỗ lực tìm cách thu thập các đoạn ghi âm của các ngôn ngữ mà có thể không có nhiều tài liệu văn bản. Công ty này dự kiến sẽ tích hợp những thành tựu phát triển AI nói trên vào các sản phẩm của Google, trong đó bao gồm cả YouTube và Google Dịch.
Trước đó, tại sự kiện Search On 2022, Google đã cho thấy sự tiến bộ của trí tuệ nhân tạo (AI) một lần nữa giúp Google cải tiến các sản phẩm của mình. "Gã khổng lồ" này khẳng định, không còn đơn thuần là một thanh tìm kiếm, Google đã sáng tạo ra một công cụ vận hành đa chiều như bộ não của con người.
Google đã nỗ lực để hiện thực hóa việc “phiên dịch” hình ảnh trên Google Ống kính với sự tiến bộ của trí tuệ nhân tạo AI.
Hiện, người dùng đang sử dụng Google để phiên dịch văn bản trên hình ảnh hơn 1 tỉ lần mỗi tháng với hơn 100 ngôn ngữ khác nhau, để có thể đọc thông tin ở mặt tiền cửa hàng, menu, bảng hiệu,... Nhưng đôi khi, ý nghĩa lại thay đổi tùy thuộc vào ngôn ngữ và ngữ cảnh sử dụng.
Thay vì chỉ đơn thuần che đi văn bản gốc, Google đã có thể tái tạo các điểm ảnh nhằm cho ra một hình nền khớp với nguyên bản, và đặt bản phiên dịch lên phần hình nền đó để cho ra một giao diện trông tự nhiên hơn thông qua công nghệ máy học (machine learning) có tên là mạng đối nghịch tạo sinh (Generative Adversarial Networks - còn được biết đến là GANs).
Ví dụ: Nếu người dùng đưa máy ảnh đến một tạp chí ở ngôn ngữ khác, họ sẽ thấy phần văn bản được dịch đặt trên một ảnh nền phía sau.