Trí tuệ nhân tạo sẽ là chủ đề trọng tâm tại hội nghị nhà phát triển hàng năm của Google vào thứ Tư tuần này, vì công ty đang lên kế hoạch công bố một số bản cập nhật AI tổng quát, bao gồm tung ra mô hình ngôn ngữ lớn sử dụng chung (LLM).
Theo các tài liệu nội bộ về Google I/O, công ty sẽ tiết lộ PaLM 2, LLM tiên tiến và mới nhất của họ. PaLM 2 bao gồm hơn 100 ngôn ngữ và đang hoạt động với tên mã nội bộ là “Mô hình ngôn ngữ thống nhất”. Nó cũng thực hiện một loạt các bài kiểm tra mã hóa và toán học cũng như các bài kiểm tra và phân tích viết sáng tạo.
Tại sự kiện này, Google sẽ đưa ra các thông báo về chủ đề AI đang “giúp mọi người phát huy hết tiềm năng của họ”, bao gồm cả “trải nghiệm sáng tạo” cho Bard và Tìm kiếm, các tài liệu cho thấy. Pichai sẽ nói chuyện trực tiếp với đám đông các nhà phát triển khi ông giới thiệu về những tiến bộ AI của công ty mình.
Các bản cập nhật được đưa ra khi sự cạnh tranh gia tăng trong cuộc đua của nhánh AI, với việc Google và Microsoft chạy đua để kết hợp công nghệ AI trò chuyện vào các sản phẩm của họ. Microsoft đang sử dụng khoản đầu tư của mình vào OpenAI, người tạo ChatGPT để củng cố công cụ tìm kiếm Bing của mình, trong khi Google đã nhanh chóng huy động để thử và kết hợp công nghệ Bard và LLM của riêng mình trong các nhóm khác nhau.
Google lần đầu tiên công bố mô hình ngôn ngữ PaLM vào tháng 4 năm 2022. Vào tháng 3 năm nay, công ty đã ra mắt API cho PaLM cùng với một số công cụ doanh nghiệp AI mà họ cho biết sẽ giúp các doanh nghiệp “tạo văn bản, hình ảnh, mã, video, âm thanh và nhiều hơn nữa từ những gợi ý bằng ngôn ngữ tự nhiên đơn giản.”
Tháng trước, Google cho biết LLM y tế của họ có tên là “Med-PaLM 2” có thể trả lời các câu hỏi kiểm tra y tế ở “cấp độ bác sĩ chuyên gia” và chính xác 85%.
Google cũng có kế hoạch chia sẻ những tiến bộ cho Bard và Tìm kiếm với “trải nghiệm tổng quát”, bao gồm Bard được sử dụng để viết mã, toán học và “logic” cũng như mở rộng sang các ngôn ngữ Nhật Bản và Hàn Quốc, các tài liệu cho thấy.
Công ty đã làm việc trên một loạt các mô hình Bard mạnh mẽ hơn và chính thức ra mắt công cụ này dưới dạng thử nghiệm vào tháng Ba.
Trong nội bộ, công ty đã làm việc trên một phiên bản đa phương thức có tên là “Multi-Bard”, sử dụng tập dữ liệu lớn hơn và giải các chương trình mã hóa và toán học phức tạp. Công ty cũng đã thử nghiệm các phiên bản có tên là “Big Bard” và “Giant Bard”.
Google cũng có kế hoạch mở rộng “Cộng tác viên trí tuệ nhân tạo trong không gian làm việc”, bao gồm thảo luận về việc tạo mẫu trong Trang tính và tạo hình ảnh trong các sản phẩm Trang trình bày và Meet của mình. Vào tháng 3, công ty cho biết họ sẽ cấp quyền truy cập vào các chức năng AI trong Gmail và Google Docs cho một số lượng nhỏ người dùng như một phần của thử nghiệm, với kế hoạch đưa các tính năng AI tổng quát bổ sung vào các ứng dụng Meet, Sheets và Slides của mình.
Một hình ảnh được báo giới biết được cho thấy, một thanh bên của Trang trình bày có hộp trò chuyện cho phép người dùng nhập văn bản với tùy chọn “tạo” một hình ảnh dựa trên các từ đó.
Các bản cập nhật bổ sung bao gồm các trường hợp sử dụng cho công cụ nhận dạng hình ảnh Google Lens. Công ty sẽ cho thấy những tiến bộ đối với “đa tìm kiếm” cho máy ảnh và giọng nói, sau năm ngoái cho phép người dùng đặt câu hỏi về những gì họ đang xem trong hình ảnh.
Bên ngoài lĩnh vực AI, Google sẽ giới thiệu chiếc điện thoại có thể gập lại mới của mình, Pixel Fold. Công ty tuyên bố Pixel Fold sẽ có “bản lề bền nhất trên điện thoại có thể gập lại” và sẽ cung cấp tùy chọn đổi điện thoại. Google có kế hoạch tiếp thị Pixel Fold dưới dạng chống nước và có kích thước bỏ túi.
Người phát ngôn của Google đã không trả lời ngay lập tức yêu cầu bình luận.