Gemini ban đầu dự kiến diễn ra tuần tới tại bang New York, Washington và California (Mỹ), nhưng đã được Google lùi lại một cách lặng lẽ vào đầu năm 2024 vì lo ngại mô hình AI mới họat động không đáng tin cậy khi phản hồi một số yêu cầu và thắc mắc bằng ngôn ngữ không phải tiếng Anh.
Đại diện của Google không trả lời ngay lập tức khi trang Insider đề nghị bình luận.
Gemini là mô hình trí tuệ nhân tạo đa phương thức do bộ phận Google DeepMind nghiên cứu và phát triển, được đề cập lần đầu hồi tháng 5 tại sự kiện thường niên Google I/O 2023.
Được mô tả là thế hệ tiếp theo của AI và đa phương thức, Gemini có thể xử lý nhiều loại dữ liệu và khả năng hiểu, tạo ra văn bản và hình ảnh cũng như các loại nội dung khác dựa trên bản phác thảo...
Dù vẫn chưa trình làng để người dùng sử dụng rộng rãi, Gemini được cho có hiệu suất vượt trội GPT-4 của OpenAI vì khai thác sức mạnh tính toán lớn hơn rất nhiều.
Sissie Hsiao, Phó chủ tịch Google quản lý Bard và Google Assistant, từng nói về Gemini: “Tôi đã thấy một số điều rất tuyệt vời. Ví dụ, tôi đang cố nướng một chiếc bánh và nói ‘hãy vẽ cho tôi 3 bức tranh về cách trang trí bánh ba tầng’. Gemini sẽ tạo ra những hình ảnh đó thực sự. Đây là những bức tranh hoàn toàn mới lạ, không phải từ internet. Nó có thể giao tiếp bằng hình ảnh với con người ngay bây giờ, không chỉ là văn bản".
Gemini được xem là dự án đầy tham vọng của Google và hoạt động tương tự mô hình GPT-4 hiện có trên ChatGPT. Sau khi trải nghiệm, Gemini được đánh giá là có một số điểm mạnh hơn GPT-4 vì tận dụng lượng dữ liệu lớn từ dịch vụ như Google Translate, Google Maps, Google Search... có được từ các sản phẩm của công ty thay vì dữ liệu thuần thu thập từ Internet. Điều này cho phép chatbot này có thể hiểu chính xác hơn ý định của người dùng.
Ngoài ra, chatbot này đã giải quyết được một hạn chế lớn của trí tuệ nhân tạo tạo sinh khi ít đưa ra các câu trả lời sai.
Trước đó, Google cho biết Gemini "sở hữu khả năng xử lý thông tin đa phương thức ấn tượng chưa từng có trên các mô hình trước đó, đạt hiệu quả cao trong việc tích hợp vào công cụ và giao diện lập trình ứng dụng (API), mở ra những đổi mới trong tương lai". Google cũng dự kiến tạo ra nhiều bản Gemini để đưa lên các dịch vụ của hãng như Bard, Search và Workspace cũng như bản di động có tên Gecko.
Theo mô tả của Google, Gemini lấy cảm hứng từ một chương trình máy tính chơi cờ vây AlphaGo. Đây là trí tuệ nhân tạo đầu tiên đánh bại ông Lee Sedol, một trong những kỳ thủ cờ vây vô địch thế giới vào năm 2016.
Chuyên gia Demis Hassabis chia sẻ với tờ Wired: "Có thể hình dung Gemini là sự kết hợp một số điểm mạnh của hệ thống AlphaGo với khả năng ngôn ngữ tuyệt vời của các mô hình lớn".
Mặc dù Google đã có mô hình AI tạo sinh - Bard, nhưng đến nay ChatGPT vẫn thu hút nhiều người tiêu dùng hơn. Tuy nhiên, các nhà phân tích cho rằng điều đó có thể thay đổi khi Gemini ra mắt.
Hai chuyên gia Dylan Patel và Daniel Nishball tại công ty nghiên cứu SemiAnalysis nhận định: "Gemini có thể nuốt trọn cả thế giới, đánh bại GPT-4 bằng sức mạnh gấp 5 lần vì đòi hỏi ít bộ xử lý đồ họa (GPU) hơn".