Google đang ra mắt mô hình trí tuệ nhân tạo mới nhất của mình, Gemini 3, trong bối cảnh gã khổng lồ tìm kiếm đang chạy đua để bắt kịp OpenAI, công ty sáng tạo ra ChatGPT.
Mô hình AI mới sẽ cho phép người dùng nhận được câu trả lời tốt hơn cho những câu hỏi phức tạp hơn, "để bạn nhận được những gì mình cần mà không cần phải nhắc nhở nhiều", CEO của Alphabet, Sundar Pichai, cho biết trong một trong nhiều bài đăng trên blog mà Google công bố hôm thứ Ba (18/11).
Gemini 3 sẽ được tích hợp vào ứng dụng Gemini, các sản phẩm tìm kiếm AI của Google là AI Mode và AI Overviews, cũng như các sản phẩm doanh nghiệp. Việc triển khai bắt đầu vào thứ Ba cho một số thuê bao được chọn và sẽ được triển khai rộng rãi hơn trong những tuần tới.
Thông báo này được đưa ra khoảng tám tháng sau khi Google giới thiệu Gemini 2.5 và 11 tháng sau Gemini 2.0. OpenAI, công ty đã khởi động sự bùng nổ của AI tạo sinh vào cuối năm 2022 với việc ra mắt công khai ChatGPT, đã giới thiệu GPT-5 vào tháng 8.
"Thật đáng kinh ngạc khi chỉ trong hai năm, AI đã phát triển từ việc chỉ đọc văn bản và hình ảnh sang đọc được không gian", Pichai viết trong một bài đăng hôm thứ Ba. “Bắt đầu từ hôm nay, chúng tôi sẽ triển khai Gemini ở quy mô của Google.”
Công ty cho biết ứng dụng Gemini hiện có 650 triệu người dùng hoạt động hàng tháng và AI Overviews có 2 tỷ người dùng hàng tháng. Vào tháng 8, OpenAI cho biết ChatGPT đã đạt 700 triệu người dùng hàng tuần.
Pichhai nói thêm rằng mô hình mới nhất được “xây dựng để nắm bắt chiều sâu và sắc thái”, và Gemini 3 cũng “tốt hơn nhiều trong việc xác định ngữ cảnh và ý định đằng sau yêu cầu của bạn, do đó bạn nhận được những gì mình cần mà không cần nhắc nhở nhiều”. Công ty cho biết các mô hình AI khác của Google vẫn có thể được sử dụng cho các tác vụ đơn giản hơn.
Alphabet và các đối thủ vốn hóa lớn đang chi mạnh tay để xây dựng cơ sở hạ tầng cho việc phát triển AI và nhanh chóng tạo ra nhiều dịch vụ hơn cho người tiêu dùng và doanh nghiệp. Trong báo cáo thu nhập tháng trước, Alphabet, Meta, Microsoft và Amazon đều đã nâng dự báo chi tiêu vốn và cùng kỳ vọng con số này sẽ đạt hơn 380 tỷ đô la trong năm nay.
Google cho biết phản hồi AI được hỗ trợ bởi Gemini 3 sẽ "thay thế những lời sáo rỗng và nịnh hót bằng những hiểu biết sâu sắc thực sự — nói cho bạn biết những gì bạn cần nghe, chứ không phải những gì bạn muốn nghe", theo tuyên bố từ Demis Hassabis, CEO của đơn vị AI DeepMind thuộc Google. Các nhà phê bình trong ngành đã nói rằng các chatbot AI ngày nay quá nịnh hót.
Tuần trước, OpenAI đã phát hành hai bản cập nhật cho GPT-5. Một bản cập nhật "ấm áp hơn, thông minh hơn và làm theo hướng dẫn của bạn tốt hơn", công ty cho biết, và bản cập nhật còn lại "nhanh hơn trong các tác vụ đơn giản, kiên trì hơn trong các tác vụ phức tạp".
Google cũng đã công bố một nền tảng đại lý mới mang tên "Google Antigravity", cho phép các nhà phát triển lập trình "ở cấp độ cao hơn, hướng đến nhiệm vụ".
Gemini 3 là "mô hình lập trình rung cảm tốt nhất từ trước đến nay" của công ty, Josh Woodward, phó chủ tịch Google Labs và Gemini, phát biểu với các phóng viên trong một cuộc họp báo. Lập trình rung cảm đề cập đến một thị trường công cụ đang nổi lên nhanh chóng, cho phép các nhà phát triển phần mềm tạo mã bằng lời nhắc.
Google cho biết mô hình mới sẽ cho phép "giao diện sinh sản", cung cấp một số câu trả lời nhất định theo cách tương tự như một tạp chí kỹ thuật số. Ví dụ, công ty đã yêu cầu Gemini "giải thích Phòng trưng bày Van Gogh với bối cảnh cuộc sống cho mỗi tác phẩm". Kết quả là một lời giải thích đầy màu sắc, dựa trên hình ảnh cho mỗi bức tranh.
Trong Chế độ AI, Gemini 3 trước tiên sẽ có sẵn cho các thuê bao trả phí. Nó sẽ có thể phân tích câu hỏi và tạo bố cục với các yếu tố trực quan như hình ảnh, bảng biểu và lưới. Google cho biết họ có thể tạo một máy tính tương tác được xây dựng riêng hoặc một mô phỏng tương tác về một bài toán vật lý phức tạp.
Các nhà phát triển sẽ có thể truy cập API Gemini và các doanh nghiệp sẽ có thể tích hợp nó thông qua Vertex AI, dịch vụ đám mây của Google được thiết kế để xây dựng, triển khai và quản lý các mô hình AI.
Đối với khách hàng doanh nghiệp, Gemini 3 có thể thực hiện các tác vụ như tạo tài liệu hướng dẫn và đào tạo nhân viên, phân tích video và hình ảnh nhà máy chính xác hơn, cũng như xử lý việc mua sắm, công ty cho biết.