Google hôm thứ Ba đã tổ chức hội nghị nhà phát triển I/O thường niên và giới thiệu một loạt sản phẩm trí tuệ nhân tạo, từ các tính năng tìm kiếm và trò chuyện mới đến phần cứng AI dành cho khách hàng trên nền tảng đám mây. Các thông báo nhấn mạnh sự tập trung của công ty vào AI khi nó chống lại các đối thủ cạnh tranh, chẳng hạn như OpenAI.
Nhiều tính năng hoặc công cụ mà Google tiết lộ chỉ đang trong giai đoạn thử nghiệm hoặc giới hạn cho các nhà phát triển, nhưng chúng đưa ra ý tưởng về cách gã khổng lồ công nghệ đang nghĩ về AI và nơi họ đang đầu tư. Google kiếm tiền từ AI bằng cách tính phí các nhà phát triển sử dụng mô hình của mình và từ những khách hàng trả tiền cho Gemini Advanced, đối thủ cạnh tranh của nó với ChatGPT, có giá 19,99 USD mỗi tháng và có thể giúp người dùng tóm tắt các tệp PDF, Google Docs, v.v.
Thông báo hôm thứ Ba diễn ra sau các sự kiện tương tự do các đối thủ cạnh tranh AI tổ chức. Đầu tháng này, Amazon
Anthropic được hỗ trợ đã công bố sản phẩm đầu tiên dành cho doanh nghiệp và một ứng dụng iPhone miễn phí. Trong khi đó, OpenAI hôm thứ Hai đã ra mắt mô hình AI mới và phiên bản ChatGPT dành cho máy tính để bàn, cùng với giao diện người dùng mới.
Đây là những gì Google đã công bố:
Cập nhật AI của Gemini
Google đã giới thiệu các bản cập nhật cho Gemini 1.5 Pro, mô hình AI của họ sẽ sớm có thể xử lý nhiều dữ liệu hơn nữa - ví dụ: công cụ này có thể tóm tắt 1.500 trang văn bản do người dùng tải lên.
Ngoài ra còn có mô hình Gemini 1.5 Flash AI mới mà công ty cho biết là tiết kiệm chi phí hơn và được thiết kế cho các tác vụ nhỏ hơn như tóm tắt nhanh các cuộc hội thoại, tạo chú thích cho hình ảnh và video cũng như lấy dữ liệu từ các tài liệu lớn.
Giám đốc điều hành Google Sundar Pichai nhấn mạnh những cải tiến đối với bản dịch của Gemini, đồng thời nói thêm rằng nó sẽ có sẵn cho tất cả các nhà phát triển trên toàn thế giới bằng 35 ngôn ngữ. Pichai cho biết trong Gmail, Gemini 1.5 Pro sẽ phân tích các tệp PDF và video đính kèm, đưa ra các bản tóm tắt và hơn thế nữa. Điều đó có nghĩa là nếu bạn bỏ lỡ một chuỗi email dài trong kỳ nghỉ, Gemini sẽ có thể tóm tắt nó cùng với bất kỳ tệp đính kèm nào.
Các bản cập nhật mới của Gemini cũng hữu ích cho việc tìm kiếm Gmail. Một ví dụ mà công ty đưa ra: Nếu bạn đang so sánh giá từ các nhà thầu khác nhau để sửa mái nhà của mình và đang tìm bản tóm tắt để giúp bạn quyết định chọn ai, Gemini có thể gửi lại ba báo giá cùng với ngày bắt đầu dự kiến được cung cấp trong email khác chủ đề.
Google cho biết Gemini cuối cùng sẽ thay thế Google Assistant trên điện thoại Android, cho thấy đây sẽ là đối thủ cạnh tranh mạnh mẽ hơn với Siri của Apple trên iPhone.
Tổng quan về Google Veo, Imagen 3 và Audio
Google đã công bố “Veo”, mô hình mới nhất để tạo video độ phân giải cao và Imagen 3, mô hình chuyển văn bản thành hình ảnh chất lượng cao nhất, hứa hẹn những hình ảnh sống động như thật và “ít tạo tác hình ảnh gây mất tập trung hơn so với các mô hình trước đây của chúng tôi”.
Các công cụ này sẽ có sẵn cho một số người sáng tạo được chọn vào thứ Hai và sẽ có mặt trên Vertex AI, nền tảng máy học của Google cho phép các nhà phát triển đào tạo và triển khai các ứng dụng AI.
Công ty cũng giới thiệu “Tổng quan về âm thanh”, khả năng tạo các cuộc thảo luận bằng âm thanh dựa trên dữ liệu nhập văn bản. Ví dụ: nếu người dùng tải giáo án lên, chatbot có thể nói tóm tắt về giáo án đó. Hoặc, nếu bạn yêu cầu một ví dụ về một vấn đề khoa học trong đời thực, nó có thể thực hiện điều đó thông qua âm thanh tương tác.
Ngoài ra, công ty cũng giới thiệu “AI Sandbox”, một loạt công cụ AI tổng hợp để tạo nhạc và âm thanh từ đầu, dựa trên lời nhắc của người dùng.
Tuy nhiên, các công cụ AI sáng tạo như chatbot và người tạo hình ảnh tiếp tục gặp vấn đề về độ chính xác.
Ông trùm tìm kiếm của Google, Prabhakar Raghavan, đã nói với các nhân viên vào tháng trước rằng các đối thủ cạnh tranh “có thể có một gizmo mới ngoài kia mà mọi người thích chơi, nhưng họ vẫn đến Google để xác minh những gì họ thấy ở đó vì đó là nguồn đáng tin cậy và nó trở nên quan trọng hơn.” trong thời đại AI sáng tạo này.”
Đầu năm nay, Google đã giới thiệu trình tạo hình ảnh do Gemini cung cấp. Người dùng đã phát hiện ra những điểm không chính xác trong lịch sử đã lan truyền trực tuyến và công ty đã rút lại tính năng này và cho biết họ sẽ khởi chạy lại tính năng này trong những tuần tới. Tính năng này vẫn chưa được phát hành lại.
Tính năng tìm kiếm mới
Theo Liz Reid, người đứng đầu Google Tìm kiếm, gã khổng lồ công nghệ sẽ ra mắt “Tổng quan về AI” trong Google Tìm kiếm vào thứ Hai tại Hoa Kỳ. Tổng quan về AI hiển thị bản tóm tắt nhanh các câu trả lời cho các câu hỏi tìm kiếm phức tạp nhất. Ví dụ: nếu người dùng tìm kiếm cách tốt nhất để làm sạch ủng da, trang kết quả có thể hiển thị “Tổng quan về AI” ở trên cùng với quy trình làm sạch gồm nhiều bước, được thu thập từ thông tin được tổng hợp trên web.
Công ty cho biết họ có kế hoạch giới thiệu trực tiếp khả năng lập kế hoạch giống như trợ lý trong tìm kiếm. Nó giải thích rằng người dùng sẽ có thể tìm kiếm những nội dung như "'Tạo kế hoạch bữa ăn 3 ngày cho một nhóm dễ chuẩn bị'" và bạn sẽ có điểm khởi đầu với nhiều công thức nấu ăn từ khắp nơi trên web .
Theo tiến trình cung cấp “đa phương thức” hoặc tích hợp nhiều hình ảnh và video hơn trong các công cụ AI tổng hợp, Google cho biết họ sẽ bắt đầu thử nghiệm khả năng người dùng đặt câu hỏi thông qua video, chẳng hạn như quay phim một vấn đề với sản phẩm họ sở hữu, tải lên nó và yêu cầu công cụ tìm kiếm tìm ra vấn đề. Trong một ví dụ, Google chiếu cảnh một người quay phim một máy ghi âm bị hỏng và hỏi tại sao nó không hoạt động. Google Tìm kiếm đã tìm thấy kiểu máy ghi âm và cho rằng nó có thể bị trục trặc do không được cân bằng đúng cách.
Một tính năng mới khác đang được thử nghiệm có tên là “AI Teammate”, sẽ tích hợp vào Google Workspace của người dùng. Nó có thể xây dựng một bộ sưu tập tác phẩm có thể tìm kiếm được từ các tin nhắn và chuỗi email với nhiều tệp PDF và tài liệu hơn. Ví dụ: một người sắp sáng lập có thể hỏi Đồng đội AI: "Chúng ta đã sẵn sàng ra mắt chưa?" và trợ lý sẽ cung cấp bản phân tích và tóm tắt dựa trên thông tin mà trợ lý có thể truy cập trong Gmail, Google Tài liệu và các ứng dụng Workspace khác.
Dự án Astra
Project Astra là tiến bộ mới nhất của Google đối với trợ lý AI đang được đơn vị DeepMind AI của Google xây dựng. Hiện tại nó chỉ là nguyên mẫu, nhưng bạn có thể coi đây là mục đích của Google để phát triển phiên bản J.A.R.V.I.S. của riêng mình, trợ lý AI toàn năng của Tony Stark từ Vũ trụ Marvel.
Trong video demo được trình bày tại Google I/O, trợ lý – thông qua video và âm thanh, thay vì giao diện chatbot – có thể giúp người dùng nhớ nơi họ để kính, xem lại mã và trả lời các câu hỏi về một phần nhất định của một sản phẩm. loa được gọi khi loa đó được hiển thị trên video.
Google cho biết một chatbot thực sự hữu ích cần phải cho phép người dùng “nói chuyện với nó một cách tự nhiên và không bị trễ hay chậm trễ”. Cuộc trò chuyện trong video demo diễn ra trong thời gian thực, không có độ trễ. Bản demo tiếp nối buổi giới thiệu thứ Hai của OpenAI về cuộc trò chuyện qua lại bằng âm thanh tương tự với ChatGPT.
Giám đốc điều hành DeepMind Demis Hassabis cho biết trên sân khấu rằng “việc giảm thời gian phản hồi cho nội dung trò chuyện là một thách thức kỹ thuật khó khăn”.
Pichai cho biết ông hy vọng Project Astra sẽ ra mắt ở Gemini vào cuối năm nay.
Phần cứng AI
Google cũng đã công bố Trillium, bộ xử lý TPU hay còn gọi là bộ xử lý tensor thế hệ thứ sáu – một phần cứng không thể thiếu để chạy các hoạt động AI phức tạp – sẽ có sẵn cho khách hàng trên nền tảng đám mây vào cuối năm 2024.
TPU không nhằm mục đích cạnh tranh với các chip khác, như bộ xử lý đồ họa của Nvidia. Ví dụ: Pichai đã lưu ý trong I/O rằng Google Cloud sẽ bắt đầu cung cấp GPU Blackwell của Nvidia vào đầu năm 2025.
Nvidia cho biết vào tháng 3 rằng Google sẽ sử dụng nền tảng Blackwell cho “nhiều hoạt động triển khai nội bộ khác nhau và sẽ là một trong những nhà cung cấp đám mây đầu tiên cung cấp các phiên bản được hỗ trợ bởi Blackwell” và việc truy cập vào hệ thống của Nvidia sẽ giúp Google cung cấp các công cụ quy mô lớn cho doanh nghiệp. các nhà phát triển xây dựng các mô hình ngôn ngữ lớn.
Trong bài phát biểu của mình, Pichai nhấn mạnh “mối quan hệ đối tác lâu dài của Google với Nvidia”. Các công ty đã làm việc cùng nhau trong hơn một thập kỷ và Pichai trước đây đã nói rằng ông hy vọng họ vẫn sẽ làm việc như vậy trong một thập kỷ kể từ bây giờ.