Trong bản cập nhật này, Visual Intelligence được mô tả như một hệ thống trí tuệ nhân tạo đa phương thức, có khả năng nhận diện và tạo ra hình ảnh, video cũng như văn bản. Người dùng có thể dễ dàng trải nghiệm tính năng này thông qua nút Camera Control. Khi nhấn và giữ nút, người dùng sẽ thấy hướng dẫn chi tiết, đồng thời có thể sử dụng camera để nhận diện và tìm hiểu thông tin về các đối tượng mà họ hướng đến.
Sau khi chụp ảnh, người dùng chỉ cần chạm vào màn hình để đặt câu hỏi cho ChatGPT về hình ảnh đó hoặc tìm kiếm thông tin trên Google. Đáng chú ý, không cần thiết phải có tài khoản ChatGPT, và các lệnh truy vấn sẽ hoạt động ẩn danh, không được sử dụng để đào tạo mô hình AI.
Visual Intelligence hoạt động bằng cách chuyển tiếp các yêu cầu từ Siri đến ChatGPT hoặc Google, đồng thời cung cấp thông tin tùy chỉnh dựa trên chủ thể mà camera chĩa vào. Ví dụ, khi hướng camera về một cửa hàng hoặc nhà hàng, màn hình sẽ tự động hiển thị thông tin về giờ mở cửa, thực đơn, các món ăn phổ biến, cũng như các thông tin liên lạc khác.
Theo nhận định từ Cnet, tính năng xem giờ mở cửa là một trong những điểm mạnh nhất của Visual Intelligence. Ngoài việc hiển thị giờ mở cửa, nó còn cho phép người dùng biết về các món ăn được ưa chuộng, trang web của nhà hàng và số điện thoại liên hệ. Thực tế, khi thử nghiệm tại một cửa hàng game, Visual Intelligence đã gợi ý những trò chơi bán chạy cùng các thiết bị chơi game tương thích, cho thấy sự linh hoạt và chính xác của nó.
Một số trang công nghệ như TechRadar cũng nhận xét rằng tính năng này thực sự có tiềm năng lớn. Họ đã thử nghiệm với một con chó và nhận được kết quả chính xác về giống chó, minh chứng cho khả năng nhận diện hình ảnh của Visual Intelligence.
Tuy nhiên, không phải tất cả đều hào hứng với Visual Intelligence. Phone Arena cho rằng tính năng này chỉ đơn thuần là một lệnh gọi API tới Google hoặc ChatGPT, và không tạo ra sự khác biệt rõ rệt. Họ lo ngại rằng chức năng tìm kiếm hình ảnh đã được nhiều thiết bị khác thực hiện từ lâu, và điều này có thể khiến Visual Intelligence không thu hút được người dùng phổ thông.
The Verge cũng đã chỉ ra rằng Visual Intelligence có thể mắc phải những cạm bẫy thường gặp của các chatbot AI. Khi yêu cầu giải thích một trò đùa trong truyện tranh Garfield, AI này đã bịa ra những chi tiết không có trong tài liệu gốc.
Bản thử nghiệm iOS 18.2 beta 1 không chỉ dừng lại ở Visual Intelligence, mà còn giới thiệu nhiều tính năng hấp dẫn khác như Image Playground để tạo ảnh vui nhộn, Genmoji để tạo biểu tượng cảm xúc, và Image Wand giúp biến bản phác thảo thành hình ảnh thực tế. Theo Mark Gurman từ Bloomberg, iOS 18.2 dự kiến sẽ được triển khai vào tháng 12 tới.
Bản cập nhật này mang đến nhiều hứa hẹn cho người dùng iPhone, đặc biệt với các mẫu iPhone 15 Pro, 15 Pro Max và thế hệ iPhone 16, khi tích hợp các tính năng trí tuệ nhân tạo tiên tiến, mở ra một kỷ nguyên mới cho trải nghiệm sử dụng thiết bị di động.