Theo thông tin từ OpenAI, GPT-4o mini được mô tả là "mô hình nhỏ gọn với hiệu suất và chi phí hiệu quả nhất hiện nay". Đặc biệt, công ty dự định sẽ tích hợp thêm các tính năng hỗ trợ hình ảnh, video và âm thanh trong tương lai gần, nhằm nâng cao khả năng đa phương thức của công cụ AI này.
Brad Lightcap, giám đốc của OpenAI, chia sẻ với CNBC: "Thế giới vốn đa phương thức. Chúng ta trải nghiệm thế giới qua nhiều giác quan—nhìn, nghe, nói—và điều này phản ánh sự đa dạng hơn nhiều so với chỉ văn bản đơn thuần." Điều này cho thấy nỗ lực của OpenAI trong việc phát triển các công cụ AI có khả năng tương tác phong phú và đa dạng hơn.
GPT-4o mini hiện đang được triển khai cho người dùng ChatGPT miễn phí, đăng ký ChatGPT Plus và Team thay cho phiên bản GPT-3.5 Turbo, và dự kiến sẽ có mặt trên ChatGPT Enterprise vào tuần tới. Đây là một phần của chiến lược mở rộng nhằm cải thiện trải nghiệm người dùng với các công cụ AI.
Mô hình GPT-4o mini là một nhánh của GPT-4o, phiên bản mạnh mẽ và nhanh nhất của OpenAI ra mắt vào tháng 5. GPT-4o không chỉ cải thiện khả năng tạo ra âm thanh, video và văn bản mà còn hỗ trợ 50 ngôn ngữ khác nhau với tốc độ và chất lượng vượt trội.
OpenAI, được Microsoft hỗ trợ, hiện đang được định giá hơn 80 tỷ USD bởi các nhà đầu tư. Được thành lập vào năm 2015, công ty này đang phải đối mặt với áp lực lớn để duy trì vị trí dẫn đầu trong lĩnh vực AI tạo sinh, đồng thời tìm kiếm các phương thức sinh lợi để bù đắp khoản đầu tư khổng lồ vào cơ sở hạ tầng và công nghệ đào tạo mô hình.