Anthropic hôm thứ Hai đã ra mắt Claude 3, một bộ mô hình trí tuệ nhân tạo được cho là nhanh nhất và mạnh nhất từ trước đến nay. Các công cụ mới được gọi là Claude 3 Opus, Sonnet và Haiku.
Công ty cho biết mẫu máy mới có khả năng cao nhất, Claude 3 Opus, đã vượt trội hơn GPT-4 của OpenAI và Gemini Ultra của Google trong các bài kiểm tra điểm chuẩn của ngành, chẳng hạn như kiến thức cấp đại học, lý luận cấp độ sau đại học và toán cơ bản.
Đây là lần đầu tiên Anthropic đưa ra hỗ trợ đa phương thức. Người dùng có thể tải lên ảnh, biểu đồ, tài liệu và các loại dữ liệu phi cấu trúc khác để phân tích và trả lời.
Các mẫu khác, Sonnet và Haiku, nhỏ gọn hơn và rẻ hơn Opus. Theo Anthropic, Sonnet và Opus sẽ có mặt ở 159 quốc gia bắt đầu từ thứ Hai, trong khi Haiku sẽ sớm ra mắt. Công ty từ chối nêu rõ mất bao lâu để đào tạo Claude 3 hoặc chi phí bao nhiêu, nhưng cho biết các công ty như Airtable và Asana đã giúp A/B thử nghiệm các mô hình.
Vào thời điểm này năm ngoái, Anthropic được coi là một công ty khởi nghiệp về AI có tính sáng tạo đầy hứa hẹn được thành lập bởi các cựu giám đốc nghiên cứu OpenAI. Nó đã hoàn thành các vòng tài trợ Series A và B, nhưng nó chỉ mới tung ra phiên bản đầu tiên của chatbot mà không có bất kỳ quyền truy cập nào của người tiêu dùng hoặc sự phô trương lớn.
Mười hai tháng sau, đây là một trong những công ty khởi nghiệp AI hot nhất, với sự ủng hộ của Google, Salesforce và Amazon, đồng thời là sản phẩm cạnh tranh trực tiếp với ChatGPT trong cả thế giới doanh nghiệp và người tiêu dùng. Trong năm qua, công ty khởi nghiệp này đã chốt được 5 thương vụ cấp vốn khác nhau, với tổng trị giá khoảng 7,3 tỷ USD.
Theo PitchBook, lĩnh vực AI tổng quát đã bùng nổ trong năm qua, với mức đầu tư kỷ lục 29,1 tỷ USD cho gần 700 giao dịch vào năm 2023, tăng hơn 260% giá trị giao dịch so với một năm trước đó. Nó trở thành cụm từ được nhắc đến nhiều nhất trong các cuộc gọi báo cáo thu nhập doanh nghiệp hàng quý. Các học giả và nhà đạo đức học đã bày tỏ những lo ngại đáng kể về xu hướng truyền bá thành kiến của công nghệ, nhưng ngay cả như vậy, nó vẫn nhanh chóng xâm nhập vào trường học, du lịch trực tuyến, ngành y tế, quảng cáo trực tuyến, v.v.
Daniela Amodei, đồng sáng lập Anthropic, nói với CNBC trong một cuộc phỏng vấn: Khoảng 60 đến 80 người làm việc trên mô hình AI cốt lõi, trong khi khoảng 120 đến 150 người làm việc về các khía cạnh kỹ thuật của nó. Đối với lần lặp lại cuối cùng của mô hình AI, một nhóm gồm 30 đến 35 người đã làm việc trực tiếp với nó, với tổng số khoảng 150 người hỗ trợ nó, Amodei cho biết vào tháng 7.
Anthropic cho biết Claude 3 có thể tóm tắt tối đa khoảng 150,00 từ hoặc một cuốn sách khá lớn (hãy nghĩ: độ dài tương đương với độ dài của “Moby Dick” hoặc “Harry Potter và Bảo bối Tử thần”). Phiên bản trước của nó chỉ có thể tóm tắt 75.000 từ. Người dùng có thể nhập các tập dữ liệu lớn và yêu cầu tóm tắt dưới dạng bản ghi nhớ, thư hoặc câu chuyện. Ngược lại, ChatGPT có thể xử lý khoảng 3.000 từ.
Amodei cũng cho biết Claude 3 hiểu rõ hơn về rủi ro trong các phản hồi so với phiên bản trước. Amodei cho biết thêm: “Trong nỗ lực tạo ra một mô hình cực kỳ vô hại của chúng tôi, Claude 2 đôi khi từ chối quá mức. “Khi ai đó gặp phải một số chủ đề hấp dẫn hơn hoặc các biện pháp bảo vệ sự tin cậy và an toàn, đôi khi Claude 2 sẽ có xu hướng hơi bảo thủ khi trả lời những câu hỏi đó.”
Theo Anthropic, Claude 3 có sự hiểu biết sâu sắc hơn về các lời nhắc.
Đa phương thức hoặc thêm các tùy chọn như khả năng chụp ảnh và quay video cho AI tổng hợp, cho dù bạn tự tải chúng lên hay tạo chúng bằng mô hình AI, đã nhanh chóng trở thành một trong những trường hợp sử dụng phổ biến nhất trong ngành.
“Thế giới là đa phương thức,” COO OpenAI Brad Lightcap nói với CNBC vào tháng 11. “Nếu bạn nghĩ về cách con người chúng ta xử lý thế giới và tương tác với thế giới, chúng ta nhìn thấy mọi thứ, chúng ta nghe thấy mọi thứ, chúng ta nói những điều - thế giới lớn hơn nhiều so với văn bản. Vì vậy, đối với chúng tôi, việc văn bản và mã trở thành các phương thức duy nhất, các giao diện duy nhất mà chúng tôi có thể có, cho đến mức độ mạnh mẽ của các mô hình này và những gì chúng có thể làm, luôn cảm thấy chưa đầy đủ.”
Nhưng tính đa phương thức và các mô hình AI ngày càng phức tạp cũng dẫn đến nhiều rủi ro tiềm ẩn hơn. Google gần đây đã đưa trình tạo hình ảnh AI của mình, một phần của chatbot Gemini, ngoại tuyến sau khi người dùng phát hiện ra những thông tin không chính xác trong lịch sử và các câu trả lời đáng ngờ đã được lan truyền rộng rãi trên mạng xã hội.
Claude 3 của Anthropic không tạo ra hình ảnh; thay vào đó, nó chỉ cho phép người dùng tải lên hình ảnh và các tài liệu khác để phân tích.
Amodei nói: “Tất nhiên không có mô hình nào là hoàn hảo và tôi nghĩ đó là điều rất quan trọng cần phải nói trước”. “Chúng tôi đã cố gắng hết sức để làm cho những mô hình này trở thành điểm giao nhau của khả năng hoạt động và an toàn nhất có thể. Tất nhiên sẽ có những nơi mà thỉnh thoảng người mẫu vẫn tạo ra điều gì đó.”