Công ty khởi nghiệp AI có trụ sở tại San Francisco là Writer đã ra mắt một mô hình trí tuệ nhân tạo lớn vào thứ Tư (9/10) để cạnh tranh với các dịch vụ doanh nghiệp từ OpenAI, Anthropic và các công ty khác. Tuy nhiên, không giống như một số đối thủ cạnh tranh khác, công ty này không cần phải chi nhiều tiền để đào tạo AI của mình.
Công ty này cho biết, họ đã chi khoảng 700.000 đô la để đào tạo mô hình mới nhất của mình, bao gồm dữ liệu và GPU, so với hàng triệu đô la mà các công ty khởi nghiệp cạnh tranh chi để xây dựng mô hình của riêng họ. Chiến lược của công ty đã thu hút sự chú ý của các nhà đầu tư.
Theo một người hiểu rõ tình hình đã tiết lộ, Writer đang huy động tới 200 triệu đô la với mức định giá 1,9 tỷ đô la. Con số này gần gấp bốn lần mức định giá của công ty vào tháng 9 năm 2023, khi công ty huy động được 100 triệu đô la với mức định giá hơn 500 triệu đô la.
Công ty cắt giảm chi phí bằng cách sử dụng dữ liệu tổng hợp hoặc dữ liệu do AI tạo ra. Dữ liệu này được thiết kế để mô phỏng thông tin thực tế thường được đưa vào các mô hình mà không ảnh hưởng đến quyền riêng tư và đang trở thành phương pháp đào tạo phổ biến hơn.
Một nghiên cứu của các nhà nghiên cứu AI được sửa đổi vào tháng 6 cho thấy nếu xu hướng phát triển AI hiện tại tiếp tục, các công ty công nghệ sẽ "hoàn toàn cạn kiệt" dữ liệu đào tạo có sẵn công khai trong khoảng thời gian từ năm 2026 đến năm 2032, viết rằng "dữ liệu văn bản công khai do con người tạo ra không thể duy trì khả năng mở rộng sau thập kỷ này".
Amazon đã sử dụng dữ liệu tổng hợp để đào tạo Alexa, Meta đã sử dụng dữ liệu này để tinh chỉnh các mô hình Llama của mình và OpenAI do Microsoft hậu thuẫn đang kết hợp dữ liệu này vào các mô hình của mình, theo mô tả công việc do công ty đăng tải.
Tuy nhiên, một số chuyên gia đã cảnh báo rằng dữ liệu tổng hợp nên được sử dụng một cách thận trọng, vì nó có khả năng làm giảm hiệu suất của mô hình và làm trầm trọng thêm các thành kiến hiện có.
Waseem Alshikh, đồng sáng lập kiêm giám đốc công nghệ của Writer, nói với CNBC rằng Writer đã làm việc trên đường ống dữ liệu tổng hợp của mình trong nhiều năm.
"Có một số nhầm lẫn trong ngành về định nghĩa của 'dữ liệu tổng hợp'", Alshikh cho biết. "Để nói rõ hơn, chúng tôi không đào tạo các mô hình của mình trên dữ liệu giả hoặc dữ liệu ảo giác và chúng tôi không sử dụng mô hình để tạo dữ liệu ngẫu nhiên. ... Chúng tôi lấy dữ liệu thực tế, có thật và chuyển đổi thành dữ liệu tổng hợp được cấu trúc cụ thể theo cách rõ ràng và sạch hơn để đào tạo mô hình.”
AI tạo sinh của công ty cho phép các khách hàng doanh nghiệp sử dụng các mô hình ngôn ngữ lớn hoặc LLM để tạo văn bản giống con người cho mọi thứ, từ bài đăng trên LinkedIn đến mô tả công việc đến tuyên bố sứ mệnh, phân tích và tóm tắt dữ liệu hoặc văn bản và xây dựng các ứng dụng AI tùy chỉnh để phân tích thị trường, v.v. Công ty có hơn 250 khách hàng doanh nghiệp, bao gồm Accenture, Uber, Salesforce, L'Oreal và Vanguard, những người sử dụng công nghệ này trên nhiều lĩnh vực như hỗ trợ, CNTT, vận hành, bán hàng và tiếp thị.
Thị trường AI tạo sinh được định hướng sẽ đạt doanh thu 1 nghìn tỷ đô la trong vòng một thập kỷ. Cho đến nay vào năm 2024, các nhà đầu tư đã bơm 26,8 tỷ đô la vào 498 giao dịch AI tạo sinh, theo PitchBook và các công ty trong lĩnh vực này đã huy động được 25,9 tỷ đô la vào năm 2023, tăng hơn 200% so với năm 2022.