Hiện nay, khả năng tạo video của AI đang được đánh giá rất cao với các công cụ như Sora của OpenAI, Dream Machine của Luma AI, Gen-3 Alpha của Runway, và gần đây nhất là Veo của Google. Tuy nhiên, một trong những điểm yếu của các công cụ này là thiếu đi yếu tố âm thanh đồng bộ.
Công nghệ V2A của Google khắc phục nhược điểm này, mang lại bước tiến lớn trong việc tạo ra những cảnh phim tự động hoàn chỉnh, hỗ trợ cả nhà làm phim chuyên nghiệp và người dùng nghiệp dư trong việc kết hợp nhiều công cụ AI để tạo ra các đoạn phim theo ý thích.
V2A hoạt động bằng cách phân tích từng pixel của video và kết hợp với lời nhắc văn bản để tạo ra nhạc nền dựa trên nội dung đang chiếu. Trong các video mà Google DeepMind chia sẻ, công nghệ V2A đã tạo ra những đoạn phim với âm thanh khớp với ký tự và giai điệu của video.
"Công cụ V2A có khả năng tạo ra số lượng bản nhạc không giới hạn cho bất kỳ đầu vào video nào, phù hợp với bất kỳ cảnh phim nào," Google viết trên blog ngày 19/6.
Tuy nhiên, Google cũng nhận thức rõ về nguy cơ lạm dụng công cụ này cho những mục đích không chính đáng. Do đó, họ coi đây là một dự án nghiên cứu và chưa có kế hoạch phát hành rộng rãi. "Trước khi xem xét việc mở quyền truy cập công nghệ V2A cho công chúng, chúng tôi sẽ tiến hành quá trình đánh giá và thử nghiệm an toàn nghiêm ngặt," đại diện Google cho biết.
Công nghệ V2A của Google DeepMind đánh dấu một bước tiến quan trọng trong lĩnh vực AI, mở ra khả năng sản xuất phim hoàn chỉnh với âm thanh và hình ảnh được đồng bộ hóa hoàn hảo. Tuy nhiên, Google vẫn thận trọng trước những rủi ro tiềm ẩn, cam kết kiểm tra và đánh giá kỹ lưỡng trước khi đưa công nghệ này ra thị trường rộng rãi. Sự kết hợp giữa các công cụ AI hiện có và V2A không chỉ mang lại tiềm năng to lớn cho ngành công nghiệp điện ảnh mà còn hứa hẹn cách mạng hóa cách người dùng nghiệp dư tiếp cận và tạo dựng nội dung số.