Việc Meta giới thiệu công cụ tạo video mới sử dụng AI được coi là động thái đáp trả đối thủ OpenAI, sau khi công ty ra mắt công cụ Sora cách đây vài tháng.
Trong phần trình diễn, Meta cho thấy trình tạo video của họ có thể sáng tạo động vật bơi lội, lướt sóng. Movie Gen cũng có thể dùng ảnh thật của một người, sau đó tạo ra các hành động, có bối cảnh cụ thể dựa trên câu lệnh như vẽ tranh, hát, làm thí nghiệm…
Trong bài đăng trên blog, Meta cho biết, AI của họ tạo được nhạc nền và hiệu ứng âm thanh đồng bộ với nội dung của video. Điều đặc biệt là người dùng còn được cung cấp thêm các công cụ chỉnh sửa video ngay trên Movie Gen.
Một số video thử nghiệm cho thấy AI có thể gắn những quả cầu lông vào tay một người đàn ông đang chạy trên sa mạc. Trong khi video khác, công cụ này đã biến bãi đậu xe thành nơi trượt ván. AI cũng có thể biến ảnh chân dung của một người đàn ông thành video trong phòng thí nghiệm hoặc cho chim cánh cụt bơi lội tung tăng trong hồ nước lạnh cạnh những khối băng và trái bóng khổng lồ.
Movie Gen tạo được video dài tối đa 16 giây, còn âm thanh có thể lên đến 45 giây. Một số thử nghiệm do Meta công bố cho thấy mô hình của họ có thể hoạt động tốt hơn mô hình của các đối thủ như Runway, OpenAI, ElevenLabs và Kling.
Hiện tại, chỉ có nhân viên Meta và một số đối tác được dùng công cụ mới. Meta dự định đưa MovieGen lên các nền tảng của mình vào năm sau. Theo Phó Chủ tịch Meta Connor Hayes, ban lãnh đạo vẫn đang thảo luận về cách tốt nhất để triển khai việc tích hợp này. Mục tiêu của MovieGen là khuyến khích nhiều người tạo hoặc chỉnh sửa bài đăng video hơn.
MovieGen nằm trong nỗ lực AI rộng hơn của Meta. Công ty mẹ Facebook đã chi hàng tỷ USD trong các năm qua cho AI và phát triển chatbot có tên MetaAI cho hầu hết ứng dụng để trả lời câu hỏi của người dùng hoặc trò chuyện cùng họ.
Meta là một trong nhiều hãng công nghệ lớn đẩy mạnh các mô hình AI tập trung vào tạo video, vốn phức tạp và tốn kém hơn AI tạo văn bản. OpenAI sở hữu công cụ riêng – Sora với khả năng tạo video dài tối đa 1 phút nhưng cũng chưa tung ra cho công chúng. DeepMind, công ty con của Google, cũng có một công cụ tạo video trong tay có tên Veo.
Phó Chủ tịch Hayes cho biết, lý do khiến Meta chưa triển khai MovieGen cho công chúng là vì thời gian tạo video quá lâu, mất đến hàng chục phút. Bên cạnh đó là các vấn đề xoay quanh an toàn và trách nhiệm, như làm thế nào để người dùng không thể tạo ra video không phù hợp về người khác nếu không được sự đồng ý. “Đó sẽ là vấn đề quan trọng nhất cần giải quyết trước khi chúng tôi cung cấp khả năng cá nhân hóa rộng rãi cho mọi người”.
Cũng giống như các công cụ tạo hình ảnh AI, Movie Gen làm dấy lên lo ngại về vấn đề bản quyền và những hệ lụy tiêu cực tiềm ẩn. Startup Runaway bị cáo buộc đã sử dụng hàng nghìn video lấy từ YouTube để huấn luyện AI, vi phạm điều khoản sử dụng của nền tảng này. Trong khi đó, Meta cho biết, Movie Gen được huấn luyện trên “tập hợp các dữ liệu được cấp phép và có sẵn công khai” nhưng không tiết lộ cụ thể.