
Google là một trong những tập đoàn công nghệ đã rất tích cực trong cuộc đua phát triển công cụ trí tuệ nhân tạo (AI), bao gồm chatbot Gemini để cạnh tranh với ChatGPT hay công cụ tạo ảnh từ văn bản Imagen. Tuy nhiên, khả năng tạo video từ văn bản mô tả của Google vẫn bị giới công nghệ đánh giá là thua kém nhiều so với các đối thủ.
Mới đây nhất, Google vừa chính thức giới thiệu công cụ hỗ trợ người dùng Gemini Advanced chuyển đổi các đoạn văn bản thành video có độ phân giải cao với thời lượng 8 giây. Đồng thời, tính năng Whisk Animate cũng được triển khai với khả năng biến hình ảnh tĩnh thành các đoạn phim hoạt hình sống động với thời lượng tương tự. Cả hai tính năng này hiện đã sẵn sàng cho người dùng đăng ký Google One AI Premium.
Google cho biết, Veo 2 đánh dấu một bước nhảy vọt trong lĩnh vực sáng tạo video, được thiết kế để sản xuất các video có độ phân giải cao, chi tiết, chân thực và mang đậm tính điện ảnh. Nhờ khả năng nắm bắt các quy tắc vật lý thực tế và chuyển động của con người, Veo 2 có có thể tạo ra những chuyển động mượt mà cho nhân vật, các cảnh quay sống động và chi tiết tinh tế theo nhiều chủ đề và phong cách khác nhau.
Để tạo video, người dùng cần chọn Veo 2 từ menu các mô hình trong Gemini (vị trí tùy chọn này trên giao diện có thể thay đổi trong quá trình phát triển). Tính năng này sẽ tạo ra một đoạn video dài 8 giây với độ phân giải 720p, được xuất ra dưới định dạng MP4 với tỷ lệ khung hình ngang 16:9. Google cũng lưu ý người dùng số lượng video có thể tạo mỗi tháng là giới hạn.
Người dùng chỉ cần diễn tả cảnh quay mình hình dung có thể là một mẩu chuyện ngắn, một ý tưởng hình ảnh, hay một khung cảnh cụ thể. Sau đó Gemini sẽ hiện thực hóa các ý tưởng đó. Mô tả của người dùng càng tỉ mỉ, thành phẩm video cuối cùng càng đạt chất lượng tốt.
Google cho biết người dùng có thể dễ dàng chia sẻ video được tạo ra bởi Veo 2 lên các nền tảng mạng xã hội như TikTok hay YouTube Shorts. Tuy nhiên, video do Veo 2 tạo ra lại có tỷ lệ khung hình 16:9, hoàn toàn không phù hợp để chia sẻ lên những nền tảng video này.

Tính năng tạo video hiện đang được triển khai cho người dùng Gemini Advanced toàn cầu, trên cả nền tảng web và di động. Tuy nhiên, tính năng này chỉ dành riêng cho những người đã đăng ký gói Google One AI Premium, với đầy đủ hỗ trợ ngôn ngữ mà Gemini hiện có.
Hiện tại, Veo 2 được Google cung cấp cho người dùng Gemini Advanced, với giá dịch vụ 489.000 đồng/tháng tại Việt Nam.
Bên cạnh Veo 2, Google cũng cho ra mắt thêm công cụ AI mang tên gọi Whisk Animate, cho phép người dùng có thể tự tạo ra hình ảnh mới bằng văn bản mô tả, sau đó biến hình ảnh này thành video với chuyển động mượt mà, nhưng cũng chỉ có độ dài tối đa 8 giây tương tự như Veo 2.
Whisk, một thử nghiệm từ Google Labs ra mắt vào cuối năm 2024 giúp người dùng nhanh chóng khám phá và hình dung những ý tưởng mới thông qua cả lời nhắc bằng văn bản và hình ảnh. Người dùng có thể biến ý tưởng của mình thành hiện thực với tính năng Whisk Animate.
Whisk Animate mang đến khả năng biến những bức ảnh tĩnh của người dùng thành các đoạn video 8 giây sống nhờ công nghệ Veo 2. Tính năng này đã được cung cấp cho người dùng đăng ký Google One AI Premium tại hơn 60 quốc gia.

Google cũng cho biết đã triển khai những biện pháp quan trọng để đảm bảo trải nghiệm sáng tạo video an toàn. Điều này bao gồm quy trình red teaming và đánh giá chuyên sâu nhằm ngăn chặn việc tạo ra nội dung vi phạm các quy định của Google. Thêm vào đó, mọi video được tạo bằng Veo 2 đều được gắn dấu SynthID , một loại hình mờ kỹ thuật số được nhúng vào từng khung hình, cho biết rõ đây là video do AI tạo ra.
Theo Minh Sơn (Vietnam+)