Google giới thiệu công cụ AI chuyển đổi văn bản thành video từ Gemini Advanced

Theo dõi Báo Gia Lai trên Google News

Google giới thiệu công cụ hỗ trợ người dùng Gemini Advanced chuyển đổi các đoạn văn bản thành video có độ phân giải cao với thời lượng 8 giây.

gg.jpg

Google là một trong những tập đoàn công nghệ đã rất tích cực trong cuộc đua phát triển công cụ trí tuệ nhân tạo (AI), bao gồm chatbot Gemini để cạnh tranh với ChatGPT hay công cụ tạo ảnh từ văn bản Imagen. Tuy nhiên, khả năng tạo video từ văn bản mô tả của Google vẫn bị giới công nghệ đánh giá là thua kém nhiều so với các đối thủ.

Mới đây nhất, Google vừa chính thức giới thiệu công cụ hỗ trợ người dùng Gemini Advanced chuyển đổi các đoạn văn bản thành video có độ phân giải cao với thời lượng 8 giây. Đồng thời, tính năng Whisk Animate cũng được triển khai với khả năng biến hình ảnh tĩnh thành các đoạn phim hoạt hình sống động với thời lượng tương tự. Cả hai tính năng này hiện đã sẵn sàng cho người dùng đăng ký Google One AI Premium.

Google cho biết, Veo 2 đánh dấu một bước nhảy vọt trong lĩnh vực sáng tạo video, được thiết kế để sản xuất các video có độ phân giải cao, chi tiết, chân thực và mang đậm tính điện ảnh. Nhờ khả năng nắm bắt các quy tắc vật lý thực tế và chuyển động của con người, Veo 2 có có thể tạo ra những chuyển động mượt mà cho nhân vật, các cảnh quay sống động và chi tiết tinh tế theo nhiều chủ đề và phong cách khác nhau.

Để tạo video, người dùng cần chọn Veo 2 từ menu các mô hình trong Gemini (vị trí tùy chọn này trên giao diện có thể thay đổi trong quá trình phát triển). Tính năng này sẽ tạo ra một đoạn video dài 8 giây với độ phân giải 720p, được xuất ra dưới định dạng MP4 với tỷ lệ khung hình ngang 16:9. Google cũng lưu ý người dùng số lượng video có thể tạo mỗi tháng là giới hạn.

Người dùng chỉ cần diễn tả cảnh quay mình hình dung có thể là một mẩu chuyện ngắn, một ý tưởng hình ảnh, hay một khung cảnh cụ thể. Sau đó Gemini sẽ hiện thực hóa các ý tưởng đó. Mô tả của người dùng càng tỉ mỉ, thành phẩm video cuối cùng càng đạt chất lượng tốt.

Google cho biết người dùng có thể dễ dàng chia sẻ video được tạo ra bởi Veo 2 lên các nền tảng mạng xã hội như TikTok hay YouTube Shorts. Tuy nhiên, video do Veo 2 tạo ra lại có tỷ lệ khung hình 16:9, hoàn toàn không phù hợp để chia sẻ lên những nền tảng video này.

Thành phẩm từ câu lệnh: Cảnh hoạt hình một chú chuột bé xíu đeo cặp kính ngoại cỡ, đang đọc sách dưới ánh sáng lung linh từ cây nấm, trong một cái ổ ấm cúng giữa khu rừng.
Thành phẩm từ câu lệnh: Cảnh hoạt hình một chú chuột bé xíu đeo cặp kính ngoại cỡ, đang đọc sách dưới ánh sáng lung linh từ cây nấm, trong một cái ổ ấm cúng giữa khu rừng.

Tính năng tạo video hiện đang được triển khai cho người dùng Gemini Advanced toàn cầu, trên cả nền tảng web và di động. Tuy nhiên, tính năng này chỉ dành riêng cho những người đã đăng ký gói Google One AI Premium, với đầy đủ hỗ trợ ngôn ngữ mà Gemini hiện có.

Hiện tại, Veo 2 được Google cung cấp cho người dùng Gemini Advanced, với giá dịch vụ 489.000 đồng/tháng tại Việt Nam.

Bên cạnh Veo 2, Google cũng cho ra mắt thêm công cụ AI mang tên gọi Whisk Animate, cho phép người dùng có thể tự tạo ra hình ảnh mới bằng văn bản mô tả, sau đó biến hình ảnh này thành video với chuyển động mượt mà, nhưng cũng chỉ có độ dài tối đa 8 giây tương tự như Veo 2.

Whisk, một thử nghiệm từ Google Labs ra mắt vào cuối năm 2024 giúp người dùng nhanh chóng khám phá và hình dung những ý tưởng mới thông qua cả lời nhắc bằng văn bản và hình ảnh. Người dùng có thể biến ý tưởng của mình thành hiện thực với tính năng Whisk Animate.

Whisk Animate mang đến khả năng biến những bức ảnh tĩnh của người dùng thành các đoạn video 8 giây sống nhờ công nghệ Veo 2. Tính năng này đã được cung cấp cho người dùng đăng ký Google One AI Premium tại hơn 60 quốc gia.

Video được tạo thành từ bức ảnh.
Video được tạo thành từ bức ảnh.

Google cũng cho biết đã triển khai những biện pháp quan trọng để đảm bảo trải nghiệm sáng tạo video an toàn. Điều này bao gồm quy trình red teaming và đánh giá chuyên sâu nhằm ngăn chặn việc tạo ra nội dung vi phạm các quy định của Google. Thêm vào đó, mọi video được tạo bằng Veo 2 đều được gắn dấu SynthID , một loại hình mờ kỹ thuật số được nhúng vào từng khung hình, cho biết rõ đây là video do AI tạo ra.

Theo Minh Sơn (Vietnam+)

Có thể bạn quan tâm

Tập huấn bảo hộ và khai thác tài sản trí tuệ sản xuất kinh doanh nông nghiệp.

Gia Lai: Hướng dẫn đăng ký bảo hộ và phát triển tài sản trí tuệ

(GLO)- Ngày 28-1, Sở Khoa học và Công nghệ phối hợp với Trung tâm Nghiên cứu và phát triển hệ thống nông nghiệp (Bộ Nông nghiệp và Môi trường) tổ chức tập huấn hướng dẫn đăng ký bảo hộ và phát triển tài sản trí tuệ cho chủ thể sản xuất, kinh doanh sản phẩm OCOP và sản phẩm nông nghiệp.

VinFuture khởi động mùa giải thứ 6 năm 2026

VinFuture khởi động mùa giải thứ 6

(GLO)- Ban tổ chức Giải thưởng VinFuture vừa chính thức công bố khởi động mùa giải thứ 6 năm 2026 và bắt đầu tiếp nhận đề cử các công trình khoa học - công nghệ từ cộng đồng khoa học trên toàn cầu đến 14 giờ ngày 17-4 (theo giờ Việt Nam).

OpenAI sản xuất tai nghe AI đầu tiên tại Việt Nam

OpenAI sản xuất tai nghe AI đầu tiên tại Việt Nam

(GLO)- OpenAI vừa xác nhận kế hoạch phát hành thiết bị AI tiêu dùng đầu tiên, được cho là một mẫu tai nghe thông minh với tên mã nội bộ “Sweetpea”. Sản phẩm được sản xuất tại Việt Nam, dự kiến ra mắt vào nửa cuối năm 2026, với kỳ vọng đạt doanh số lên tới 50 triệu chiếc.

Sony nhượng quyền kinh doanh TV cho TCL

Sony nhượng quyền kinh doanh TV cho TCL

(GLO)- Sony vừa thông báo ký biên bản ghi nhớ (MOU) với TCL Electronics Holdings để thành lập liên doanh nhằm tiếp quản mảng kinh doanh thiết bị giải trí gia đình. Theo thỏa thuận, TCL sở hữu 51% cổ phần trong liên doanh, còn Sony giữ 49%.

null