Google “phản công” với AI tạo video mới, cạnh tranh trực tiếp với Sora

22:06 18/12/2024

2 phút đọc

DeepMind, bộ phận nghiên cứu AI của Google, vừa giới thiệu Veo 2, mô hình tạo video thế hệ thứ hai với khả năng tạo video dài tới 2 phút, độ phân giải 4K – gấp 6 lần độ dài và 4 lần độ phân giải so với Sora (20 giây/1080p).

Google "phản công" với AI tạo video mới, cạnh tranh trực tiếp với Sora - techlade

Khả năng ấn tượng, nhưng vẫn trong giai đoạn thử nghiệm

Hiện tại, Veo 2 mới chỉ khả dụng trên VideoFX, nền tảng tạo video thử nghiệm của Google, với giới hạn video 8 giây và độ phân giải 720p. VideoFX cũng đang trong giai đoạn danh sách chờ, vì vậy không phải ai cũng có thể dùng thử Veo 2. Tuy nhiên, Google cho biết sẽ mở rộng quyền truy cập trong vài tuần tới và cung cấp Veo 2 trên nền tảng Vertex AI sau khi mở rộng quy mô.

Những cải tiến đáng chú ý

Veo 2 được cho là sở hữu nhiều ưu điểm vượt trội so với các mô hình trước đó, bao gồm:

  • Hiểu biết vật lý tốt hơn: Mô phỏng chính xác hơn các hiệu ứng động lực học chất lỏng, ánh sáng và bóng đổ.
  • Chất lượng video rõ nét hơn: Kết cấu và hình ảnh được tạo ra sắc nét hơn, ít bị mờ khi chuyển động.
  • Điều khiển camera linh hoạt hơn: Cho phép người dùng định vị ống kính camera ảo chính xác hơn.

Vẫn còn những hạn chế

Mặc dù có nhiều cải tiến, Veo 2 vẫn chưa hoàn thiện. Eli Collins, đại diện Google, cho biết: “Sự mạch lạc và nhất quán là những lĩnh vực cần cải thiện. Veo có thể tuân thủ yêu cầu trong vài phút, nhưng chưa thể xử lý các yêu cầu phức tạp trong thời gian dài. Tương tự, việc duy trì tính nhất quán của nhân vật cũng là một thách thức. Ngoài ra, chúng tôi cũng cần cải thiện khả năng tạo chi tiết phức tạp, chuyển động nhanh và phức tạp, đồng thời tiếp tục nâng cao tính chân thực.”

Cải tiến Imagen 3

Bên cạnh Veo 2, Google cũng công bố các cải tiến cho Imagen 3, mô hình tạo ảnh thương mại, cho phép tạo ra đầu ra “sáng hơn, bố cục tốt hơn”. Imagen 3 cũng sẽ cung cấp các gợi ý mô tả bổ sung dựa trên từ khóa trong yêu cầu của người dùng.

Veo 2 và Imagen 3 là những bước tiến đáng kể trong lĩnh vực tạo nội dung bằng AI. Mặc dù vẫn còn những hạn chế cần khắc phục, nhưng những mô hình này hứa hẹn sẽ mang đến những ứng dụng thú vị và hữu ích trong tương lai.

Chia sẻ bài viết:

Từ khoá:

Tin tài trợ

Nhận xét (0)

Bài viết liên quan

ĐĂNG KÝ NHẬN TIN

NGAY HÔM NAY

Đăng ký để nhận thông tin sớm nhất về những câu chuyện nóng hổi hiện nay trên thị trường, công nghệ được cung cấp hàng ngày.

    Bằng cách nhấp vào “Đăng ký”, bạn chấp nhận Điều khoản dịch vụ và Chính sách quyền riêng tư của chúng tôi. Bạn có thể chọn không tham gia bất cứ lúc nào.