Google DeepMind tạo ra thế giới 3D tương tác chỉ bằng AI
22:57 07/12/2024
3 phút đọc
Google DeepMind vừa giới thiệu Genie 2, một bước tiến đáng kể trong lĩnh vực mô hình thế giới AI. Khác với phiên bản tiền nhiệm chỉ có khả năng tạo thế giới 2D, Genie 2 có thể tạo ra môi trường 3D và duy trì chúng trong thời gian dài hơn đáng kể.
Genie 2 hoạt động như thế nào?
Genie 2 không phải là một engine game, mà là một mô hình khuếch tán tạo ra hình ảnh khi người chơi (con người hoặc tác nhân AI) di chuyển trong thế giới mô phỏng. Trong quá trình tạo khung hình, Genie 2 có thể suy luận về môi trường, cho phép nó mô phỏng nước, khói và các hiệu ứng vật lý – mặc dù một số tương tác này có thể mang tính chất “game” rõ rệt.
Mô hình này không bị giới hạn ở góc nhìn người thứ ba, mà còn có thể xử lý góc nhìn người thứ nhất và isometric. Để bắt đầu, Genie 2 chỉ cần một hình ảnh đầu vào duy nhất, được cung cấp bởi mô hình Imagen 3 của Google hoặc một bức ảnh từ thế giới thực.
Khả năng ghi nhớ và tái tạo
Genie 2 có khả năng ghi nhớ các phần của cảnh mô phỏng ngay cả khi chúng nằm ngoài tầm nhìn của người chơi và có thể tái tạo lại chính xác các yếu tố đó khi chúng xuất hiện trở lại. Đây là điểm khác biệt so với các mô hình thế giới khác như Oasis, vốn gặp khó khăn trong việc ghi nhớ bố cục của các cấp độ Minecraft mà nó tạo ra trong thời gian thực.
Hạn chế
Tuy nhiên, Genie 2 vẫn còn những hạn chế. DeepMind cho biết mô hình có thể tạo ra thế giới “nhất quán” trong tối đa 60 giây, và hầu hết các ví dụ mà công ty chia sẻ chỉ kéo dài khoảng 10 đến 20 giây. Hơn nữa, chất lượng hình ảnh sẽ giảm dần khi Genie 2 phải duy trì ảo giác về một thế giới nhất quán trong thời gian dài.
Ứng dụng và tiềm năng
DeepMind chưa tiết lộ chi tiết về cách thức huấn luyện Genie 2, ngoại trừ việc sử dụng “bộ dữ liệu video quy mô lớn”. Hiện tại, công ty coi Genie 2 là công cụ để huấn luyện và đánh giá các tác nhân AI khác, bao gồm cả thuật toán SIMA của chính họ. Genie 2 cũng có thể được sử dụng bởi các nghệ sĩ và nhà thiết kế để tạo mẫu và thử nghiệm ý tưởng nhanh chóng.
Trong tương lai, DeepMind cho rằng các mô hình thế giới như Genie 2 sẽ đóng vai trò quan trọng trên con đường hướng tới trí tuệ nhân tạo tổng quát (AGI).
“Việc huấn luyện các tác nhân tổng quát hơn thường bị hạn chế bởi sự thiếu hụt các môi trường huấn luyện đủ phong phú và đa dạng”, DeepMind cho biết. “Như chúng tôi đã chứng minh, Genie 2 có thể cho phép các tác nhân trong tương lai được huấn luyện và đánh giá trong một chương trình học không giới hạn về các thế giới mới lạ”.
Tin tài trợ
-
Tài trợMáy tính
Chuwi Hi10 X1: Lựa chọn tối ưu cho làm việc và giải trí di động
Chuwi vừa ra mắt mẫu máy tính bảng giá rẻ Hi10 X1, hướng đến người dùng cần thiết bị gọn nhẹ nhưng vẫn hỗ trợ hệ điều hành Windows cho công việc. Không giống nhiều sản phẩm trong phân khúc giá rẻ sử dụng chip ARM và Android, Hi10 X1 trang bị chip Intel và […] -
Tài trợMobile
Lava Blaze Duo 5G: Điện thoại màn hình kép đầy sáng tạo
Lava, thương hiệu điện thoại thông minh đến từ Ấn Độ, vừa chính thức ra mắt mẫu điện thoại mới Blaze Duo 5G, nổi bật với thiết kế màn hình kép độc đáo. Đây là bước tiếp nối sau thành công của mẫu Agni 3 ra mắt vào tháng 10 vừa qua. Thiết kế sáng […] -
Tài trợMobile
FiiO ra mắt JadeAudio JF11: Tai nghe có dây đáng mua nhất hiện nay?
FiiO vừa giới thiệu tai nghe có dây JadeAudio JF11, được thiết kế với củ loa kích thước lớn và ống dẫn âm thanh nhằm mang đến âm trầm sâu, độ méo tiếng thấp và âm thanh mượt mà. Dòng tai nghe này được thiết kế để nằm bên trong ống tai, với đầu tai […] -
Tài trợKhám phá
BenQ RD320U: Màn hình lập trình 4K cho dân công nghệ
BenQ vừa chính thức ra mắt màn hình lập trình RD320U 31,5 inch tại thị trường Trung Quốc. Với mức giá 5.299 nhân dân tệ (khoảng 18,5 triệu VNĐ), sản phẩm này hướng đến các lập trình viên và người làm việc sáng tạo, cần một màn hình lớn, độ phân giải cao và khả […]
Bài viết liên quan
Chuwi Hi10 X1: Lựa chọn tối ưu cho làm việc và giải trí di động
Lava Blaze Duo 5G: Điện thoại màn hình kép đầy sáng tạo
FiiO ra mắt JadeAudio JF11: Tai nghe có dây đáng mua nhất hiện nay?
BenQ RD320U: Màn hình lập trình 4K cho dân công nghệ
Moto G05 và E15: Bộ đôi smartphone giá rẻ cho người dùng
Denon DCD-3000NE: Đầu đĩa tham chiếu với thiết kế sang trọng, âm thanh “chuẩn audiophile”
GMK NucBox G2 Plus: Máy tính mini hiệu năng cao
GRID Legends: Deluxe Edition đổ bộ lên di động, mang đến trải nghiệm đua xe chân thực
Insta360 Connect: Tối ưu họp trực tuyến với camera 4K và AI
Bút S Pen mới của Samsung sẽ có gì đặc biệt?
Trải nghiệm “làn gió thông minh” với điều hoà LG Dualcool AI Air 2025
Casio G-Shock MRGB2000JS1A: Tinh hoa chế tác kiếm Nhật Bản
OnePlus 13 ra mắt toàn cầu với khả năng chống nước IP69
Honor Magic 7 RSR Porsche Design sắp ra mắt với camera 200MP
Humble Bundle “bỗng dưng” hào phóng, tặng miễn phí game Indiana Jones
Apple sẽ ra mắt iPad gập với thiết kế “khủng”, màn hình kép độc đáo
Nokia 2025: Điện thoại phổ thông với công nghệ mới
AOC CU34G10XP: Lựa chọn tối ưu cho game thủ
Google “phản công” với AI tạo video mới, cạnh tranh trực tiếp với Sora
ĐĂNG KÝ NHẬN TIN
NGAY HÔM NAY
Đăng ký để nhận thông tin sớm nhất về những câu chuyện nóng hổi hiện nay trên thị trường, công nghệ được cung cấp hàng ngày.
Bằng cách nhấp vào “Đăng ký”, bạn chấp nhận Điều khoản dịch vụ và Chính sách quyền riêng tư của chúng tôi. Bạn có thể chọn không tham gia bất cứ lúc nào.
5
s
Nhận xét (0)