Google DeepMind tạo ra thế giới 3D tương tác chỉ bằng AI
22:57 07/12/2024
3 phút đọc
Google DeepMind vừa giới thiệu Genie 2, một bước tiến đáng kể trong lĩnh vực mô hình thế giới AI. Khác với phiên bản tiền nhiệm chỉ có khả năng tạo thế giới 2D, Genie 2 có thể tạo ra môi trường 3D và duy trì chúng trong thời gian dài hơn đáng kể.

Genie 2 hoạt động như thế nào?
Genie 2 không phải là một engine game, mà là một mô hình khuếch tán tạo ra hình ảnh khi người chơi (con người hoặc tác nhân AI) di chuyển trong thế giới mô phỏng. Trong quá trình tạo khung hình, Genie 2 có thể suy luận về môi trường, cho phép nó mô phỏng nước, khói và các hiệu ứng vật lý – mặc dù một số tương tác này có thể mang tính chất “game” rõ rệt.
Mô hình này không bị giới hạn ở góc nhìn người thứ ba, mà còn có thể xử lý góc nhìn người thứ nhất và isometric. Để bắt đầu, Genie 2 chỉ cần một hình ảnh đầu vào duy nhất, được cung cấp bởi mô hình Imagen 3 của Google hoặc một bức ảnh từ thế giới thực.
Khả năng ghi nhớ và tái tạo
Genie 2 có khả năng ghi nhớ các phần của cảnh mô phỏng ngay cả khi chúng nằm ngoài tầm nhìn của người chơi và có thể tái tạo lại chính xác các yếu tố đó khi chúng xuất hiện trở lại. Đây là điểm khác biệt so với các mô hình thế giới khác như Oasis, vốn gặp khó khăn trong việc ghi nhớ bố cục của các cấp độ Minecraft mà nó tạo ra trong thời gian thực.
Hạn chế
Tuy nhiên, Genie 2 vẫn còn những hạn chế. DeepMind cho biết mô hình có thể tạo ra thế giới “nhất quán” trong tối đa 60 giây, và hầu hết các ví dụ mà công ty chia sẻ chỉ kéo dài khoảng 10 đến 20 giây. Hơn nữa, chất lượng hình ảnh sẽ giảm dần khi Genie 2 phải duy trì ảo giác về một thế giới nhất quán trong thời gian dài.
Ứng dụng và tiềm năng
DeepMind chưa tiết lộ chi tiết về cách thức huấn luyện Genie 2, ngoại trừ việc sử dụng “bộ dữ liệu video quy mô lớn”. Hiện tại, công ty coi Genie 2 là công cụ để huấn luyện và đánh giá các tác nhân AI khác, bao gồm cả thuật toán SIMA của chính họ. Genie 2 cũng có thể được sử dụng bởi các nghệ sĩ và nhà thiết kế để tạo mẫu và thử nghiệm ý tưởng nhanh chóng.
Trong tương lai, DeepMind cho rằng các mô hình thế giới như Genie 2 sẽ đóng vai trò quan trọng trên con đường hướng tới trí tuệ nhân tạo tổng quát (AGI).
“Việc huấn luyện các tác nhân tổng quát hơn thường bị hạn chế bởi sự thiếu hụt các môi trường huấn luyện đủ phong phú và đa dạng”, DeepMind cho biết. “Như chúng tôi đã chứng minh, Genie 2 có thể cho phép các tác nhân trong tương lai được huấn luyện và đánh giá trong một chương trình học không giới hạn về các thế giới mới lạ”.
Tin tài trợ
- Vũ trụ
Premium
Hubble của NASA và ESA công bố hình ảnh ngoạn mục về lõi thiên hà Xì gà
Bức ảnh mới nhất từ Kính viễn vọng không gian Hubble của NASA và ESA vừa hé lộ những chi tiết chưa từng thấy về thiên hà Messier 82 (M82), nơi hàng triệu ngôi sao rực rỡ đang ẩn mình sau những đám mây bụi và khí với hình thù độc đáo. Bức ảnh mang […] - Thủ thuật
Premium
Lý do màn hình nhấp nháy khi chơi game và cách khắc phục
Hiện tượng màn hình nhấp nháy khi chơi game đã trở thành một nỗi ám ảnh đối với nhiều game thủ, gây khó chịu và ảnh hưởng đáng kể đến trải nghiệm. Theo các chuyên gia công nghệ, nguyên nhân chính của vấn đề này có thể nằm ở chính công nghệ đồng bộ hóa […] - Mobile
Premium
iPhone 17 Pro và iPhone Air vừa ra mắt đã dính lỗi trầy xước
Ngay khi vừa được bày bán tại các Apple Store trên toàn cầu, bộ đôi iPhone 17 Pro và iPhone Air – hai mẫu máy đang nhận được sự quan tâm đặc biệt của cộng đồng công nghệ – đã bắt đầu ghi nhận những phản ánh đầu tiên về hiện tượng trầy xước. Điều […] - Khám phá
Premium
Jimmy Kimmel bị đình chỉ: ‘Văn hóa tẩy chay’ hay áp lực chính trị?
Mới đây, đài truyền hình ABC, thuộc sở hữu của Disney, đã đột ngột đình chỉ chương trình nổi tiếng Jimmy Kimmel Live. Quyết định này được đưa ra ngay sau khi nam MC có một bình luận gây tranh cãi về vụ án mạng liên quan đến Charlie Kirk. Sự việc nhanh chóng trở […]
Bài viết liên quan
Hubble của NASA và ESA công bố hình ảnh ngoạn mục về lõi thiên hà Xì gà
Lý do màn hình nhấp nháy khi chơi game và cách khắc phục
iPhone 17 Pro và iPhone Air vừa ra mắt đã dính lỗi trầy xước
Jimmy Kimmel bị đình chỉ: ‘Văn hóa tẩy chay’ hay áp lực chính trị?
Pinterest bị sập toàn cầu, nghi vấn do sự cố từ Amazon Web Services
Thiết bị ‘siêu máy tính AI’ cá nhân của Nvidia sẵn sàng ra mắt thị trường vào 15/10
California thiết lập khung pháp lý cho các ứng dụng chatbot AI
Ferrari hé lộ thông tin chi tiết về mẫu xe điện đầu tiên, hứa hẹn hiệu suất vượt trội
Fan hâm mộ Taylor Swift phản ứng trước nghi vấn cô dùng hình ảnh tạo bởi AI trong chiến dịch quảng bá
Nền tảng ChatGPT của OpenAI chính thức trình làng tính năng tích hợp đa ứng dụng
Doanh số ‘khủng’ của Tesla liệu có đủ trấn an nỗi lo về sự ảm đạm của ngành xe điện toàn cầu?
Nội bộ OpenAI đang đối mặt với những thách thức từ chiến lược truyền thông xã hội mới của công ty
OpenAI công bố mô hình Sora 2 và ứng dụng chia sẻ video, mục tiêu cạnh tranh với Tiktok
Thông tin sai lệch của nền tảng Deepseek AI về chủ quyền biển đảo Việt Nam gây tranh cãi
DeepSeek: Từ A đến Z về ứng dụng trò chuyện AI được giới công nghệ quan tâm
XP-Pen Artist Ultra 16: Bảng vẽ 4K AMOLED cho dân thiết kế chuyên nghiệp
Robot siêu nhỏ “đi bộ trên nước” lấy cảm hứng từ côn trùng nước
Coros Apex 4: Đối thủ mới của Garmin trong thế giới đồng hồ thể thao GPS?
Vision Mini: Kính “xem TV” di động với màn hình 3.8K, hỗ trợ người cận thị nặng

ĐĂNG KÝ NHẬN TIN
NGAY HÔM NAY
Đăng ký để nhận thông tin sớm nhất về những câu chuyện nóng hổi hiện nay trên thị trường, công nghệ được cung cấp hàng ngày.
Bằng cách nhấp vào “Đăng ký”, bạn chấp nhận Điều khoản dịch vụ và Chính sách quyền riêng tư của chúng tôi. Bạn có thể chọn không tham gia bất cứ lúc nào.


Nhận xét (0)