Trong một nghiên cứu gần đây, các nhà khoa học từ Đại học Pennsylvania đã phát hiện ra rằng mô hình ngôn ngữ lớn (LLM) có thể bị lợi dụng để điều khiển robot thực hiện hành vi nguy hiểm trong thế giới thực.
Thí nghiệm cho thấy, robot sử dụng LLM có thể bị “hack” để làm những việc như bỏ qua biển báo dừng, lái xe ra ngoài phạm vi an toàn, hay thậm chí là tìm cách gây nổ bom.
“Hack” robot dễ dàng
Nhóm nghiên cứu đã phát triển một kỹ thuật giúp tạo ra các lệnh “jailbreak” để robot làm sai các quy tắc bảo mật của mình. Họ thử nghiệm với một chiếc xe tự lái mô phỏng và một robot bánh xe, yêu cầu chúng thực hiện những hành động không an toàn. Ví dụ, robot được yêu cầu thực hiện một nhiệm vụ trong trò chơi video, dẫn đến việc bỏ qua các biển báo hoặc đi vào khu vực nguy hiểm.
Rủi ro từ AI trong thế giới vật lý
Các mô hình ngôn ngữ lớn đang ngày càng được ứng dụng trong nhiều hệ thống quan trọng như xe tự lái và thiết bị y tế. Nhưng nghiên cứu này cho thấy khi AI được sử dụng trong các robot hay hệ thống vật lý, nó có thể bị lợi dụng qua nhiều hình thức như hình ảnh, âm thanh hay tín hiệu cảm biến.
Cần bảo vệ chặt chẽ hơn
Mặc dù các LLM thường được tinh chỉnh để tránh hành vi sai trái, nhưng tính chất của chúng vẫn có thể bị khai thác để gây hại. Các nhà nghiên cứu cảnh báo rằng, với sự phát triển nhanh chóng của AI, chúng ta cần có các biện pháp bảo mật mạnh mẽ hơn để ngăn chặn các nguy cơ này.
Những phát hiện này cho thấy rằng việc sử dụng LLM trong robot và các hệ thống vật lý có thể gây ra những rủi ro lớn. Để đảm bảo an toàn, cần phải nghiên cứu và triển khai các lớp bảo vệ, bảo mật khi ứng dụng AI vào thế giới thực.
Tin tài trợ
-
Tài trợMobile
Lava Blaze Duo 5G: Điện thoại màn hình kép đầy sáng tạo
Lava, thương hiệu điện thoại thông minh đến từ Ấn Độ, vừa chính thức ra mắt mẫu điện thoại mới Blaze Duo 5G, nổi bật với thiết kế màn hình kép độc đáo. Đây là bước tiếp nối sau thành công của mẫu Agni 3 ra mắt vào tháng 10 vừa qua. Thiết kế sáng […] -
Tài trợMobile
FiiO ra mắt JadeAudio JF11: Tai nghe có dây đáng mua nhất hiện nay?
FiiO vừa giới thiệu tai nghe có dây JadeAudio JF11, được thiết kế với củ loa kích thước lớn và ống dẫn âm thanh nhằm mang đến âm trầm sâu, độ méo tiếng thấp và âm thanh mượt mà. Dòng tai nghe này được thiết kế để nằm bên trong ống tai, với đầu tai […] -
Tài trợKhám phá
BenQ RD320U: Màn hình lập trình 4K cho dân công nghệ
BenQ vừa chính thức ra mắt màn hình lập trình RD320U 31,5 inch tại thị trường Trung Quốc. Với mức giá 5.299 nhân dân tệ (khoảng 18,5 triệu VNĐ), sản phẩm này hướng đến các lập trình viên và người làm việc sáng tạo, cần một màn hình lớn, độ phân giải cao và khả […] -
Tài trợMobile
Moto G05 và E15: Bộ đôi smartphone giá rẻ cho người dùng
Motorola vừa công bố hai mẫu điện thoại thông minh mới thuộc phân khúc giá rẻ là Moto G05 và Moto E15, nhắm đến người dùng muốn sở hữu thiết bị với đầy đủ tính năng cơ bản nhưng không cần chi tiêu quá nhiều. Cả hai mẫu máy tập trung vào hiệu năng ổn […]
Bài viết liên quan
Insta360 Connect: Tối ưu họp trực tuyến với camera 4K và AI
Kính thông minh Meta “lột xác” với AI và Shazam, nhận diện bài hát tức thì
Romi Lacatan: Robot AI hỗ trợ giao tiếp, giúp đỡ người cô đơn
Google “phản công” với AI tạo video mới, cạnh tranh trực tiếp với Sora
AI tham gia vào quá trình sản xuất bánh Oreo, hứa hẹn nhiều điều thú vị
Người dùng Google được trải nghiệm Gemini 2.0 Experimental Advanced
o1 của OpenAI: Mở ra kỷ nguyên mới cho phát triển ứng dụng AI?
Whisk: Công cụ AI mới của Google sử dụng hình ảnh làm gợi ý, thay vì văn bản
Đột phá công nghệ: Chuột robot giúp chuột thật không còn cô đơn
Thời đại AI: Instagram nhấn mạnh vai trò của người sáng tạo nội dung
Trải nghiệm ChatGPT “lên tầm cao mới” với tính năng thư mục
Genmoji trên iOS: Tự tạo biểu tượng cảm xúc theo phong cách riêng
Bạn đã biết cách theo dõi gói quà mùa lễ trong Gmail?
Google Gemini: AI “thần thánh” mới của Google có gì đặc biệt?
Công cụ watermarking video AI của Meta: Bước tiến mới trong cuộc chiến chống deepfake
ChatGPT App ra mắt tính năng chia sẻ video và màn hình
AI của YouTube: Con dao hai lưỡi trong việc tăng tương tác và gây nhiễu thông tin
Chip “Baltra”: Động thái mới của Apple trong cuộc đua AI
X “chơi trò ú oà” với người dùng, thêm rồi lại xóa ‘Aurora’?
ĐĂNG KÝ NHẬN TIN
NGAY HÔM NAY
Đăng ký để nhận thông tin sớm nhất về những câu chuyện nóng hổi hiện nay trên thị trường, công nghệ được cung cấp hàng ngày.
Bằng cách nhấp vào “Đăng ký”, bạn chấp nhận Điều khoản dịch vụ và Chính sách quyền riêng tư của chúng tôi. Bạn có thể chọn không tham gia bất cứ lúc nào.
5
s
Nhận xét (0)