Robot bị hack: Lỗ hổng trong AI có thể gây hại

10:26 08/12/2024

2 phút đọc

Trong một nghiên cứu gần đây, các nhà khoa học từ Đại học Pennsylvania đã phát hiện ra rằng mô hình ngôn ngữ lớn (LLM) có thể bị lợi dụng để điều khiển robot thực hiện hành vi nguy hiểm trong thế giới thực.

 

Robot bị hack: Lỗ hổng trong AI có thể gây hại - Techlade

Thí nghiệm cho thấy, robot sử dụng LLM có thể bị “hack” để làm những việc như bỏ qua biển báo dừng, lái xe ra ngoài phạm vi an toàn, hay thậm chí là tìm cách gây nổ bom.

“Hack” robot dễ dàng

Nhóm nghiên cứu đã phát triển một kỹ thuật giúp tạo ra các lệnh “jailbreak” để robot làm sai các quy tắc bảo mật của mình. Họ thử nghiệm với một chiếc xe tự lái mô phỏng và một robot bánh xe, yêu cầu chúng thực hiện những hành động không an toàn. Ví dụ, robot được yêu cầu thực hiện một nhiệm vụ trong trò chơi video, dẫn đến việc bỏ qua các biển báo hoặc đi vào khu vực nguy hiểm.

Rủi ro từ AI trong thế giới vật lý

Các mô hình ngôn ngữ lớn đang ngày càng được ứng dụng trong nhiều hệ thống quan trọng như xe tự lái và thiết bị y tế. Nhưng nghiên cứu này cho thấy khi AI được sử dụng trong các robot hay hệ thống vật lý, nó có thể bị lợi dụng qua nhiều hình thức như hình ảnh, âm thanh hay tín hiệu cảm biến.

Cần bảo vệ chặt chẽ hơn

Mặc dù các LLM thường được tinh chỉnh để tránh hành vi sai trái, nhưng tính chất của chúng vẫn có thể bị khai thác để gây hại. Các nhà nghiên cứu cảnh báo rằng, với sự phát triển nhanh chóng của AI, chúng ta cần có các biện pháp bảo mật mạnh mẽ hơn để ngăn chặn các nguy cơ này.

Những phát hiện này cho thấy rằng việc sử dụng LLM trong robot và các hệ thống vật lý có thể gây ra những rủi ro lớn. Để đảm bảo an toàn, cần phải nghiên cứu và triển khai các lớp bảo vệ, bảo mật khi ứng dụng AI vào thế giới thực.

Chia sẻ bài viết:

Từ khoá:

Tin tài trợ

Nhận xét (0)

Bài viết liên quan

ĐĂNG KÝ NHẬN TIN

NGAY HÔM NAY

Đăng ký để nhận thông tin sớm nhất về những câu chuyện nóng hổi hiện nay trên thị trường, công nghệ được cung cấp hàng ngày.

    Bằng cách nhấp vào “Đăng ký”, bạn chấp nhận Điều khoản dịch vụ và Chính sách quyền riêng tư của chúng tôi. Bạn có thể chọn không tham gia bất cứ lúc nào.