OpenAI mạnh tay ngăn chặn công cụ giám sát mạng xã hội sử dụng ChatGPT
00:26 26/02/2025
3 phút đọc
Không còn nghi ngờ gì nữa, mỗi khi một sản phẩm được tung lên mạng Internet, luôn có một bộ phận người dùng – thường là rất đông – tìm cách lạm dụng nó. Điều này giải thích tại sao ChatGPT cũng không tránh khỏi việc bị một số cá nhân sử dụng sai mục đích, vi phạm chính sách của OpenAI và các quy định về quyền riêng tư. Dù các nhà phát triển luôn nỗ lực để phát hiện và ngăn chặn, nhưng không phải lúc nào họ cũng có thể kiểm soát hoàn toàn, và khi phát hiện ra sai phạm, họ sẽ áp dụng biện pháp xử lý nghiêm khắc.
Gần đây, OpenAI đã công bố một báo cáo chi tiết về những nỗ lực lạm dụng dịch vụ ChatGPT. Họ đã phát hiện ra một nhóm người dùng từ Trung Quốc lợi dụng khả năng “lý luận” của ChatGPT để phát triển một công cụ giám sát các nền tảng mạng xã hội. Nhóm này đã sử dụng chatbot để xin tư vấn về chiến lược kinh doanh và kiểm tra mã nguồn của công cụ.
OpenAI nhấn mạnh rằng sứ mệnh của họ là xây dựng các mô hình AI “dân chủ”, một công nghệ mang lại lợi ích cho mọi người thông qua việc thực thi các quy tắc cơ bản. Công ty đã chủ động tìm kiếm các hành vi lạm dụng hoặc gây rối tiềm ẩn từ nhiều bên liên quan và đã ghi nhận một số trường hợp đáng chú ý xuất phát từ Trung Quốc.
Trường hợp đáng chú ý nhất liên quan đến một nhóm tài khoản ChatGPT tập trung vào việc phát triển một công cụ giám sát. Các tài khoản này đã sử dụng mô hình AI của ChatGPT để tạo ra các mô tả chi tiết và các bài chào hàng cho một công cụ “lắng nghe” mạng xã hội.
Phần mềm này, được hỗ trợ bởi các mô hình không phải của OpenAI, có khả năng tạo ra các báo cáo thời gian thực về các cuộc biểu tình ở phương Tây và gửi chúng cho các cơ quan an ninh Trung Quốc. Những người dùng này cũng sử dụng ChatGPT để gỡ lỗi mã nguồn của công cụ. Chính sách của OpenAI nghiêm cấm rõ ràng việc sử dụng công nghệ AI của họ để thực hiện các nhiệm vụ giám sát, bao gồm cả việc theo dõi trái phép thay mặt cho chính phủ và các chế độ độc tài. Các nhà phát triển đã khóa các tài khoản này vì vi phạm các quy tắc của nền tảng.
Những người dùng Trung Quốc đã cố gắng che giấu vị trí của họ bằng cách sử dụng VPN. Họ cũng sử dụng các công cụ truy cập từ xa như AnyDesk và VoIP để tạo vẻ như đang làm việc từ Hoa Kỳ. Tuy nhiên, các tài khoản này tuân theo một mô hình thời gian phù hợp với giờ làm việc của Trung Quốc. Những người dùng này cũng yêu cầu ChatGPT sử dụng tiếng Trung. Công cụ giám sát mà họ đang phát triển sử dụng các mô hình Llama AI của Meta để tạo ra các tài liệu dựa trên dữ liệu giám sát.
Bài viết liên quan
Người dùng Bluesky tranh luận về dữ liệu cá nhân và huấn luyện AI
Người dùng ‘phù phép’ ảnh, xóa bỏ watermark bằng AI mới của Google
Google sẽ loại bỏ trợ lý ảo khỏi phần lớn điện thoại trong năm nay
Notepad sắp được tích hợp tính năng tóm tắt bằng AI
Dự án Kaito: AI phân tích dữ liệu crypto, “bão táp” sau airdrop
Google ra mắt Gemini tùy chỉnh: AI giờ đây ‘hiểu’ bạn hơn
Sam Altman khoe khả năng viết của ChatGPT: AI có thể thay thế nhà văn hay chỉ là bản sao vô hồn?
Teledyne FLIR ra mắt camera nhiệt phóng xạ: “Mắt thần” cho drone, AI và công nghiệp
Manus AI ra mắt AI Agent “siêu năng lực”: Giải quyết vấn đề phức tạp, vượt trội chatbot thông thường
Meta thành công ‘tape-out’ chip AI đầu tiên, sử dụng công nghệ TSMC
OpenAI ra mắt công cụ mới giúp doanh nghiệp tạo chatbot AI “thông minh” hơn
Google Gemini: Cuộc cách mạng AI tại nơi làm việc
Tự động hóa lịch trình với nút AI mới của Google trong Gmail
PlayStation: Sony đang phát triển nhân vật game thông minh AI
Sony mạnh tay gỡ bỏ hơn 75.000 bài hát deepfake AI
Mistral OCR: API nhận dạng ký tự quang học với độ chính xác “vượt trội”
AI “phát điên” sau khi được tinh chỉnh bằng mã lỗi, đưa ra lời khuyên bạo lực và ủng hộ phát xít
Maserati MC20 lập kỷ lục tốc độ mới với “tài xế robot” AI
Google “mạnh tay” với tìm kiếm AI bất chấp lỗi “ảo giác”

ĐĂNG KÝ NHẬN TIN
NGAY HÔM NAY
Đăng ký để nhận thông tin sớm nhất về những câu chuyện nóng hổi hiện nay trên thị trường, công nghệ được cung cấp hàng ngày.
Bằng cách nhấp vào “Đăng ký”, bạn chấp nhận Điều khoản dịch vụ và Chính sách quyền riêng tư của chúng tôi. Bạn có thể chọn không tham gia bất cứ lúc nào.
5
s
Nhận xét (0)