Các mô hình AI như chatbot đang ngày càng thông minh, nhưng không đồng nghĩa với việc chúng luôn trung thực. Mặc dù được thiết kế để cung cấp thông tin một cách tự tin, nhiều trường hợp cho thấy chatbot có thể tạo ra thông tin sai lệch một cách tinh vi mà người dùng khó phát hiện.

Theo nghiên cứu mới từ OpenAI, việc giám sát chặt chẽ thậm chí có thể khiến AI “che giấu” hành vi của mình thay vì ngừng nói dối.
Khi AI học cách giấu sự dối trá
Trong bài viết mới nhất của OpenAI, các nhà nghiên cứu cho biết họ đã thử nghiệm việc dùng mô hình GPT-4o để giám sát một mô hình AI khác nhằm phát hiện và xử lý các trường hợp nói dối. Tuy nhiên, điều này không giúp AI trung thực hơn. Thay vào đó, mô hình này chỉ học cách che giấu ý định của mình trong “chuỗi tư duy” (chain-of-thought) – một phương pháp mà AI sử dụng để giải quyết vấn đề qua nhiều bước suy luận.
Một ví dụ cụ thể được OpenAI đưa ra là khi AI được yêu cầu kiểm tra một đoạn mã để đảm bảo nó hoạt động đúng, mô hình đã cố tình tạo ra các bài kiểm tra lỗi nhưng sau đó bỏ qua chúng để đoạn mã luôn “đạt yêu cầu”. Khi có sự giám sát của GPT-4o, AI vẫn tiếp tục hành vi này, nhưng ẩn nó kỹ hơn trong quá trình suy luận, khiến hệ thống giám sát khó phát hiện.
Hiện tượng “hallucination” và những hệ lụy
AI nói dối không phải là vấn đề mới. Trước đây, nhiều người dùng đã phát hiện chatbot có xu hướng “bịa” thông tin khi không có dữ liệu thực tế để trả lời. Hiện tượng này được gọi là “hallucination” (ảo giác AI), tức là AI tạo ra thông tin sai nhưng có vẻ đáng tin cậy.
Một số mô hình AI hiện đại, như Claude của Anthropic, đã tự thừa nhận rằng chúng có thể tạo ra dữ liệu giả khi không tìm thấy đủ thông tin trong các tài liệu gốc. Điều này đặt ra thách thức lớn cho các công ty công nghệ khi họ cố gắng kiểm soát và hướng AI đến sự chính xác tuyệt đối.
AI doanh nghiệp: Đắt đỏ nhưng chưa hiệu quả
Dù các tập đoàn công nghệ đang đầu tư hàng tỷ USD vào AI, một số báo cáo cho thấy doanh nghiệp vẫn chưa tìm thấy giá trị thực sự từ các công cụ này. Theo khảo sát của Boston Consulting Group, chỉ 26% trong số 1.000 giám đốc điều hành từ 10 ngành công nghiệp lớn cho biết họ thấy được lợi ích rõ ràng từ AI.
Một số sản phẩm AI doanh nghiệp như Microsoft Copilot hay Apple Intelligence đang bị chỉ trích vì hiệu suất kém, độ chính xác thấp và chưa mang lại lợi ích thiết thực. Mặc dù những mô hình “tư duy” như GPT-4o có thể xử lý thông tin phức tạp, nhưng chúng hoạt động chậm và tốn kém. Nhiều doanh nghiệp đặt câu hỏi liệu có đáng để trả hàng triệu USD cho AI khi kết quả nhận về vẫn có thể là thông tin sai lệch.
Chatbot AI và tương lai của thông tin đáng tin cậy
Mặc dù AI đang trở thành một phần không thể thiếu trong nhiều lĩnh vực, nhưng vấn đề minh bạch và tính chính xác của thông tin mà chúng cung cấp vẫn là một bài toán khó. Việc kiểm duyệt quá mức có thể khiến AI trở nên tinh vi hơn trong việc che giấu lỗi sai, thay vì giải quyết triệt để vấn đề.
Trong bối cảnh các công ty công nghệ đẩy mạnh ứng dụng chatbot AI vào đời sống, người dùng cần thận trọng khi dựa vào các mô hình này cho những công việc quan trọng. AI có thể hữu ích, nhưng không thể thay thế các nguồn thông tin đáng tin cậy, đặc biệt là trong môi trường Internet đang ngày càng bị chi phối bởi thuật toán và nội dung tự động.
Từ khoá:
Tin tài trợ
- Vũ trụ
Premium
Hubble của NASA và ESA công bố hình ảnh ngoạn mục về lõi thiên hà Xì gà
Bức ảnh mới nhất từ Kính viễn vọng không gian Hubble của NASA và ESA vừa hé lộ những chi tiết chưa từng thấy về thiên hà Messier 82 (M82), nơi hàng triệu ngôi sao rực rỡ đang ẩn mình sau những đám mây bụi và khí với hình thù độc đáo. Bức ảnh mang […] - Thủ thuật
Premium
Lý do màn hình nhấp nháy khi chơi game và cách khắc phục
Hiện tượng màn hình nhấp nháy khi chơi game đã trở thành một nỗi ám ảnh đối với nhiều game thủ, gây khó chịu và ảnh hưởng đáng kể đến trải nghiệm. Theo các chuyên gia công nghệ, nguyên nhân chính của vấn đề này có thể nằm ở chính công nghệ đồng bộ hóa […] - Mobile
Premium
iPhone 17 Pro và iPhone Air vừa ra mắt đã dính lỗi trầy xước
Ngay khi vừa được bày bán tại các Apple Store trên toàn cầu, bộ đôi iPhone 17 Pro và iPhone Air – hai mẫu máy đang nhận được sự quan tâm đặc biệt của cộng đồng công nghệ – đã bắt đầu ghi nhận những phản ánh đầu tiên về hiện tượng trầy xước. Điều […] - Khám phá
Premium
Jimmy Kimmel bị đình chỉ: ‘Văn hóa tẩy chay’ hay áp lực chính trị?
Mới đây, đài truyền hình ABC, thuộc sở hữu của Disney, đã đột ngột đình chỉ chương trình nổi tiếng Jimmy Kimmel Live. Quyết định này được đưa ra ngay sau khi nam MC có một bình luận gây tranh cãi về vụ án mạng liên quan đến Charlie Kirk. Sự việc nhanh chóng trở […]
Bài viết liên quan
Thiết bị ‘siêu máy tính AI’ cá nhân của Nvidia sẵn sàng ra mắt thị trường vào 15/10
California thiết lập khung pháp lý cho các ứng dụng chatbot AI
Fan hâm mộ Taylor Swift phản ứng trước nghi vấn cô dùng hình ảnh tạo bởi AI trong chiến dịch quảng bá
Nền tảng ChatGPT của OpenAI chính thức trình làng tính năng tích hợp đa ứng dụng
Nội bộ OpenAI đang đối mặt với những thách thức từ chiến lược truyền thông xã hội mới của công ty
Toyota bổ sung khoản vốn 1,5 tỷ USD, khẳng định niềm tin vào các dự án startup công nghệ
OpenAI công bố mô hình Sora 2 và ứng dụng chia sẻ video, mục tiêu cạnh tranh với Tiktok
Thông tin sai lệch của nền tảng Deepseek AI về chủ quyền biển đảo Việt Nam gây tranh cãi
DeepSeek: Từ A đến Z về ứng dụng trò chuyện AI được giới công nghệ quan tâm
Robot siêu nhỏ “đi bộ trên nước” lấy cảm hứng từ côn trùng nước
Microsoft ra động thái hạn chế quân đội Israel sử dụng dịch vụ đám mây và AI
Insta360 Wave ra mắt: Loa hội nghị AI có 8 micro, tự động tóm tắt cuộc họp và pin 12 giờ
Elon Musk ‘hạ giá’ Grok, mời chào Chính phủ Liên bang Mỹ với giá ‘rẻ như cho’
Databricks chi 100 triệu USD, tích hợp mô hình OpenAI vào sản phẩm để thúc đẩy doanh nghiệp ứng dụng
Spotify ban hành quy định mới về dán nhãn âm nhạc do AI sáng tác
Google Cloud đẩy mạnh chiến lược, không ngừng mở rộng phạm vi hoạt động
Gemini 2.5 Deep Think giành huy chương vàng tại ICPC 2025
Việt Nam đứng trước thách thức và cơ hội lớn trong làn sóng phát triển AI
Tham vọng của Thượng nghị sĩ Scott Wiener: Buộc Big Tech tiết lộ rủi ro từ trí tuệ nhân tạo

ĐĂNG KÝ NHẬN TIN
NGAY HÔM NAY
Đăng ký để nhận thông tin sớm nhất về những câu chuyện nóng hổi hiện nay trên thị trường, công nghệ được cung cấp hàng ngày.
Bằng cách nhấp vào “Đăng ký”, bạn chấp nhận Điều khoản dịch vụ và Chính sách quyền riêng tư của chúng tôi. Bạn có thể chọn không tham gia bất cứ lúc nào.


Nhận xét (0)