AI thông minh nhưng lại “mù” xem giờ: Nghiên cứu mới tiết lộ điểm yếu bất ngờ
16:26 28/03/2025
2 phút đọc
Trong khi trí tuệ nhân tạo (AI) ngày càng chứng minh khả năng vượt trội trong nhiều lĩnh vực, từ tạo hình ảnh siêu thực đến dự đoán cấu trúc protein, một nghiên cứu mới đây lại chỉ ra rằng AI gặp khó khăn với một nhiệm vụ tưởng chừng rất cơ bản: xem giờ và đọc lịch.

AI và thử thách xem giờ
Nhóm nghiên cứu tại Đại học Edinburgh đã kiểm tra khả năng của bảy mô hình ngôn ngữ lớn đa phương tiện (MLLM) nổi tiếng, bao gồm GPT-4o, Gemini 2.0, Claude 3.5 Sonnet, và Llama 3.2. Họ yêu cầu các mô hình này trả lời các câu hỏi liên quan đến thời gian dựa trên hình ảnh đồng hồ analog và lịch. Kết quả cho thấy, AI chỉ đọc đúng thời gian trên đồng hồ analog dưới 25% số lần thử nghiệm.
Cụ thể, các mô hình gặp khó khăn khi đọc đồng hồ có số La Mã, kim đồng hồ cách điệu, hoặc thiếu kim giây. Điều này cho thấy vấn đề nằm ở khả năng nhận diện vị trí kim đồng hồ và tính toán góc độ trên mặt đồng hồ.
Đọc lịch cũng không dễ dàng
Khi được yêu cầu trả lời các câu hỏi về lịch, chẳng hạn như “Ngày đầu tiên của năm là thứ mấy?” hay “Ngày thứ 153 của năm là ngày nào?”, các mô hình AI cũng không tỏ ra xuất sắc. GPT-4o là mô hình hoạt động tốt nhất, với độ chính xác 80%, nhưng vẫn mắc lỗi 20% số lần.
Theo các nhà nghiên cứu, việc đọc đồng hồ và lịch đòi hỏi các bước nhận thức phức tạp, bao gồm nhận diện hình ảnh chi tiết (vị trí kim đồng hồ, bố cục ngày trên lịch) và suy luận số học (tính toán ngày tháng). Đây là những kỹ năng mà con người có thể thực hiện dễ dàng từ nhỏ, nhưng lại là thách thức lớn với AI.
Ý nghĩa thực tiễn
Khả năng hiểu và suy luận về thời gian là yếu tố quan trọng trong nhiều ứng dụng thực tế, từ lập lịch trình sự kiện đến hệ thống tự động và công nghệ hỗ trợ. Rohit Saxena, đồng tác giả nghiên cứu, nhấn mạnh: “Những thiếu sót này cần được khắc phục nếu chúng ta muốn tích hợp AI vào các ứng dụng nhạy cảm về thời gian trong thế giới thực.”
Nghiên cứu này một lần nữa nhắc nhở chúng ta rằng, dù AI đã đạt được những bước tiến đáng kinh ngạc, nó vẫn còn nhiều hạn chế cần vượt qua. Trong khi chờ đợi AI hoàn thiện khả năng xem giờ và đọc lịch, có lẽ chúng ta vẫn nên tự mình kiểm tra thời gian để đảm bảo không bị trễ deadline.
Từ khoá:

Tin tài trợ
-
Tài trợ
Casio ra mắt bộ đôi piano điện Celviano: Sang trọng, hiện đại
Casio ra mắt bộ đôi piano điện Celviano: Sang trọng, hiện đạiCasio America, Inc. vừa công bố mở rộng dòng sản phẩm đàn piano điện với hai model mới thuộc dòng Celviano: AP-300 và AP-S200. Cả hai đều được “ưu ái” gọi là “những cây đàn piano hoàn hảo cho người mới bắt đầu”. Thiết kế “sang chảnh”, tính năng hiện đại AP-300 và AP-S200 đều […]
Bài viết liên quan
Người dùng Bluesky tranh luận về dữ liệu cá nhân và huấn luyện AI
Người dùng Bluesky tranh luận về dữ liệu cá nhân và huấn luyện AI
Người dùng ‘phù phép’ ảnh, xóa bỏ watermark bằng AI mới của Google
Người dùng ‘phù phép’ ảnh, xóa bỏ watermark bằng AI mới của Google
Google sẽ loại bỏ trợ lý ảo khỏi phần lớn điện thoại trong năm nay
Google sẽ loại bỏ trợ lý ảo khỏi phần lớn điện thoại trong năm nay
Notepad sắp được tích hợp tính năng tóm tắt bằng AI
Notepad sắp được tích hợp tính năng tóm tắt bằng AI
Dự án Kaito: AI phân tích dữ liệu crypto, “bão táp” sau airdrop
Dự án Kaito: AI phân tích dữ liệu crypto, “bão táp” sau airdrop
Google ra mắt Gemini tùy chỉnh: AI giờ đây ‘hiểu’ bạn hơn
Google ra mắt Gemini tùy chỉnh: AI giờ đây ‘hiểu’ bạn hơn
Sam Altman khoe khả năng viết của ChatGPT: AI có thể thay thế nhà văn hay chỉ là bản sao vô hồn?
Sam Altman khoe khả năng viết của ChatGPT: AI có thể thay thế nhà văn hay chỉ là bản sao vô hồn?
Teledyne FLIR ra mắt camera nhiệt phóng xạ: “Mắt thần” cho drone, AI và công nghiệp
Teledyne FLIR ra mắt camera nhiệt phóng xạ: “Mắt thần” cho drone, AI và công nghiệp
Manus AI ra mắt AI Agent “siêu năng lực”: Giải quyết vấn đề phức tạp, vượt trội chatbot thông thường
Manus AI ra mắt AI Agent “siêu năng lực”: Giải quyết vấn đề phức tạp, vượt trội chatbot thông thường
Meta thành công ‘tape-out’ chip AI đầu tiên, sử dụng công nghệ TSMC
Meta thành công ‘tape-out’ chip AI đầu tiên, sử dụng công nghệ TSMC
OpenAI ra mắt công cụ mới giúp doanh nghiệp tạo chatbot AI “thông minh” hơn
OpenAI ra mắt công cụ mới giúp doanh nghiệp tạo chatbot AI “thông minh” hơn
Google Gemini: Cuộc cách mạng AI tại nơi làm việc
Google Gemini: Cuộc cách mạng AI tại nơi làm việc
Tự động hóa lịch trình với nút AI mới của Google trong Gmail
Tự động hóa lịch trình với nút AI mới của Google trong Gmail
PlayStation: Sony đang phát triển nhân vật game thông minh AI
PlayStation: Sony đang phát triển nhân vật game thông minh AI
Sony mạnh tay gỡ bỏ hơn 75.000 bài hát deepfake AI
Sony mạnh tay gỡ bỏ hơn 75.000 bài hát deepfake AI
Mistral OCR: API nhận dạng ký tự quang học với độ chính xác “vượt trội”
Mistral OCR: API nhận dạng ký tự quang học với độ chính xác “vượt trội”
AI “phát điên” sau khi được tinh chỉnh bằng mã lỗi, đưa ra lời khuyên bạo lực và ủng hộ phát xít
AI “phát điên” sau khi được tinh chỉnh bằng mã lỗi, đưa ra lời khuyên bạo lực và ủng hộ phát xít
Maserati MC20 lập kỷ lục tốc độ mới với “tài xế robot” AI
Maserati MC20 lập kỷ lục tốc độ mới với “tài xế robot” AI
Google “mạnh tay” với tìm kiếm AI bất chấp lỗi “ảo giác”
Google “mạnh tay” với tìm kiếm AI bất chấp lỗi “ảo giác”

ĐĂNG KÝ NHẬN TIN
NGAY HÔM NAY
Đăng ký để nhận thông tin sớm nhất về những câu chuyện nóng hổi hiện nay trên thị trường, công nghệ được cung cấp hàng ngày.
Bằng cách nhấp vào “Đăng ký”, bạn chấp nhận Điều khoản dịch vụ và Chính sách quyền riêng tư của chúng tôi. Bạn có thể chọn không tham gia bất cứ lúc nào.
5
s
Nhận xét (0)