Dù đạt điểm cao trong các kỳ thi y khoa, trí tuệ nhân tạo (AI) vẫn chưa làm tốt nhiệm vụ giao tiếp với bệnh nhân để thu thập thông tin và đưa ra chẩn đoán chính xác. Một nghiên cứu mới cho thấy AI y tế đang gặp khó khăn trong việc xử lý các tình huống tương tác thực tế với bệnh nhân.

Kết quả ấn tượng nhưng chưa đủ thực tế
Các mô hình trí tuệ nhân tạo tiên tiến, như GPT-4 của OpenAI, đã đạt thành tích ấn tượng với độ chính xác lên tới 82% khi thực hiện chẩn đoán từ các bản tóm tắt ca bệnh và lựa chọn đáp án từ danh sách có sẵn. Tuy nhiên, độ chính xác giảm mạnh xuống chỉ còn 26% khi AI phải thực hiện chẩn đoán thông qua các cuộc trò chuyện mô phỏng với bệnh nhân.
Theo Pranav Rajpurkar, chuyên gia tại Đại học Harvard, vấn đề nằm ở khả năng tương tác. “Các mô hình ngôn ngữ lớn tuy thể hiện xuất sắc trong các bài kiểm tra trắc nghiệm, nhưng độ chính xác giảm đáng kể trong các cuộc hội thoại động,” ông nhận định.
CRAFT-MD: Tiêu chuẩn đánh giá mới cho AI y tế
Để kiểm tra khả năng của AI trong môi trường y tế thực tế, các nhà nghiên cứu đã phát triển tiêu chuẩn CRAFT-MD, tập trung vào các cuộc trò chuyện mô phỏng giữa bác sĩ và bệnh nhân.
Bộ dữ liệu này dựa trên 2.000 ca bệnh từ các kỳ thi y khoa chuyên nghiệp tại Mỹ, với sự tham gia của GPT-4 đóng vai trò “bệnh nhân AI.” Kết quả được đối chiếu bởi các chuyên gia y tế nhằm đảm bảo độ chính xác.
Theo Shreya Johri, đồng tác giả nghiên cứu tại Harvard, CRAFT-MD phản ánh thực tế, khi bệnh nhân không biết phải cung cấp thông tin nào quan trọng và thường chỉ tiết lộ khi được hỏi đúng câu. Điều này giúp đánh giá kỹ năng lấy tiền sử bệnh – yếu tố không thể kiểm tra qua các bài thi lý thuyết.
Khả năng thu thập thông tin: Vấn đề lớn của AI
Ngay cả mô hình tốt nhất là GPT-4 cũng chỉ thu thập đầy đủ tiền sử bệnh trong 71% các cuộc trò chuyện mô phỏng. Thêm vào đó, mặc dù có đủ thông tin, AI vẫn thường xuyên đưa ra chẩn đoán không chính xác.
Điều này cho thấy khoảng cách lớn giữa hiệu suất của AI trong môi trường giả lập và khả năng ứng dụng thực tế. Các mô hình AI khác, như GPT-3.5 của OpenAI hay Llama-2 của Meta, đều có hiệu suất thấp hơn hoặc không ổn định trong các thử nghiệm này.
AI không thể thay thế bác sĩ
Eric Topol, nhà nghiên cứu tại Viện Scripps, nhận xét rằng tiêu chuẩn CRAFT-MD là bước tiến quan trọng để đánh giá AI trong y tế. Tuy nhiên, ông nhấn mạnh rằng việc AI vượt qua tiêu chuẩn này không đồng nghĩa với việc nó sẽ thay thế bác sĩ.
Theo Rajpurkar, thực hành y khoa không chỉ là đưa ra chẩn đoán mà còn bao gồm quản lý nhiều bệnh nhân, phối hợp với đội ngũ y tế và hiểu rõ các yếu tố xã hội, hệ thống y tế địa phương. AI, dù có mạnh mẽ đến đâu, vẫn chưa thể sánh với kinh nghiệm và phán đoán toàn diện của các bác sĩ thực thụ.
Tương lai của AI trong y tế
Dù còn nhiều hạn chế, AI vẫn có tiềm năng trở thành công cụ hỗ trợ mạnh mẽ trong y tế, giúp bác sĩ phân tích nhanh dữ liệu và đưa ra gợi ý chẩn đoán. Tuy nhiên, để đạt được điều này, cần tiếp tục cải thiện khả năng giao tiếp và xử lý thông tin thực tế của các mô hình AI.
Nghiên cứu này không chỉ cho thấy tiềm năng mà còn nhấn mạnh thách thức lớn đối với việc tích hợp AI vào ngành y tế, nơi con người vẫn giữ vai trò trung tâm.
Tin tài trợ
- Vũ trụ
Premium
Hubble của NASA và ESA công bố hình ảnh ngoạn mục về lõi thiên hà Xì gà
Bức ảnh mới nhất từ Kính viễn vọng không gian Hubble của NASA và ESA vừa hé lộ những chi tiết chưa từng thấy về thiên hà Messier 82 (M82), nơi hàng triệu ngôi sao rực rỡ đang ẩn mình sau những đám mây bụi và khí với hình thù độc đáo. Bức ảnh mang […] - Thủ thuật
Premium
Lý do màn hình nhấp nháy khi chơi game và cách khắc phục
Hiện tượng màn hình nhấp nháy khi chơi game đã trở thành một nỗi ám ảnh đối với nhiều game thủ, gây khó chịu và ảnh hưởng đáng kể đến trải nghiệm. Theo các chuyên gia công nghệ, nguyên nhân chính của vấn đề này có thể nằm ở chính công nghệ đồng bộ hóa […] - Mobile
Premium
iPhone 17 Pro và iPhone Air vừa ra mắt đã dính lỗi trầy xước
Ngay khi vừa được bày bán tại các Apple Store trên toàn cầu, bộ đôi iPhone 17 Pro và iPhone Air – hai mẫu máy đang nhận được sự quan tâm đặc biệt của cộng đồng công nghệ – đã bắt đầu ghi nhận những phản ánh đầu tiên về hiện tượng trầy xước. Điều […] - Khám phá
Premium
Jimmy Kimmel bị đình chỉ: ‘Văn hóa tẩy chay’ hay áp lực chính trị?
Mới đây, đài truyền hình ABC, thuộc sở hữu của Disney, đã đột ngột đình chỉ chương trình nổi tiếng Jimmy Kimmel Live. Quyết định này được đưa ra ngay sau khi nam MC có một bình luận gây tranh cãi về vụ án mạng liên quan đến Charlie Kirk. Sự việc nhanh chóng trở […]
Bài viết liên quan
Thiết bị ‘siêu máy tính AI’ cá nhân của Nvidia sẵn sàng ra mắt thị trường vào 15/10
California thiết lập khung pháp lý cho các ứng dụng chatbot AI
Fan hâm mộ Taylor Swift phản ứng trước nghi vấn cô dùng hình ảnh tạo bởi AI trong chiến dịch quảng bá
Nền tảng ChatGPT của OpenAI chính thức trình làng tính năng tích hợp đa ứng dụng
Nội bộ OpenAI đang đối mặt với những thách thức từ chiến lược truyền thông xã hội mới của công ty
Toyota bổ sung khoản vốn 1,5 tỷ USD, khẳng định niềm tin vào các dự án startup công nghệ
OpenAI công bố mô hình Sora 2 và ứng dụng chia sẻ video, mục tiêu cạnh tranh với Tiktok
Thông tin sai lệch của nền tảng Deepseek AI về chủ quyền biển đảo Việt Nam gây tranh cãi
DeepSeek: Từ A đến Z về ứng dụng trò chuyện AI được giới công nghệ quan tâm
Robot siêu nhỏ “đi bộ trên nước” lấy cảm hứng từ côn trùng nước
Microsoft ra động thái hạn chế quân đội Israel sử dụng dịch vụ đám mây và AI
Insta360 Wave ra mắt: Loa hội nghị AI có 8 micro, tự động tóm tắt cuộc họp và pin 12 giờ
Elon Musk ‘hạ giá’ Grok, mời chào Chính phủ Liên bang Mỹ với giá ‘rẻ như cho’
Databricks chi 100 triệu USD, tích hợp mô hình OpenAI vào sản phẩm để thúc đẩy doanh nghiệp ứng dụng
Spotify ban hành quy định mới về dán nhãn âm nhạc do AI sáng tác
Google Cloud đẩy mạnh chiến lược, không ngừng mở rộng phạm vi hoạt động
Gemini 2.5 Deep Think giành huy chương vàng tại ICPC 2025
Việt Nam đứng trước thách thức và cơ hội lớn trong làn sóng phát triển AI
Tham vọng của Thượng nghị sĩ Scott Wiener: Buộc Big Tech tiết lộ rủi ro từ trí tuệ nhân tạo

ĐĂNG KÝ NHẬN TIN
NGAY HÔM NAY
Đăng ký để nhận thông tin sớm nhất về những câu chuyện nóng hổi hiện nay trên thị trường, công nghệ được cung cấp hàng ngày.
Bằng cách nhấp vào “Đăng ký”, bạn chấp nhận Điều khoản dịch vụ và Chính sách quyền riêng tư của chúng tôi. Bạn có thể chọn không tham gia bất cứ lúc nào.


Nhận xét (0)