Dù đạt điểm cao trong các kỳ thi y khoa, trí tuệ nhân tạo (AI) vẫn chưa làm tốt nhiệm vụ giao tiếp với bệnh nhân để thu thập thông tin và đưa ra chẩn đoán chính xác. Một nghiên cứu mới cho thấy AI y tế đang gặp khó khăn trong việc xử lý các tình huống tương tác thực tế với bệnh nhân.
Kết quả ấn tượng nhưng chưa đủ thực tế
Các mô hình trí tuệ nhân tạo tiên tiến, như GPT-4 của OpenAI, đã đạt thành tích ấn tượng với độ chính xác lên tới 82% khi thực hiện chẩn đoán từ các bản tóm tắt ca bệnh và lựa chọn đáp án từ danh sách có sẵn. Tuy nhiên, độ chính xác giảm mạnh xuống chỉ còn 26% khi AI phải thực hiện chẩn đoán thông qua các cuộc trò chuyện mô phỏng với bệnh nhân.
Theo Pranav Rajpurkar, chuyên gia tại Đại học Harvard, vấn đề nằm ở khả năng tương tác. “Các mô hình ngôn ngữ lớn tuy thể hiện xuất sắc trong các bài kiểm tra trắc nghiệm, nhưng độ chính xác giảm đáng kể trong các cuộc hội thoại động,” ông nhận định.
CRAFT-MD: Tiêu chuẩn đánh giá mới cho AI y tế
Để kiểm tra khả năng của AI trong môi trường y tế thực tế, các nhà nghiên cứu đã phát triển tiêu chuẩn CRAFT-MD, tập trung vào các cuộc trò chuyện mô phỏng giữa bác sĩ và bệnh nhân.
Bộ dữ liệu này dựa trên 2.000 ca bệnh từ các kỳ thi y khoa chuyên nghiệp tại Mỹ, với sự tham gia của GPT-4 đóng vai trò “bệnh nhân AI.” Kết quả được đối chiếu bởi các chuyên gia y tế nhằm đảm bảo độ chính xác.
Theo Shreya Johri, đồng tác giả nghiên cứu tại Harvard, CRAFT-MD phản ánh thực tế, khi bệnh nhân không biết phải cung cấp thông tin nào quan trọng và thường chỉ tiết lộ khi được hỏi đúng câu. Điều này giúp đánh giá kỹ năng lấy tiền sử bệnh – yếu tố không thể kiểm tra qua các bài thi lý thuyết.
Khả năng thu thập thông tin: Vấn đề lớn của AI
Ngay cả mô hình tốt nhất là GPT-4 cũng chỉ thu thập đầy đủ tiền sử bệnh trong 71% các cuộc trò chuyện mô phỏng. Thêm vào đó, mặc dù có đủ thông tin, AI vẫn thường xuyên đưa ra chẩn đoán không chính xác.
Điều này cho thấy khoảng cách lớn giữa hiệu suất của AI trong môi trường giả lập và khả năng ứng dụng thực tế. Các mô hình AI khác, như GPT-3.5 của OpenAI hay Llama-2 của Meta, đều có hiệu suất thấp hơn hoặc không ổn định trong các thử nghiệm này.
AI không thể thay thế bác sĩ
Eric Topol, nhà nghiên cứu tại Viện Scripps, nhận xét rằng tiêu chuẩn CRAFT-MD là bước tiến quan trọng để đánh giá AI trong y tế. Tuy nhiên, ông nhấn mạnh rằng việc AI vượt qua tiêu chuẩn này không đồng nghĩa với việc nó sẽ thay thế bác sĩ.
Theo Rajpurkar, thực hành y khoa không chỉ là đưa ra chẩn đoán mà còn bao gồm quản lý nhiều bệnh nhân, phối hợp với đội ngũ y tế và hiểu rõ các yếu tố xã hội, hệ thống y tế địa phương. AI, dù có mạnh mẽ đến đâu, vẫn chưa thể sánh với kinh nghiệm và phán đoán toàn diện của các bác sĩ thực thụ.
Tương lai của AI trong y tế
Dù còn nhiều hạn chế, AI vẫn có tiềm năng trở thành công cụ hỗ trợ mạnh mẽ trong y tế, giúp bác sĩ phân tích nhanh dữ liệu và đưa ra gợi ý chẩn đoán. Tuy nhiên, để đạt được điều này, cần tiếp tục cải thiện khả năng giao tiếp và xử lý thông tin thực tế của các mô hình AI.
Nghiên cứu này không chỉ cho thấy tiềm năng mà còn nhấn mạnh thách thức lớn đối với việc tích hợp AI vào ngành y tế, nơi con người vẫn giữ vai trò trung tâm.
Tin tài trợ
-
Tài trợMobile
Nubia V70 Max ra mắt ngày 15/2, hứa hẹn thay đổi cuộc chơi
Nubia, thương hiệu con của ZTE, vừa xác nhận kế hoạch ra mắt một chiếc smartphone giá rẻ mới vào ngày 15 tháng 2, V70 Max. Được quảng cáo là “game-changer” và “điện thoại bền bỉ”, Nubia V70 Max sở hữu một số thông số kỹ thuật khá tốt cho một smartphone giá cả phải […] -
Tài trợMobile
Volla Phone Quintus: Bảo mật “tuyệt đối”, không Google
Sau chiến dịch gây quỹ trên Kickstarter, chiếc smartphone mới nhất của Volla Phone, Quintus, đã chính thức “lên kệ” tại cửa hàng trực tuyến của hãng. Hiện tại, thiết bị được giao hàng tới tất cả các quốc gia EU và Anh. Giá khởi điểm là 719 euro (khoảng 18,5 triệu VNĐ), nhưng người […] -
Tài trợQuảng cáo
Công tắc thông minh Aqara Touchscreen Dial V1 chính thức mở bán
Aqara vừa chính thức giới thiệu Touchscreen Dial V1 tại thị trường châu Âu. Đây là một công tắc thông minh tích hợp màn hình cảm ứng và núm xoay, giúp người dùng điều khiển nhiều thiết bị trong hệ sinh thái nhà thông minh một cách linh hoạt. Đặc biệt, sản phẩm hỗ trợ […] -
Tài trợKhám phá
Phantom T2110: Máy quay “siêu chậm” 483.330 khung hình/giây
Phantom vừa ra mắt T2110, mẫu máy quay tốc độ cao mới nhất của hãng, có khả năng quay video “siêu chậm” với tốc độ lên đến 483.330 khung hình/giây. Cảm biến 1MP, quay video 21.000 fps T2110 là mẫu máy quay mới “giá rẻ” nhất trong dòng T-series, nhưng vẫn sở hữu tốc độ […]
Bài viết liên quan
Humphrey: Trí tuệ nhân tạo mới giúp hiện đại hóa hành chính
AI mô phỏng tiến hóa 500 triệu năm để tạo ra protein mới
Trung Quốc đón đầu xu hướng với robot AI phục vụ đường sắt
OpenAI ra mắt Operator: AI “lướt web” và hoàn thành nhiệm vụ
Google đã giành được sự chú ý lớn hơn Samsung tại sự kiện Unpacked
OpenAI “ém hàng” Operator, công cụ AI với khả năng đáng kinh ngạc?
ChatGPT “chống lại” Google: Lãnh đạo sản phẩm làm chứng chống độc quyền
Cải tiến trải nghiệm AI: Google cấp phép tin tức AP cho Gemini
MiniMax vs. OpenAI: Cuộc chiến mới trong lĩnh vực AI?
GenEx: Công nghệ biến ảnh tĩnh thành thế giới ảo sống động
Máy tính lượng tử lớn nhất: AI giúp tối ưu hóa sắp xếp nguyên tử
Trợ lý ảo Mercedes-Benz được nâng cấp với AI đàm thoại của Google
Nvidia ủng hộ Trump, chỉ trích chính sách AI của Biden
Elon Musk: Dữ liệu tổng hợp là chìa khóa cho tương lai AI
OpenAI đưa ra “bản thiết kế” mới cho quy định AI
Ballie – Robot AI “vạn năng” của Samsung sắp ra mắt trong năm nay
Hugging Face dàn xếp vụ kiện vi phạm bằng sáng chế với FriendliAI
Phụ đề AI ngoại tuyến: Cách mạng hóa trải nghiệm xem phim
Grok AI: Điều gì khiến trợ lý AI này trở nên đặc biệt?
ĐĂNG KÝ NHẬN TIN
NGAY HÔM NAY
Đăng ký để nhận thông tin sớm nhất về những câu chuyện nóng hổi hiện nay trên thị trường, công nghệ được cung cấp hàng ngày.
Bằng cách nhấp vào “Đăng ký”, bạn chấp nhận Điều khoản dịch vụ và Chính sách quyền riêng tư của chúng tôi. Bạn có thể chọn không tham gia bất cứ lúc nào.
5
s
Nhận xét (0)