Mới đây, một báo cáo từ Artificial Analysis cho thấy mô hình ngôn ngữ lớn GPT-4o của OpenAI đã giảm sút đáng kể trong những tuần gần đây, khiến hiệu suất của mô hình hàng đầu này ngang bằng với GPT-4o-mini, mô hình nhỏ hơn và kém khả năng hơn nhiều.
Phân tích này được đưa ra chưa đầy 24 giờ sau khi công ty thông báo nâng cấp cho mô hình GPT-4o. “Khả năng viết sáng tạo của mô hình đã được nâng cấp – tự nhiên hơn, hấp dẫn hơn và viết được cá nhân hóa hơn để cải thiện tính liên quan và khả năng đọc,” OpenAI viết trên X. “Nó cũng tốt hơn trong việc làm việc với các tệp được tải lên, cung cấp những hiểu biết sâu sắc hơn và phản hồi kỹ lưỡng hơn.” Tuy nhiên, những tuyên bố này hiện đang bị nghi ngờ.
“Chúng tôi đã hoàn thành việc chạy các đánh giá độc lập của mình trên bản phát hành GPT-4o của OpenAI vào ngày hôm qua và liên tục đo được điểm đánh giá thấp hơn đáng kể so với bản phát hành GPT-4o vào tháng 8,” Artificial Analysis thông báo qua một bài đăng trên X vào thứ Năm, lưu ý rằng chỉ số chất lượng phân tích nhân tạo của mô hình giảm từ 77 xuống 71 (và hiện bằng với GPT-4o mini).
Hơn nữa, hiệu suất của GPT-4o trên điểm chuẩn GPQA Diamond giảm từ 51% xuống 39% trong khi điểm chuẩn MATH giảm từ 78% xuống 69%.
Đồng thời, các nhà nghiên cứu phát hiện ra tốc độ tăng gấp đôi của phản hồi của mô hình, tăng tốc từ khoảng 80 token đầu ra mỗi giây lên khoảng 180 token/giây. “Chúng tôi thường quan sát thấy tốc độ tăng đáng kể vào ngày ra mắt đối với các mô hình của OpenAI (có thể là do OpenAI cung cấp khả năng trước khi áp dụng), nhưng trước đây chưa từng thấy sự khác biệt về tốc độ gấp 2 lần,” các nhà nghiên cứu viết.
“Dựa trên dữ liệu này, chúng tôi kết luận rằng mô hình GPT-4o ngày 20 tháng 11 của OpenAI có thể là một mô hình nhỏ hơn so với bản phát hành tháng 8,” họ tiếp tục. “Vì OpenAI chưa giảm giá cho phiên bản ngày 20 tháng 11, chúng tôi khuyến nghị các nhà phát triển không chuyển khối lượng công việc khỏi phiên bản tháng 8 mà không kiểm tra kỹ lưỡng.”
GPT-4o lần đầu tiên được phát hành vào tháng 5 năm 2024 để vượt qua các mô hình GPT-3.5 và GPT-4 hiện có. Theo OpenAI, GPT-4o cung cấp kết quả điểm chuẩn hàng đầu trong các nhiệm vụ giọng nói, đa ngôn ngữ và thị giác, khiến nó trở nên lý tưởng cho các ứng dụng tiên tiến như dịch thuật thời gian thực và AI hội thoại.
Tin tài trợ
-
Tài trợMobile
Blackview Oscal Pilot 1: Smartphone siêu bền với pin khủng
Blackview, một thương hiệu nổi tiếng với các dòng smartphone siêu bền, vừa cho ra mắt mẫu điện thoại mới Oscal Pilot 1. Đây là một chiếc smartphone được thiết kế đặc biệt để đáp ứng nhu cầu của những người yêu thích sự bền bỉ và các tính năng mạnh mẽ, nhưng không yêu […] -
Tài trợMobile
Sony LinkBuds Fit & Open: Tai nghe nhỏ gọn nhất, âm thanh vòm sống động
Tháng 12/2024, Sony ra mắt bộ đôi tai nghe LinkBuds Fit và LinkBuds Open tại thị trường Việt Nam, mang đến lựa chọn mới cho người dùng dịp mua sắm cuối năm. Cùng thuộc dòng LinkBuds, nhưng hai sản phẩm này sở hữu thiết kế và tính năng độc đáo, hướng đến những đối tượng […] -
Tài trợMáy tính
MeLE Overclock X5: Máy tính mini mạnh mẽ với cấu hình vượt trội
MeLE vừa ra mắt một hệ thống máy tính mini mới, Overclock X5, mang lại sự cải tiến đáng kể so với phiên bản trước đó. Với bộ vi xử lý mạnh mẽ hơn, dung lượng RAM và bộ nhớ lưu trữ lớn hơn, cùng với một loạt cổng kết nối đa dạng, Overclock X5 […] -
Tài trợKhám phá
Moflin: Thú cưng robot AI mang đến trải nghiệm gần gũi như thật
Casio, thương hiệu quen thuộc với đồng hồ và máy tính, vừa bước vào lĩnh vực mới khi ra mắt Moflin – một chú thú cưng robot nhỏ gọn được hỗ trợ bởi trí tuệ nhân tạo. Với thiết kế lông mềm mịn và khả năng “gắn kết” với chủ nhân, Moflin không chỉ là […]
Bài viết liên quan
Moflin: Thú cưng robot AI mang đến trải nghiệm gần gũi như thật
AI và tác động xã hội: Khi trí tuệ nhân tạo đối mặt với sự bất công
Gemini Deep Research: Khám phá thông tin sâu rộng bằng nhiều ngôn ngữ
Nghiên cứu AI: Bước tiến hay rào cản cho sự sáng tạo?
Ra mắt khu vườn AI, du khách có thể trò chuyện với cây cối
xAI của Elon Musk gọi vốn thành công 6 tỷ USD
OpenAI ra mắt mô hình o3, mạnh mẽ hơn GPT, bỏ qua GPT-5?
ASUS trình làng laptop Copilot+ nhẹ nhất thế giới tại CES 2025
Công nghệ làm mát lai AI: Tương lai của tủ lạnh hiện đại
Google hợp tác với Anthropic, sử dụng Claude để cải thiện Gemini AI
Bách khoa toàn thư Britannica hồi sinh với trí tuệ nhân tạo
Drone AI trong chiến lược quân sự hiện đại
AI mới trong Chrome sẽ bảo vệ dữ liệu người dùng
Gemini “hô biến” ứng dụng Files by Google thành “siêu ứng dụng” đọc PDF
Face ID trên chuông cửa: Apple nâng tầm an ninh cho ngôi nhà?
NUC 14 Pro AI của ASUS: Sức mạnh AI trong một chiếc mini PC
OpenAI “khuấy đảo” giới công nghệ với mô hình o3 mới
Huấn luyện robot nhanh gấp 430,000 lần với Genesis
Google Gemini Deep Research: Tìm kiếm thông tin dễ dàng và nhanh chóng hơn bao giờ hết
ĐĂNG KÝ NHẬN TIN
NGAY HÔM NAY
Đăng ký để nhận thông tin sớm nhất về những câu chuyện nóng hổi hiện nay trên thị trường, công nghệ được cung cấp hàng ngày.
Bằng cách nhấp vào “Đăng ký”, bạn chấp nhận Điều khoản dịch vụ và Chính sách quyền riêng tư của chúng tôi. Bạn có thể chọn không tham gia bất cứ lúc nào.
5
s
Nhận xét (0)