Mới đây, một báo cáo từ Artificial Analysis cho thấy mô hình ngôn ngữ lớn GPT-4o của OpenAI đã giảm sút đáng kể trong những tuần gần đây, khiến hiệu suất của mô hình hàng đầu này ngang bằng với GPT-4o-mini, mô hình nhỏ hơn và kém khả năng hơn nhiều.
Phân tích này được đưa ra chưa đầy 24 giờ sau khi công ty thông báo nâng cấp cho mô hình GPT-4o. “Khả năng viết sáng tạo của mô hình đã được nâng cấp – tự nhiên hơn, hấp dẫn hơn và viết được cá nhân hóa hơn để cải thiện tính liên quan và khả năng đọc,” OpenAI viết trên X. “Nó cũng tốt hơn trong việc làm việc với các tệp được tải lên, cung cấp những hiểu biết sâu sắc hơn và phản hồi kỹ lưỡng hơn.” Tuy nhiên, những tuyên bố này hiện đang bị nghi ngờ.
“Chúng tôi đã hoàn thành việc chạy các đánh giá độc lập của mình trên bản phát hành GPT-4o của OpenAI vào ngày hôm qua và liên tục đo được điểm đánh giá thấp hơn đáng kể so với bản phát hành GPT-4o vào tháng 8,” Artificial Analysis thông báo qua một bài đăng trên X vào thứ Năm, lưu ý rằng chỉ số chất lượng phân tích nhân tạo của mô hình giảm từ 77 xuống 71 (và hiện bằng với GPT-4o mini).
Hơn nữa, hiệu suất của GPT-4o trên điểm chuẩn GPQA Diamond giảm từ 51% xuống 39% trong khi điểm chuẩn MATH giảm từ 78% xuống 69%.
Đồng thời, các nhà nghiên cứu phát hiện ra tốc độ tăng gấp đôi của phản hồi của mô hình, tăng tốc từ khoảng 80 token đầu ra mỗi giây lên khoảng 180 token/giây. “Chúng tôi thường quan sát thấy tốc độ tăng đáng kể vào ngày ra mắt đối với các mô hình của OpenAI (có thể là do OpenAI cung cấp khả năng trước khi áp dụng), nhưng trước đây chưa từng thấy sự khác biệt về tốc độ gấp 2 lần,” các nhà nghiên cứu viết.
“Dựa trên dữ liệu này, chúng tôi kết luận rằng mô hình GPT-4o ngày 20 tháng 11 của OpenAI có thể là một mô hình nhỏ hơn so với bản phát hành tháng 8,” họ tiếp tục. “Vì OpenAI chưa giảm giá cho phiên bản ngày 20 tháng 11, chúng tôi khuyến nghị các nhà phát triển không chuyển khối lượng công việc khỏi phiên bản tháng 8 mà không kiểm tra kỹ lưỡng.”
GPT-4o lần đầu tiên được phát hành vào tháng 5 năm 2024 để vượt qua các mô hình GPT-3.5 và GPT-4 hiện có. Theo OpenAI, GPT-4o cung cấp kết quả điểm chuẩn hàng đầu trong các nhiệm vụ giọng nói, đa ngôn ngữ và thị giác, khiến nó trở nên lý tưởng cho các ứng dụng tiên tiến như dịch thuật thời gian thực và AI hội thoại.
Tin tài trợ
-
Tài trợKhám phá
Hero M5 Ultra: Đồng hồ thông minh hỗ trợ giấc ngủ và sức khỏe
Rollme vừa trình làng Hero M5 Ultra, phiên bản nâng cấp của Hero M5, với thiết kế hiện đại và loạt tính năng hỗ trợ sức khỏe nổi bật. Đây là sự lựa chọn lý tưởng cho những ai muốn theo dõi sức khỏe và tận hưởng các tiện ích công nghệ trong cuộc sống […] -
Tài trợKhoa học
Điều khiển nhiệt độ dễ dàng với thermostat Meross
Thermostat thông minh mới của Meross vừa ra mắt đã thu hút sự chú ý nhờ thiết kế tối giản và khả năng tương thích cao. Với mặt kính trắng trang nhã và màn hình LED hiển thị thông tin nhiệt độ cùng các cài đặt, thiết bị này phù hợp với hầu hết hệ […] -
Tài trợMobile
Ulefone Armor Mini 20: Smartphone siêu bền trong mọi môi trường
Ulefone vừa ra mắt chiếc smartphone Armor Mini 20, nhắm đến những người dùng yêu cầu một thiết bị bền bỉ. Với thiết mạnh mẽ, khả năng chịu va đập và chống nước, chiếc smartphone này hứa hẹn sẽ giúp bạn luôn kết nối và làm việc hiệu quả, dù ở đâu và trong điều […] -
Tài trợKhám phá
NYXI Flexi Game Controller: Tùy chỉnh linh hoạt cho game thủ
NYXI vừa ra mắt tay cầm Flexi Game Controller, mang đến cho game thủ khả năng tùy chỉnh linh hoạt vị trí các nút bấm và cần analog theo sở thích cá nhân. Với thiết kế sáng tạo, công nghệ tiên tiến và tính năng mượt mà, Flexi hứa hẹn sẽ là lựa chọn lý […]
Bài viết liên quan
Meta “lột xác” Llama, bất ngờ với những cải tiến vượt bậc
iGenius và Nvidia: “Cặp đôi hoàn hảo” tạo nên bước đột phá trong lĩnh vực AI?
Google Photos ra mắt tính năng “Nhìn lại năm 2024” đầy cảm xúc
AI siêu thông minh: Lo ngại về sự phát triển vượt tầm kiểm soát
Grok “tuyên chiến” với ChatGPT, miễn phí cho người dùng X
LGM-Aero: Công nghệ AI giúp thiết kế máy bay chỉ trong vài ngày
ChatGPT Pro giá 200 USD/tháng, bạn có sẵn sàng chi trả?
PaliGemma 2: AI cải tiến khả năng nhận diện hình ảnh
Copilot Vision: Tính năng mới giúp Microsoft Edge thông minh hơn
iPhone 18: “Lột xác” với công nghệ ẩn, trải nghiệm khác biệt
Hunyuan Video: AI của Tencent biến văn bản thành video
IKEA Home Smart cập nhật tính năng mới
Vì sao ChatGPT gặp khó khăn trong việc tìm kiếm tin tức?
Salesforce “thắng lớn” nhờ đầu tư vào AI, cổ phiếu tăng vọt
Humane và tham vọng phát triển CosmOS cho thiết bị thông minh
Quảng cáo do AI tạo ra: Khác biệt đến khó hiểu?
MSI Claw 8 AI+ ra mắt: Chip Lunar Lake và AI “khuấy đảo” thị trường game cầm tay
Tại sao Meta muốn sử dụng năng lượng hạt nhân cho trung tâm dữ liệu?
Sora của OpenAI “thổi hồn” vào “Surreal Elderhood” đầy mê hoặc
ĐĂNG KÝ NHẬN TIN
NGAY HÔM NAY
Đăng ký để nhận thông tin sớm nhất về những câu chuyện nóng hổi hiện nay trên thị trường, công nghệ được cung cấp hàng ngày.
Bằng cách nhấp vào “Đăng ký”, bạn chấp nhận Điều khoản dịch vụ và Chính sách quyền riêng tư của chúng tôi. Bạn có thể chọn không tham gia bất cứ lúc nào.
5
s
Nhận xét (0)