Mới đây, một báo cáo từ Artificial Analysis cho thấy mô hình ngôn ngữ lớn GPT-4o của OpenAI đã giảm sút đáng kể trong những tuần gần đây, khiến hiệu suất của mô hình hàng đầu này ngang bằng với GPT-4o-mini, mô hình nhỏ hơn và kém khả năng hơn nhiều.
Phân tích này được đưa ra chưa đầy 24 giờ sau khi công ty thông báo nâng cấp cho mô hình GPT-4o. “Khả năng viết sáng tạo của mô hình đã được nâng cấp – tự nhiên hơn, hấp dẫn hơn và viết được cá nhân hóa hơn để cải thiện tính liên quan và khả năng đọc,” OpenAI viết trên X. “Nó cũng tốt hơn trong việc làm việc với các tệp được tải lên, cung cấp những hiểu biết sâu sắc hơn và phản hồi kỹ lưỡng hơn.” Tuy nhiên, những tuyên bố này hiện đang bị nghi ngờ.
“Chúng tôi đã hoàn thành việc chạy các đánh giá độc lập của mình trên bản phát hành GPT-4o của OpenAI vào ngày hôm qua và liên tục đo được điểm đánh giá thấp hơn đáng kể so với bản phát hành GPT-4o vào tháng 8,” Artificial Analysis thông báo qua một bài đăng trên X vào thứ Năm, lưu ý rằng chỉ số chất lượng phân tích nhân tạo của mô hình giảm từ 77 xuống 71 (và hiện bằng với GPT-4o mini).
Hơn nữa, hiệu suất của GPT-4o trên điểm chuẩn GPQA Diamond giảm từ 51% xuống 39% trong khi điểm chuẩn MATH giảm từ 78% xuống 69%.
Đồng thời, các nhà nghiên cứu phát hiện ra tốc độ tăng gấp đôi của phản hồi của mô hình, tăng tốc từ khoảng 80 token đầu ra mỗi giây lên khoảng 180 token/giây. “Chúng tôi thường quan sát thấy tốc độ tăng đáng kể vào ngày ra mắt đối với các mô hình của OpenAI (có thể là do OpenAI cung cấp khả năng trước khi áp dụng), nhưng trước đây chưa từng thấy sự khác biệt về tốc độ gấp 2 lần,” các nhà nghiên cứu viết.
“Dựa trên dữ liệu này, chúng tôi kết luận rằng mô hình GPT-4o ngày 20 tháng 11 của OpenAI có thể là một mô hình nhỏ hơn so với bản phát hành tháng 8,” họ tiếp tục. “Vì OpenAI chưa giảm giá cho phiên bản ngày 20 tháng 11, chúng tôi khuyến nghị các nhà phát triển không chuyển khối lượng công việc khỏi phiên bản tháng 8 mà không kiểm tra kỹ lưỡng.”
GPT-4o lần đầu tiên được phát hành vào tháng 5 năm 2024 để vượt qua các mô hình GPT-3.5 và GPT-4 hiện có. Theo OpenAI, GPT-4o cung cấp kết quả điểm chuẩn hàng đầu trong các nhiệm vụ giọng nói, đa ngôn ngữ và thị giác, khiến nó trở nên lý tưởng cho các ứng dụng tiên tiến như dịch thuật thời gian thực và AI hội thoại.
Tin tài trợ
-
Tài trợMáy tính
Corsair “lấn sân” sang thị trường Mac với bàn phím và chuột không dây mới
Corsair, thương hiệu nổi tiếng với các thiết bị chơi game dành cho PC, đã chính thức gia nhập thị trường thiết bị ngoại vi cho Mac với hai sản phẩm mới: bàn phím cơ không dây K65 Plus và chuột không dây M75. Động thái này cho thấy tham vọng của Corsair trong việc […] -
Tài trợHọc máy
PINE64 ra mắt camera thông minh chạy Linux, hỗ trợ nhiều nền tảng IoT
Pine64 đã chia sẻ thông tin về các sản phẩm và cập nhật mới nhất trong thông báo cộng đồng gần đây của họ. Một trong những mặt hàng mới là PineCam, một phiên bản cải tiến của camera IP PineCube. PineCam hiện đang trong giai đoạn phát triển ban đầu. Vỏ nhựa và bo […] -
Tài trợMobile
Rò rỉ Galaxy S25 Ultra: Thiết kế cạnh viền bo tròn giống iPhone
Samsung Galaxy S24 Ultra sở hữu vẻ ngoài rất đặc biệt với các góc vuông và cạnh bo tròn, nhưng những rò rỉ cho thấy thế hệ tiếp theo có thể sẽ có thiết kế tiêu chuẩn hơn. Hình ảnh được cho là của Galaxy S25 Ultra hoặc có thể là “Galaxy S25 Note” hiện […]
Bài viết liên quan
AI và đạo đức: Hướng đi mới cho trí tuệ nhân tạo
ChatGPT: Khám phá sức mạnh của chatbot AI viết content đỉnh cao
Hiệu năng của ChatGPT-4 giảm sút khi xử lý các tác vụ phức tạp
F-35: Khi công nghệ AI không thể cứu vớt chiến đấu cơ
Rabbit giờ đây cho phép bạn huấn luyện R1 thực hiện các nhiệm vụ thay bạn
Suno v4 cải tiến giọng hát AI, mở rộng sáng tạo âm nhạc
ChatGPT-4o: Nhanh hơn, sâu hơn, sáng tạo hơn
LLMs sẽ nâng cấp Siri lên một tầm cao mới
Tülu 3: Ai2 mở ra trò chơi AI mới cho mọi người
YouTube nâng tầm Shorts với AI
Giáo sư Stanford bị tố dùng AI viết lời khai trong vụ kiện Deepfake
Robot đang xâm chiếm ngành dịch vụ Las Vegas?
Mua sắm dễ dàng hơn với Google Lens
Coca-Cola bị chê bai vì quảng cáo Giáng sinh bằng AI
Lighthouse nhận được 370 triệu USD đầu tư, trở thành “ngôi sao sáng” trong lĩnh vực phân tích dữ liệu cho ngành khách sạn
Edifier X3 Pro: Tai nghe giá tốt, ANC và kháng khuẩn
Pokémon Go: Không chỉ là game, còn là dự án AI khổng lồ
Tin vui cho cộng đồng yêu sách: Microsoft và HarperCollins hợp tác để tạo ra những trợ lý ảo thông minh hơn
16 triệu USD đổ vào OneCell Diagnostics để phát triển AI chống ung thư tái phát
ĐĂNG KÝ NHẬN TIN
NGAY HÔM NAY
Đăng ký để nhận thông tin sớm nhất về những câu chuyện nóng hổi hiện nay trên thị trường, công nghệ được cung cấp hàng ngày.
Bằng cách nhấp vào “Đăng ký”, bạn chấp nhận Điều khoản dịch vụ và Chính sách quyền riêng tư của chúng tôi. Bạn có thể chọn không tham gia bất cứ lúc nào.
5
s
Nhận xét (0)