Một mô hình AI “lý luận” mới, QwQ-32B-Preview, vừa xuất hiện và được coi là một trong số ít mô hình có thể cạnh tranh với o1 của OpenAI. Đây cũng là mô hình đầu tiên cho phép tải xuống theo giấy phép không giới hạn.
Được phát triển bởi nhóm Qwen của Alibaba, QwQ-32B-Preview chứa 32,5 tỷ tham số và có thể xử lý các yêu cầu dài tới ~32.000 từ. Mô hình này hoạt động tốt hơn trên một số điểm chuẩn so với o1-preview và o1-mini, hai mô hình lý luận mà OpenAI đã phát hành cho đến nay. (Tham số tương ứng với kỹ năng giải quyết vấn đề của mô hình và các mô hình có nhiều tham số thường hoạt động tốt hơn so với các mô hình có ít tham số hơn. OpenAI không tiết lộ số lượng tham số cho các mô hình của mình.)
Theo thử nghiệm của Alibaba, QwQ-32B-Preview vượt qua các mô hình o1 của OpenAI trong các bài kiểm tra AIME và MATH. AIME sử dụng các mô hình AI khác để đánh giá hiệu suất của một mô hình, trong khi MATH là tập hợp các bài toán đố.
QwQ-32B-Preview có thể giải các câu đố logic và trả lời các câu hỏi toán học đầy thách thức một cách hợp lý, nhờ khả năng “lý luận” của nó. Tuy nhiên, nó không phải là hoàn hảo. Alibaba lưu ý trong một bài đăng trên blog rằng mô hình có thể chuyển đổi ngôn ngữ bất ngờ, bị kẹt trong vòng lặp và hoạt động kém hiệu quả đối với các tác vụ yêu cầu “lý luận thông thường”.
Không giống như hầu hết các AI, QwQ-32B-Preview và các mô hình lý luận khác có khả năng tự kiểm tra thực tế. Điều này giúp chúng tránh được một số cạm bẫy thường gặp phải, nhưng nhược điểm là chúng thường mất nhiều thời gian hơn để đưa ra giải pháp. Tương tự như o1, QwQ-32B-Preview lý luận thông qua các nhiệm vụ, lập kế hoạch trước và thực hiện một loạt các hành động giúp mô hình tìm ra câu trả lời.
QwQ-32B-Preview, có thể được chạy và tải xuống từ nền tảng phát triển AI Hugging Face, dường như tương tự như mô hình lý luận DeepSeek được phát hành gần đây ở chỗ nó xử lý cẩn thận xung quanh các chủ đề chính trị nhất định. Alibaba và DeepSeek, là các công ty Trung Quốc, phải chịu sự kiểm tra điểm chuẩn của cơ quan quản lý internet Trung Quốc để đảm bảo phản hồi của mô hình “thể hiện các giá trị cốt lõi của chủ nghĩa xã hội”. Nhiều hệ thống AI của Trung Quốc từ chối trả lời các chủ đề có thể khiến các nhà quản lý tức giận, chẳng hạn như suy đoán về chế độ của Tập Cận Bình.
Từ khoá:
Tin tài trợ
-
Tài trợKhám phá
Samsung “vượt mặt” Meta trong cuộc đua kính AR?
Samsung được cho là đang phát triển một cặp kính thực tế tăng cường (AR) để cạnh tranh với các sản phẩm kính mắt của Meta. Theo Yonhap News, Samsung có thể sẽ ra mắt thiết bị này tại sự kiện Galaxy Unpacked vào tháng 1 năm sau. Kính AR của Samsung: Những thông tin […] -
Tài trợMobile
Huawei Nova 13 sắp ra mắt toàn cầu
Sau khi ra mắt thành công tại thị trường Trung Quốc vào tháng 10, Huawei đã sẵn sàng đưa bộ đôi nova 13 và nova 13 Pro đến tay người dùng quốc tế. Theo thông tin từ Huawei, hai mẫu smartphone này sẽ được giới thiệu tại sự kiện ở Dubai vào ngày 12/12, cùng […] -
Tài trợAI
Google sẽ thay đổi ngành quảng cáo trực tuyến với AI tạo video?
Không còn là những tay “cò mồi” mồm mép trong bộ vest lịch lãm, những “Mad Men” thời hiện đại chính là các công ty công nghệ như Google, đang lấp đầy không gian quảng cáo bằng những nội dung AI rẻ tiền và vô hồn. Mới đây, Google đã ra mắt Veo, một công […] -
Tài trợKhám phá
Xreal One Series: Kính AR “phá vỡ” giới hạn kết nối
Tại CES Las Vegas đầu năm nay, kính AR Xreal Air 2 Ultra đã gây ấn tượng mạnh mẽ, nhưng thành công của nó phụ thuộc vào sự đa dạng của ứng dụng. Xreal dường như đã tìm ra giải pháp cho vấn đề này với dòng kính AR One Series mới: tăng cường khả […]
Bài viết liên quan
Samsung “vượt mặt” Meta trong cuộc đua kính AR?
Google sẽ thay đổi ngành quảng cáo trực tuyến với AI tạo video?
Android tích hợp AI vào tính năng chia sẻ file, trợ năng như thế nào?
Meta “lột xác” Llama, bất ngờ với những cải tiến vượt bậc
Trải nghiệm thế giới ảo 3D từ ảnh thường với công nghệ mới
Apple “vấp ngã” khi đưa AI của Baidu vào iPhone tại Trung Quốc
Robot bị hack: Lỗ hổng trong AI có thể gây hại
DeepMind “khuấy đảo” lĩnh vực dự báo thời tiết với AI GenCast
Google “nhá hàng” tính năng AI mới cho tìm kiếm
Sử dụng Threads? Hãy cẩn thận với dữ liệu cá nhân của bạn!
Google DeepMind tạo ra thế giới 3D tương tác chỉ bằng AI
iGenius và Nvidia: “Cặp đôi hoàn hảo” tạo nên bước đột phá trong lĩnh vực AI?
AI siêu thông minh: Lo ngại về sự phát triển vượt tầm kiểm soát
Grok “tuyên chiến” với ChatGPT, miễn phí cho người dùng X
LGM-Aero: Công nghệ AI giúp thiết kế máy bay chỉ trong vài ngày
ChatGPT Pro giá 200 USD/tháng, bạn có sẵn sàng chi trả?
PaliGemma 2: AI cải tiến khả năng nhận diện hình ảnh
Copilot Vision: Tính năng mới giúp Microsoft Edge thông minh hơn
iPhone 18: “Lột xác” với công nghệ ẩn, trải nghiệm khác biệt
ĐĂNG KÝ NHẬN TIN
NGAY HÔM NAY
Đăng ký để nhận thông tin sớm nhất về những câu chuyện nóng hổi hiện nay trên thị trường, công nghệ được cung cấp hàng ngày.
Bằng cách nhấp vào “Đăng ký”, bạn chấp nhận Điều khoản dịch vụ và Chính sách quyền riêng tư của chúng tôi. Bạn có thể chọn không tham gia bất cứ lúc nào.
5
s
Nhận xét (0)