Một mô hình AI “lý luận” mới, QwQ-32B-Preview, vừa xuất hiện và được coi là một trong số ít mô hình có thể cạnh tranh với o1 của OpenAI. Đây cũng là mô hình đầu tiên cho phép tải xuống theo giấy phép không giới hạn.
Được phát triển bởi nhóm Qwen của Alibaba, QwQ-32B-Preview chứa 32,5 tỷ tham số và có thể xử lý các yêu cầu dài tới ~32.000 từ. Mô hình này hoạt động tốt hơn trên một số điểm chuẩn so với o1-preview và o1-mini, hai mô hình lý luận mà OpenAI đã phát hành cho đến nay. (Tham số tương ứng với kỹ năng giải quyết vấn đề của mô hình và các mô hình có nhiều tham số thường hoạt động tốt hơn so với các mô hình có ít tham số hơn. OpenAI không tiết lộ số lượng tham số cho các mô hình của mình.)
Theo thử nghiệm của Alibaba, QwQ-32B-Preview vượt qua các mô hình o1 của OpenAI trong các bài kiểm tra AIME và MATH. AIME sử dụng các mô hình AI khác để đánh giá hiệu suất của một mô hình, trong khi MATH là tập hợp các bài toán đố.
QwQ-32B-Preview có thể giải các câu đố logic và trả lời các câu hỏi toán học đầy thách thức một cách hợp lý, nhờ khả năng “lý luận” của nó. Tuy nhiên, nó không phải là hoàn hảo. Alibaba lưu ý trong một bài đăng trên blog rằng mô hình có thể chuyển đổi ngôn ngữ bất ngờ, bị kẹt trong vòng lặp và hoạt động kém hiệu quả đối với các tác vụ yêu cầu “lý luận thông thường”.
Không giống như hầu hết các AI, QwQ-32B-Preview và các mô hình lý luận khác có khả năng tự kiểm tra thực tế. Điều này giúp chúng tránh được một số cạm bẫy thường gặp phải, nhưng nhược điểm là chúng thường mất nhiều thời gian hơn để đưa ra giải pháp. Tương tự như o1, QwQ-32B-Preview lý luận thông qua các nhiệm vụ, lập kế hoạch trước và thực hiện một loạt các hành động giúp mô hình tìm ra câu trả lời.
QwQ-32B-Preview, có thể được chạy và tải xuống từ nền tảng phát triển AI Hugging Face, dường như tương tự như mô hình lý luận DeepSeek được phát hành gần đây ở chỗ nó xử lý cẩn thận xung quanh các chủ đề chính trị nhất định. Alibaba và DeepSeek, là các công ty Trung Quốc, phải chịu sự kiểm tra điểm chuẩn của cơ quan quản lý internet Trung Quốc để đảm bảo phản hồi của mô hình “thể hiện các giá trị cốt lõi của chủ nghĩa xã hội”. Nhiều hệ thống AI của Trung Quốc từ chối trả lời các chủ đề có thể khiến các nhà quản lý tức giận, chẳng hạn như suy đoán về chế độ của Tập Cận Bình.
Từ khoá:
Tin tài trợ
-
Tài trợQuảng cáo
Noise ra mắt Power Series với sạc GaN hiện đại
Noise vừa chính thức bước vào thị trường phụ kiện cao cấp với dòng sản phẩm Power Series. Các sản phẩm mới trong bộ sưu tập này bao gồm bộ sạc GaN (Gallium Nitride) và cáp từ tính Type-C to C, được thiết kế dành riêng cho người dùng yêu cầu cao về hiệu suất, […] -
Tài trợQuảng cáo
Khám phá HiBy R1: Máy nghe nhạc bỏ túi với âm thanh cao cấp
Mix Wave vừa giới thiệu mẫu máy nghe nhạc kỹ thuật số HiBy R1, một sản phẩm hướng đến những người yêu thích âm nhạc chất lượng cao. Với thiết kế nhỏ gọn và nhiều màu sắc trẻ trung, HiBy R1 không chỉ là thiết bị phát nhạc mà còn là một phụ kiện phong […] -
Tài trợQuảng cáo
Loa Xiaomi Mini: Đổi mới với phiên bản đỏ rượu vang đầy cuốn hút
Xiaomi vừa giới thiệu phiên bản mới cho dòng loa Bluetooth Speaker Mini với sự bổ sung màu sắc đặc biệt đỏ rượu vang (burgundy red). Đây là dòng sản phẩm nổi bật nhờ thiết kế nhỏ gọn, khả năng chống chịu thời tiết khắc nghiệt, thời lượng pin dài và âm thanh ổn định. […] -
Tài trợQuảng cáo
Petbrick 65: Khi bàn phím cơ biến thành thú cưng của bạn
Angry Miao, hãng sản xuất bàn phím nổi tiếng với thiết kế sáng tạo, tiếp tục gây chú ý khi ra mắt sản phẩm mới mang tên Petbrick 65. Đây là bàn phím cơ có vỏ ngoài lông xù, mang đến cảm giác có thể vuốt ve như một chú mèo. Thiết kế lấy cảm […]
Bài viết liên quan
NUC 14 Pro AI của ASUS: Sức mạnh AI trong một chiếc mini PC
OpenAI “khuấy đảo” giới công nghệ với mô hình o3 mới
Huấn luyện robot nhanh gấp 430,000 lần với Genesis
Google Gemini Deep Research: Tìm kiếm thông tin dễ dàng và nhanh chóng hơn bao giờ hết
Trường học không giáo viên: Khi AI thay đổi cách chúng ta học tập
Android 16 cho phép người dùng kiểm soát nội dung do AI tạo ra
Gmail tăng cường bảo mật với AI để chặn thư rác hiệu quả hơn
Apple và Nvidia ‘bắt tay’ tạo ra bước đột phá trong AI
Google Gemini: Đánh giá AI có chính xác khi thiếu chuyên môn?
Khi trí tuệ nhân tạo học cách “đóng kịch” để sinh tồn
ChatGPT giờ đây có thể gọi điện và nhắn tin qua WhatsApp
Mondelez sử dụng AI để phát triển snack mới nhanh hơn
AI tham gia vào quá trình sản xuất bánh Oreo, hứa hẹn nhiều điều thú vị
Người dùng Google được trải nghiệm Gemini 2.0 Experimental Advanced
Insta360 Connect: Tối ưu họp trực tuyến với camera 4K và AI
o1 của OpenAI: Mở ra kỷ nguyên mới cho phát triển ứng dụng AI?
Kính thông minh Meta “lột xác” với AI và Shazam, nhận diện bài hát tức thì
Romi Lacatan: Robot AI hỗ trợ giao tiếp, giúp đỡ người cô đơn
Whisk: Công cụ AI mới của Google sử dụng hình ảnh làm gợi ý, thay vì văn bản
ĐĂNG KÝ NHẬN TIN
NGAY HÔM NAY
Đăng ký để nhận thông tin sớm nhất về những câu chuyện nóng hổi hiện nay trên thị trường, công nghệ được cung cấp hàng ngày.
Bằng cách nhấp vào “Đăng ký”, bạn chấp nhận Điều khoản dịch vụ và Chính sách quyền riêng tư của chúng tôi. Bạn có thể chọn không tham gia bất cứ lúc nào.
5
s
Nhận xét (0)