Một mô hình AI “lý luận” mới, QwQ-32B-Preview, vừa xuất hiện và được coi là một trong số ít mô hình có thể cạnh tranh với o1 của OpenAI. Đây cũng là mô hình đầu tiên cho phép tải xuống theo giấy phép không giới hạn.
Được phát triển bởi nhóm Qwen của Alibaba, QwQ-32B-Preview chứa 32,5 tỷ tham số và có thể xử lý các yêu cầu dài tới ~32.000 từ. Mô hình này hoạt động tốt hơn trên một số điểm chuẩn so với o1-preview và o1-mini, hai mô hình lý luận mà OpenAI đã phát hành cho đến nay. (Tham số tương ứng với kỹ năng giải quyết vấn đề của mô hình và các mô hình có nhiều tham số thường hoạt động tốt hơn so với các mô hình có ít tham số hơn. OpenAI không tiết lộ số lượng tham số cho các mô hình của mình.)
Theo thử nghiệm của Alibaba, QwQ-32B-Preview vượt qua các mô hình o1 của OpenAI trong các bài kiểm tra AIME và MATH. AIME sử dụng các mô hình AI khác để đánh giá hiệu suất của một mô hình, trong khi MATH là tập hợp các bài toán đố.
QwQ-32B-Preview có thể giải các câu đố logic và trả lời các câu hỏi toán học đầy thách thức một cách hợp lý, nhờ khả năng “lý luận” của nó. Tuy nhiên, nó không phải là hoàn hảo. Alibaba lưu ý trong một bài đăng trên blog rằng mô hình có thể chuyển đổi ngôn ngữ bất ngờ, bị kẹt trong vòng lặp và hoạt động kém hiệu quả đối với các tác vụ yêu cầu “lý luận thông thường”.
Không giống như hầu hết các AI, QwQ-32B-Preview và các mô hình lý luận khác có khả năng tự kiểm tra thực tế. Điều này giúp chúng tránh được một số cạm bẫy thường gặp phải, nhưng nhược điểm là chúng thường mất nhiều thời gian hơn để đưa ra giải pháp. Tương tự như o1, QwQ-32B-Preview lý luận thông qua các nhiệm vụ, lập kế hoạch trước và thực hiện một loạt các hành động giúp mô hình tìm ra câu trả lời.
QwQ-32B-Preview, có thể được chạy và tải xuống từ nền tảng phát triển AI Hugging Face, dường như tương tự như mô hình lý luận DeepSeek được phát hành gần đây ở chỗ nó xử lý cẩn thận xung quanh các chủ đề chính trị nhất định. Alibaba và DeepSeek, là các công ty Trung Quốc, phải chịu sự kiểm tra điểm chuẩn của cơ quan quản lý internet Trung Quốc để đảm bảo phản hồi của mô hình “thể hiện các giá trị cốt lõi của chủ nghĩa xã hội”. Nhiều hệ thống AI của Trung Quốc từ chối trả lời các chủ đề có thể khiến các nhà quản lý tức giận, chẳng hạn như suy đoán về chế độ của Tập Cận Bình.
Từ khoá:
Tin tài trợ
-
Tài trợKhám phá
AE-1600 lên kệ: Casio ra mắt đồng hồ bền bỉ, đa năng
Dòng đồng hồ Casio AE-1600, được công bố vào cuối năm 2024, hiện đã cho phép đặt hàng trước trên Amazon. Ngày phát hành chính thức là 1/2/2025. Bộ sưu tập bao gồm ba mẫu với các màu đen, be và xám, mỗi chiếc có giá 77,94 USD (khoảng 1,8 triệu VNĐ). Pin 10 năm, […] -
Tài trợMobile
Garmin Approach S44: Đồng hồ thông minh cho golfer, pin “trâu” 10 ngày
Garmin vừa ra mắt đồng hồ thông minh Approach S44 GPS dành cho golfer trên toàn cầu. Đồng hồ có màn hình AMOLED màu 1.2 inch, vòng bezel bằng nhôm màu bạc và dây đeo silicon màu đen hoặc xám xanh (Twilight). Tính năng “chuẩn golfer” Approach S44 được trang bị nhiều tính năng hỗ […] -
Tài trợData
Lenovo ra mắt ổ SSD “hình lựu đạn”, “cấm” mang lên máy bay?
Lenovo vừa giới thiệu một ổ SSD gắn ngoài có thiết kế “độc nhất vô nhị”: hình lựu đạn. Sản phẩm này được lấy cảm hứng từ bộ phim bom tấn “Chiến dịch Rồng” (hay còn gọi là “Chiến dịch Leviathan” hoặc “Chiến dịch Hadal”) của Trung Quốc. Tuy nhiên, với hình dạng “nhạy cảm” […] -
Tài trợMobile
Máy ảnh lấy liền 2 trong 1: Instax Wide Evo “gây sốt” với thiết kế “retro”
Fujifilm vừa bổ sung vào gia đình Instax một chiếc máy ảnh lấy liền “lai” mới, sử dụng phim Instax Wide. Instax Wide Evo nổi bật với ống kính siêu rộng 16mm “đầu tiên trên thế giới” và khả năng điều chỉnh thủ công với hơn 100 kiểu phim và hiệu ứng. “Lai” ở đây […]
Bài viết liên quan
OpenAI “ém hàng” Operator, công cụ AI với khả năng đáng kinh ngạc?
ChatGPT “chống lại” Google: Lãnh đạo sản phẩm làm chứng chống độc quyền
Cải tiến trải nghiệm AI: Google cấp phép tin tức AP cho Gemini
MiniMax vs. OpenAI: Cuộc chiến mới trong lĩnh vực AI?
GenEx: Công nghệ biến ảnh tĩnh thành thế giới ảo sống động
Máy tính lượng tử lớn nhất: AI giúp tối ưu hóa sắp xếp nguyên tử
Trợ lý ảo Mercedes-Benz được nâng cấp với AI đàm thoại của Google
Adobe “cách mạng hóa” chỉnh sửa ảnh với công cụ AI mới
Nvidia ủng hộ Trump, chỉ trích chính sách AI của Biden
Elon Musk: Dữ liệu tổng hợp là chìa khóa cho tương lai AI
OpenAI đưa ra “bản thiết kế” mới cho quy định AI
Ballie – Robot AI “vạn năng” của Samsung sắp ra mắt trong năm nay
Phụ đề AI ngoại tuyến: Cách mạng hóa trải nghiệm xem phim
Grok AI: Điều gì khiến trợ lý AI này trở nên đặc biệt?
Nvidia Digits: Siêu máy tính chỉ 3.000 USD, nhỏ gọn bất ngờ
Kính thông minh Halliday với màn hình và hệ thống điều khiển độc đáo
Gương thông minh “thần kỳ” đánh giá sức khỏe người dùng
Sansui sẽ “khuấy đảo” thị trường với TV OLED và màn hình chơi game AI mới?
Rò rỉ Galaxy S25: AI camera, AI trợ lý ảo, AI chỉnh sửa ảnh?
ĐĂNG KÝ NHẬN TIN
NGAY HÔM NAY
Đăng ký để nhận thông tin sớm nhất về những câu chuyện nóng hổi hiện nay trên thị trường, công nghệ được cung cấp hàng ngày.
Bằng cách nhấp vào “Đăng ký”, bạn chấp nhận Điều khoản dịch vụ và Chính sách quyền riêng tư của chúng tôi. Bạn có thể chọn không tham gia bất cứ lúc nào.
5
s
Nhận xét (0)