Viện nghiên cứu Trung Quốc ra mắt mô hình AI có khả năng suy luận, cạnh tranh sòng phẳng với OpenAI
17:18 28/11/2024
2 phút đọc
DeepSeek, một công ty nghiên cứu AI được tài trợ bởi các nhà giao dịch định lượng, vừa giới thiệu DeepSeek-R1, một mô hình AI được cho là có khả năng “suy luận” tương đương với o1 của OpenAI.
Khác với các mô hình thông thường, mô hình suy luận có khả năng tự kiểm tra bằng cách dành nhiều thời gian hơn để xem xét câu hỏi hoặc yêu cầu. Điều này giúp chúng tránh được những sai lầm thường gặp ở các mô hình khác.
Tương tự o1, DeepSeek-R1 suy luận thông qua các nhiệm vụ, lập kế hoạch trước và thực hiện một loạt hành động để đưa ra câu trả lời. Quá trình này có thể mất một chút thời gian, đôi khi lên đến hàng chục giây tùy thuộc vào độ phức tạp của câu hỏi.
DeepSeek tuyên bố DeepSeek-R1 có hiệu suất ngang bằng với o1 trên hai điểm chuẩn AI phổ biến là AIME và MATH. Tuy nhiên, mô hình này vẫn còn một số hạn chế, chẳng hạn như gặp khó khăn với trò chơi tic-tac-toe và các bài toán logic khác.
DeepSeek-R1 cũng có thể dễ dàng bị “jailbreak” (bỏ qua các biện pháp bảo vệ) và chặn các truy vấn nhạy cảm về chính trị, đặc biệt là những câu hỏi liên quan đến các nhà lãnh đạo Trung Quốc, sự kiện Thiên An Môn và các vấn đề địa chính trị. Đây có thể là kết quả của áp lực từ chính phủ Trung Quốc đối với các dự án AI trong khu vực.
Sự xuất hiện của DeepSeek-R1 cho thấy sự quan tâm ngày càng tăng đối với các mô hình suy luận, đặc biệt là trong bối cảnh hiệu quả của “luật mở rộng quy mô” đang bị đặt dấu hỏi.
DeepSeek có kế hoạch mở mã nguồn DeepSeek-R1 và phát hành API. Công ty này được hỗ trợ bởi High-Flyer Capital Management, một quỹ đầu cơ định lượng của Trung Quốc sử dụng AI để hỗ trợ các quyết định giao dịch.
Từ khoá:
Bài viết liên quan
Người dùng Bluesky tranh luận về dữ liệu cá nhân và huấn luyện AI
Người dùng ‘phù phép’ ảnh, xóa bỏ watermark bằng AI mới của Google
Google sẽ loại bỏ trợ lý ảo khỏi phần lớn điện thoại trong năm nay
Notepad sắp được tích hợp tính năng tóm tắt bằng AI
Dự án Kaito: AI phân tích dữ liệu crypto, “bão táp” sau airdrop
Google ra mắt Gemini tùy chỉnh: AI giờ đây ‘hiểu’ bạn hơn
Sam Altman khoe khả năng viết của ChatGPT: AI có thể thay thế nhà văn hay chỉ là bản sao vô hồn?
Teledyne FLIR ra mắt camera nhiệt phóng xạ: “Mắt thần” cho drone, AI và công nghiệp
Manus AI ra mắt AI Agent “siêu năng lực”: Giải quyết vấn đề phức tạp, vượt trội chatbot thông thường
Meta thành công ‘tape-out’ chip AI đầu tiên, sử dụng công nghệ TSMC
OpenAI ra mắt công cụ mới giúp doanh nghiệp tạo chatbot AI “thông minh” hơn
Google Gemini: Cuộc cách mạng AI tại nơi làm việc
Tự động hóa lịch trình với nút AI mới của Google trong Gmail
PlayStation: Sony đang phát triển nhân vật game thông minh AI
Sony mạnh tay gỡ bỏ hơn 75.000 bài hát deepfake AI
Mistral OCR: API nhận dạng ký tự quang học với độ chính xác “vượt trội”
AI “phát điên” sau khi được tinh chỉnh bằng mã lỗi, đưa ra lời khuyên bạo lực và ủng hộ phát xít
Maserati MC20 lập kỷ lục tốc độ mới với “tài xế robot” AI
Google “mạnh tay” với tìm kiếm AI bất chấp lỗi “ảo giác”

ĐĂNG KÝ NHẬN TIN
NGAY HÔM NAY
Đăng ký để nhận thông tin sớm nhất về những câu chuyện nóng hổi hiện nay trên thị trường, công nghệ được cung cấp hàng ngày.
Bằng cách nhấp vào “Đăng ký”, bạn chấp nhận Điều khoản dịch vụ và Chính sách quyền riêng tư của chúng tôi. Bạn có thể chọn không tham gia bất cứ lúc nào.
5
s
Nhận xét (0)