DeepSeek, một công ty AI Trung Quốc, vừa phát hành DeepSeek V3, một mô hình AI “mở” được cho là mạnh mẽ nhất hiện nay. Mô hình này được phát hành dưới giấy phép cho phép các nhà phát triển tải xuống và sửa đổi cho hầu hết các ứng dụng, bao gồm cả ứng dụng thương mại.
Khả năng ấn tượng
DeepSeek V3 có thể xử lý nhiều tác vụ dựa trên văn bản, như lập trình, dịch thuật, viết luận và email từ yêu cầu mô tả. Theo kết quả kiểm tra nội bộ của DeepSeek, DeepSeek V3 vượt trội hơn cả các mô hình “mở” có thể tải xuống và các mô hình AI “đóng” chỉ có thể truy cập thông qua API.
Trong một số cuộc thi lập trình trên Codeforces, DeepSeek V3 đã đánh bại các mô hình khác, bao gồm Llama 3.1 405B của Meta, GPT-4o của OpenAI và Qwen 2.5 72B của Alibaba. DeepSeek V3 cũng vượt trội trong bài kiểm tra Aider Polyglot, được thiết kế để đánh giá khả năng viết mã mới tích hợp vào mã hiện có.
Quy mô khổng lồ
DeepSeek V3 được huấn luyện trên tập dữ liệu 14,8 nghìn tỷ token và có 671 tỷ tham số. Điều này khiến nó trở thành một trong những mô hình AI lớn nhất hiện nay. Số lượng tham số lớn thường tương quan với khả năng của mô hình, nhưng cũng đòi hỏi phần cứng mạnh mẽ hơn để vận hành.
Thành tựu đáng chú ý
DeepSeek đã huấn luyện mô hình này bằng cách sử dụng trung tâm dữ liệu với GPU Nvidia H800 chỉ trong khoảng hai tháng – loại GPU mà các công ty Trung Quốc gần đây đã bị Bộ Thương mại Hoa Kỳ hạn chế mua. Công ty cũng tuyên bố chỉ tốn 5,5 triệu USD để huấn luyện DeepSeek V3, thấp hơn nhiều so với chi phí phát triển các mô hình như GPT-4 của OpenAI.
Hạn chế về quan điểm chính trị
Tuy nhiên, DeepSeek V3 cũng có những hạn chế nhất định. Là một công ty Trung Quốc, DeepSeek phải tuân thủ các quy định của cơ quan quản lý internet Trung Quốc để đảm bảo các phản hồi của mô hình “phản ánh các giá trị xã hội chủ nghĩa cốt lõi”. Do đó, DeepSeek V3 sẽ từ chối trả lời các câu hỏi liên quan đến những chủ đề nhạy cảm về mặt chính trị.
DeepSeek: Tham vọng về AI siêu thông minh
DeepSeek là một tổ chức đáng chú ý, được hỗ trợ bởi High-Flyer Capital Management, một quỹ đầu tư định lượng của Trung Quốc sử dụng AI trong các quyết định giao dịch. High-Flyer đang xây dựng các cụm máy chủ riêng để huấn luyện mô hình AI, với mục tiêu đạt được AI “siêu thông minh” thông qua DeepSeek.
DeepSeek V3 là một bước tiến quan trọng trong lĩnh vực AI “mở”. Nó cho thấy sự phát triển nhanh chóng của AI tại Trung Quốc và tiềm năng cạnh tranh với các mô hình AI hàng đầu thế giới. Tuy nhiên, những hạn chế về quan điểm chính trị cũng là một vấn đề cần được quan tâm.
Từ khoá:
Bài viết liên quan
Maserati MC20 lập kỷ lục tốc độ mới với “tài xế robot” AI
Maserati MC20 lập kỷ lục tốc độ mới với “tài xế robot” AI
Google “mạnh tay” với tìm kiếm AI bất chấp lỗi “ảo giác”
Google “mạnh tay” với tìm kiếm AI bất chấp lỗi “ảo giác”
ChatGPT cho macOS cập nhật tính năng ‘khủng’: Sửa code Xcode trực tiếp
ChatGPT cho macOS cập nhật tính năng ‘khủng’: Sửa code Xcode trực tiếp
Quân đội Mỹ sử dụng AI để lập kế hoạch chiến tranh: Bước tiến đột phá hay canh bạc nguy hiểm?
Quân đội Mỹ sử dụng AI để lập kế hoạch chiến tranh: Bước tiến đột phá hay canh bạc nguy hiểm?
Robot tự nhận thức: Bước tiến mới của trí tuệ nhân tạo
Robot tự nhận thức: Bước tiến mới của trí tuệ nhân tạo
One Smart AI Pen: Cây bút bi tích hợp ChatGPT, dịch thuật và điều khiển bằng giọng nói
One Smart AI Pen: Cây bút bi tích hợp ChatGPT, dịch thuật và điều khiển bằng giọng nói
Google tăng cường bảo vệ người dùng Android với AI chống lừa đảo qua tin nhắn và cuộc gọi
Google tăng cường bảo vệ người dùng Android với AI chống lừa đảo qua tin nhắn và cuộc gọi
Google Search thông minh hơn: Tổng quan AI sâu sắc, tìm kiếm với Chế độ AI
Google Search thông minh hơn: Tổng quan AI sâu sắc, tìm kiếm với Chế độ AI
Cập nhật mới: Sử dụng Google Gemini bằng giọng nói ngay trên màn hình khóa iPhone
Cập nhật mới: Sử dụng Google Gemini bằng giọng nói ngay trên màn hình khóa iPhone
YouTube cảnh báo: Video AI giả mạo CEO dùng để lừa đảo đang hoành hành
YouTube cảnh báo: Video AI giả mạo CEO dùng để lừa đảo đang hoành hành
Google ra mắt tính năng Screenshare cho Gemini tại MWC 2025
Google ra mắt tính năng Screenshare cho Gemini tại MWC 2025
Robot mềm phân hủy sinh học: Bước tiến mới giúp giảm thiểu rác thải công nghệ
Robot mềm phân hủy sinh học: Bước tiến mới giúp giảm thiểu rác thải công nghệ
Flora ra mắt ‘bảng vẽ vô hạn’ hỗ trợ AI cho dân sáng tạo
Flora ra mắt ‘bảng vẽ vô hạn’ hỗ trợ AI cho dân sáng tạo
Unitree G1: Robot hình người biết võ kungfu, “nhảy cước” như “cao thủ”
Unitree G1: Robot hình người biết võ kungfu, “nhảy cước” như “cao thủ”
AMD Ryzen AI 400 “dậm chân tại chỗ” với GPU RDNA 3, “lép vế” so với phiên bản desktop?
AMD Ryzen AI 400 “dậm chân tại chỗ” với GPU RDNA 3, “lép vế” so với phiên bản desktop?
Màn hình AI của Lenovo: “Giám sát” tư thế, bảo vệ quyền riêng tư với NPU riêng biệt
Màn hình AI của Lenovo: “Giám sát” tư thế, bảo vệ quyền riêng tư với NPU riêng biệt
Meta ‘thách thức’ OpenAI: Cuộc chiến AI ngày càng căng thẳng
Meta ‘thách thức’ OpenAI: Cuộc chiến AI ngày càng căng thẳng
Chatbot AI của Meta sắp có ứng dụng riêng biệt
Chatbot AI của Meta sắp có ứng dụng riêng biệt
Microsoft phát hành Copilot cho Mac: bước tiến mới trong kỷ nguyên AI?
Microsoft phát hành Copilot cho Mac: bước tiến mới trong kỷ nguyên AI?

ĐĂNG KÝ NHẬN TIN
NGAY HÔM NAY
Đăng ký để nhận thông tin sớm nhất về những câu chuyện nóng hổi hiện nay trên thị trường, công nghệ được cung cấp hàng ngày.
Bằng cách nhấp vào “Đăng ký”, bạn chấp nhận Điều khoản dịch vụ và Chính sách quyền riêng tư của chúng tôi. Bạn có thể chọn không tham gia bất cứ lúc nào.
5
s
Nhận xét (0)