DeepSeek, một công ty AI Trung Quốc, vừa phát hành DeepSeek V3, một mô hình AI “mở” được cho là mạnh mẽ nhất hiện nay. Mô hình này được phát hành dưới giấy phép cho phép các nhà phát triển tải xuống và sửa đổi cho hầu hết các ứng dụng, bao gồm cả ứng dụng thương mại.
Khả năng ấn tượng
DeepSeek V3 có thể xử lý nhiều tác vụ dựa trên văn bản, như lập trình, dịch thuật, viết luận và email từ yêu cầu mô tả. Theo kết quả kiểm tra nội bộ của DeepSeek, DeepSeek V3 vượt trội hơn cả các mô hình “mở” có thể tải xuống và các mô hình AI “đóng” chỉ có thể truy cập thông qua API.
Trong một số cuộc thi lập trình trên Codeforces, DeepSeek V3 đã đánh bại các mô hình khác, bao gồm Llama 3.1 405B của Meta, GPT-4o của OpenAI và Qwen 2.5 72B của Alibaba. DeepSeek V3 cũng vượt trội trong bài kiểm tra Aider Polyglot, được thiết kế để đánh giá khả năng viết mã mới tích hợp vào mã hiện có.
Quy mô khổng lồ
DeepSeek V3 được huấn luyện trên tập dữ liệu 14,8 nghìn tỷ token và có 671 tỷ tham số. Điều này khiến nó trở thành một trong những mô hình AI lớn nhất hiện nay. Số lượng tham số lớn thường tương quan với khả năng của mô hình, nhưng cũng đòi hỏi phần cứng mạnh mẽ hơn để vận hành.
Thành tựu đáng chú ý
DeepSeek đã huấn luyện mô hình này bằng cách sử dụng trung tâm dữ liệu với GPU Nvidia H800 chỉ trong khoảng hai tháng – loại GPU mà các công ty Trung Quốc gần đây đã bị Bộ Thương mại Hoa Kỳ hạn chế mua. Công ty cũng tuyên bố chỉ tốn 5,5 triệu USD để huấn luyện DeepSeek V3, thấp hơn nhiều so với chi phí phát triển các mô hình như GPT-4 của OpenAI.
Hạn chế về quan điểm chính trị
Tuy nhiên, DeepSeek V3 cũng có những hạn chế nhất định. Là một công ty Trung Quốc, DeepSeek phải tuân thủ các quy định của cơ quan quản lý internet Trung Quốc để đảm bảo các phản hồi của mô hình “phản ánh các giá trị xã hội chủ nghĩa cốt lõi”. Do đó, DeepSeek V3 sẽ từ chối trả lời các câu hỏi liên quan đến những chủ đề nhạy cảm về mặt chính trị.
DeepSeek: Tham vọng về AI siêu thông minh
DeepSeek là một tổ chức đáng chú ý, được hỗ trợ bởi High-Flyer Capital Management, một quỹ đầu tư định lượng của Trung Quốc sử dụng AI trong các quyết định giao dịch. High-Flyer đang xây dựng các cụm máy chủ riêng để huấn luyện mô hình AI, với mục tiêu đạt được AI “siêu thông minh” thông qua DeepSeek.
DeepSeek V3 là một bước tiến quan trọng trong lĩnh vực AI “mở”. Nó cho thấy sự phát triển nhanh chóng của AI tại Trung Quốc và tiềm năng cạnh tranh với các mô hình AI hàng đầu thế giới. Tuy nhiên, những hạn chế về quan điểm chính trị cũng là một vấn đề cần được quan tâm.
Từ khoá:
Tin tài trợ
-
Tài trợQuảng cáo
MOONDROP EDGE: Tai nghe không dây với công nghệ chống ồn
MOONDROP EDGE là mẫu tai nghe không dây ANC (Chống ồn chủ động) mới, mang đến chất lượng âm thanh xuất sắc và các tính năng đột phá dành cho những người yêu âm nhạc. Chất lượng âm thanh vượt trội Điểm nổi bật của MOONDROP EDGE chính là driver động 40mm hiệu suất cao, […] -
Tài trợMobile
OPPO Reno13 Series: Smartphone dành cho giới trẻ, yêu thích chụp ảnh
OPPO tiếp tục khẳng định vị thế của dòng Reno tại Việt Nam với sự kiện ra mắt Reno13 Series vào ngày 3/1/2025. Bộ đôi Reno13 và Reno13 Pro hứa hẹn mang đến những trải nghiệm công nghệ đột phá trong phân khúc tầm trung. Sức mạnh từ chipset Dimensity 8350 và chip X1 Reno13 […] -
Tài trợKhoa học
HP Omen Max 16: Laptop gaming với CPU & GPU mới nhất từ Intel & NVIDIA
Rò rỉ mới nhất cho thấy HP Omen Max 16 sẽ được trang bị bộ xử lý Intel Arrow Lake-HX và card đồ họa Nvidia GeForce RTX 50 series, hứa hẹn mang đến hiệu năng vượt trội cho game thủ. Cấu hình mạnh mẽ Theo thông tin rò rỉ, Omen Max 16 sẽ sở hữu […] -
Tài trợQuảng cáo
Lava Yuva 2 5G ra mắt: Công nghệ 5G phổ thông trong tầm tay
Trong bối cảnh công nghệ 5G đang trở thành xu hướng phổ biến, Lava đã chính thức giới thiệu chiếc Yuva 2 5G với mục tiêu mang công nghệ này đến gần hơn với người dùng phổ thông. Với mức giá hợp lý và các tính năng cơ bản được tối ưu, Yuva 2 5G […]
Bài viết liên quan
OpenAI lỡ hẹn với GPT-5: Kế hoạch phát hành bị hoãn
Mô hình AI mới của DeepSeek có thể ứng dụng trong lĩnh vực nào?
AI và tác động xã hội: Khi trí tuệ nhân tạo đối mặt với sự bất công
Moflin: Thú cưng robot AI mang đến trải nghiệm gần gũi như thật
Gemini Deep Research: Khám phá thông tin sâu rộng bằng nhiều ngôn ngữ
Nghiên cứu AI: Bước tiến hay rào cản cho sự sáng tạo?
Ra mắt khu vườn AI, du khách có thể trò chuyện với cây cối
xAI của Elon Musk gọi vốn thành công 6 tỷ USD
OpenAI ra mắt mô hình o3, mạnh mẽ hơn GPT, bỏ qua GPT-5?
ASUS trình làng laptop Copilot+ nhẹ nhất thế giới tại CES 2025
Công nghệ làm mát lai AI: Tương lai của tủ lạnh hiện đại
Google hợp tác với Anthropic, sử dụng Claude để cải thiện Gemini AI
Drone AI trong chiến lược quân sự hiện đại
Ứng dụng iOS độc lập cho chatbot Grok của xAI sắp ra mắt
AI mới trong Chrome sẽ bảo vệ dữ liệu người dùng
Gemini “hô biến” ứng dụng Files by Google thành “siêu ứng dụng” đọc PDF
Face ID trên chuông cửa: Apple nâng tầm an ninh cho ngôi nhà?
NUC 14 Pro AI của ASUS: Sức mạnh AI trong một chiếc mini PC
OpenAI “khuấy đảo” giới công nghệ với mô hình o3 mới
ĐĂNG KÝ NHẬN TIN
NGAY HÔM NAY
Đăng ký để nhận thông tin sớm nhất về những câu chuyện nóng hổi hiện nay trên thị trường, công nghệ được cung cấp hàng ngày.
Bằng cách nhấp vào “Đăng ký”, bạn chấp nhận Điều khoản dịch vụ và Chính sách quyền riêng tư của chúng tôi. Bạn có thể chọn không tham gia bất cứ lúc nào.
5
s
Nhận xét (0)