DeepSeek, một công ty AI Trung Quốc, vừa phát hành DeepSeek V3, một mô hình AI “mở” được cho là mạnh mẽ nhất hiện nay. Mô hình này được phát hành dưới giấy phép cho phép các nhà phát triển tải xuống và sửa đổi cho hầu hết các ứng dụng, bao gồm cả ứng dụng thương mại.

Khả năng ấn tượng
DeepSeek V3 có thể xử lý nhiều tác vụ dựa trên văn bản, như lập trình, dịch thuật, viết luận và email từ yêu cầu mô tả. Theo kết quả kiểm tra nội bộ của DeepSeek, DeepSeek V3 vượt trội hơn cả các mô hình “mở” có thể tải xuống và các mô hình AI “đóng” chỉ có thể truy cập thông qua API.
Trong một số cuộc thi lập trình trên Codeforces, DeepSeek V3 đã đánh bại các mô hình khác, bao gồm Llama 3.1 405B của Meta, GPT-4o của OpenAI và Qwen 2.5 72B của Alibaba. DeepSeek V3 cũng vượt trội trong bài kiểm tra Aider Polyglot, được thiết kế để đánh giá khả năng viết mã mới tích hợp vào mã hiện có.
Quy mô khổng lồ
DeepSeek V3 được huấn luyện trên tập dữ liệu 14,8 nghìn tỷ token và có 671 tỷ tham số. Điều này khiến nó trở thành một trong những mô hình AI lớn nhất hiện nay. Số lượng tham số lớn thường tương quan với khả năng của mô hình, nhưng cũng đòi hỏi phần cứng mạnh mẽ hơn để vận hành.
Thành tựu đáng chú ý
DeepSeek đã huấn luyện mô hình này bằng cách sử dụng trung tâm dữ liệu với GPU Nvidia H800 chỉ trong khoảng hai tháng – loại GPU mà các công ty Trung Quốc gần đây đã bị Bộ Thương mại Hoa Kỳ hạn chế mua. Công ty cũng tuyên bố chỉ tốn 5,5 triệu USD để huấn luyện DeepSeek V3, thấp hơn nhiều so với chi phí phát triển các mô hình như GPT-4 của OpenAI.
Hạn chế về quan điểm chính trị
Tuy nhiên, DeepSeek V3 cũng có những hạn chế nhất định. Là một công ty Trung Quốc, DeepSeek phải tuân thủ các quy định của cơ quan quản lý internet Trung Quốc để đảm bảo các phản hồi của mô hình “phản ánh các giá trị xã hội chủ nghĩa cốt lõi”. Do đó, DeepSeek V3 sẽ từ chối trả lời các câu hỏi liên quan đến những chủ đề nhạy cảm về mặt chính trị.
DeepSeek: Tham vọng về AI siêu thông minh
DeepSeek là một tổ chức đáng chú ý, được hỗ trợ bởi High-Flyer Capital Management, một quỹ đầu tư định lượng của Trung Quốc sử dụng AI trong các quyết định giao dịch. High-Flyer đang xây dựng các cụm máy chủ riêng để huấn luyện mô hình AI, với mục tiêu đạt được AI “siêu thông minh” thông qua DeepSeek.
DeepSeek V3 là một bước tiến quan trọng trong lĩnh vực AI “mở”. Nó cho thấy sự phát triển nhanh chóng của AI tại Trung Quốc và tiềm năng cạnh tranh với các mô hình AI hàng đầu thế giới. Tuy nhiên, những hạn chế về quan điểm chính trị cũng là một vấn đề cần được quan tâm.
Từ khoá:
Tin tài trợ
- Vũ trụ
Premium
Hubble của NASA và ESA công bố hình ảnh ngoạn mục về lõi thiên hà Xì gà
Bức ảnh mới nhất từ Kính viễn vọng không gian Hubble của NASA và ESA vừa hé lộ những chi tiết chưa từng thấy về thiên hà Messier 82 (M82), nơi hàng triệu ngôi sao rực rỡ đang ẩn mình sau những đám mây bụi và khí với hình thù độc đáo. Bức ảnh mang […] - Thủ thuật
Premium
Lý do màn hình nhấp nháy khi chơi game và cách khắc phục
Hiện tượng màn hình nhấp nháy khi chơi game đã trở thành một nỗi ám ảnh đối với nhiều game thủ, gây khó chịu và ảnh hưởng đáng kể đến trải nghiệm. Theo các chuyên gia công nghệ, nguyên nhân chính của vấn đề này có thể nằm ở chính công nghệ đồng bộ hóa […] - Mobile
Premium
iPhone 17 Pro và iPhone Air vừa ra mắt đã dính lỗi trầy xước
Ngay khi vừa được bày bán tại các Apple Store trên toàn cầu, bộ đôi iPhone 17 Pro và iPhone Air – hai mẫu máy đang nhận được sự quan tâm đặc biệt của cộng đồng công nghệ – đã bắt đầu ghi nhận những phản ánh đầu tiên về hiện tượng trầy xước. Điều […] - Khám phá
Premium
Jimmy Kimmel bị đình chỉ: ‘Văn hóa tẩy chay’ hay áp lực chính trị?
Mới đây, đài truyền hình ABC, thuộc sở hữu của Disney, đã đột ngột đình chỉ chương trình nổi tiếng Jimmy Kimmel Live. Quyết định này được đưa ra ngay sau khi nam MC có một bình luận gây tranh cãi về vụ án mạng liên quan đến Charlie Kirk. Sự việc nhanh chóng trở […]
Bài viết liên quan
Thiết bị ‘siêu máy tính AI’ cá nhân của Nvidia sẵn sàng ra mắt thị trường vào 15/10
California thiết lập khung pháp lý cho các ứng dụng chatbot AI
Fan hâm mộ Taylor Swift phản ứng trước nghi vấn cô dùng hình ảnh tạo bởi AI trong chiến dịch quảng bá
Nền tảng ChatGPT của OpenAI chính thức trình làng tính năng tích hợp đa ứng dụng
Nội bộ OpenAI đang đối mặt với những thách thức từ chiến lược truyền thông xã hội mới của công ty
Toyota bổ sung khoản vốn 1,5 tỷ USD, khẳng định niềm tin vào các dự án startup công nghệ
OpenAI công bố mô hình Sora 2 và ứng dụng chia sẻ video, mục tiêu cạnh tranh với Tiktok
Thông tin sai lệch của nền tảng Deepseek AI về chủ quyền biển đảo Việt Nam gây tranh cãi
DeepSeek: Từ A đến Z về ứng dụng trò chuyện AI được giới công nghệ quan tâm
Robot siêu nhỏ “đi bộ trên nước” lấy cảm hứng từ côn trùng nước
Microsoft ra động thái hạn chế quân đội Israel sử dụng dịch vụ đám mây và AI
Insta360 Wave ra mắt: Loa hội nghị AI có 8 micro, tự động tóm tắt cuộc họp và pin 12 giờ
Elon Musk ‘hạ giá’ Grok, mời chào Chính phủ Liên bang Mỹ với giá ‘rẻ như cho’
Databricks chi 100 triệu USD, tích hợp mô hình OpenAI vào sản phẩm để thúc đẩy doanh nghiệp ứng dụng
Spotify ban hành quy định mới về dán nhãn âm nhạc do AI sáng tác
Google Cloud đẩy mạnh chiến lược, không ngừng mở rộng phạm vi hoạt động
Gemini 2.5 Deep Think giành huy chương vàng tại ICPC 2025
Việt Nam đứng trước thách thức và cơ hội lớn trong làn sóng phát triển AI
Tham vọng của Thượng nghị sĩ Scott Wiener: Buộc Big Tech tiết lộ rủi ro từ trí tuệ nhân tạo

ĐĂNG KÝ NHẬN TIN
NGAY HÔM NAY
Đăng ký để nhận thông tin sớm nhất về những câu chuyện nóng hổi hiện nay trên thị trường, công nghệ được cung cấp hàng ngày.
Bằng cách nhấp vào “Đăng ký”, bạn chấp nhận Điều khoản dịch vụ và Chính sách quyền riêng tư của chúng tôi. Bạn có thể chọn không tham gia bất cứ lúc nào.


Nhận xét (0)