DeepSeek, một công ty AI Trung Quốc, vừa phát hành DeepSeek V3, một mô hình AI “mở” được cho là mạnh mẽ nhất hiện nay. Mô hình này được phát hành dưới giấy phép cho phép các nhà phát triển tải xuống và sửa đổi cho hầu hết các ứng dụng, bao gồm cả ứng dụng thương mại.
Khả năng ấn tượng
DeepSeek V3 có thể xử lý nhiều tác vụ dựa trên văn bản, như lập trình, dịch thuật, viết luận và email từ yêu cầu mô tả. Theo kết quả kiểm tra nội bộ của DeepSeek, DeepSeek V3 vượt trội hơn cả các mô hình “mở” có thể tải xuống và các mô hình AI “đóng” chỉ có thể truy cập thông qua API.
Trong một số cuộc thi lập trình trên Codeforces, DeepSeek V3 đã đánh bại các mô hình khác, bao gồm Llama 3.1 405B của Meta, GPT-4o của OpenAI và Qwen 2.5 72B của Alibaba. DeepSeek V3 cũng vượt trội trong bài kiểm tra Aider Polyglot, được thiết kế để đánh giá khả năng viết mã mới tích hợp vào mã hiện có.
Quy mô khổng lồ
DeepSeek V3 được huấn luyện trên tập dữ liệu 14,8 nghìn tỷ token và có 671 tỷ tham số. Điều này khiến nó trở thành một trong những mô hình AI lớn nhất hiện nay. Số lượng tham số lớn thường tương quan với khả năng của mô hình, nhưng cũng đòi hỏi phần cứng mạnh mẽ hơn để vận hành.
Thành tựu đáng chú ý
DeepSeek đã huấn luyện mô hình này bằng cách sử dụng trung tâm dữ liệu với GPU Nvidia H800 chỉ trong khoảng hai tháng – loại GPU mà các công ty Trung Quốc gần đây đã bị Bộ Thương mại Hoa Kỳ hạn chế mua. Công ty cũng tuyên bố chỉ tốn 5,5 triệu USD để huấn luyện DeepSeek V3, thấp hơn nhiều so với chi phí phát triển các mô hình như GPT-4 của OpenAI.
Hạn chế về quan điểm chính trị
Tuy nhiên, DeepSeek V3 cũng có những hạn chế nhất định. Là một công ty Trung Quốc, DeepSeek phải tuân thủ các quy định của cơ quan quản lý internet Trung Quốc để đảm bảo các phản hồi của mô hình “phản ánh các giá trị xã hội chủ nghĩa cốt lõi”. Do đó, DeepSeek V3 sẽ từ chối trả lời các câu hỏi liên quan đến những chủ đề nhạy cảm về mặt chính trị.
DeepSeek: Tham vọng về AI siêu thông minh
DeepSeek là một tổ chức đáng chú ý, được hỗ trợ bởi High-Flyer Capital Management, một quỹ đầu tư định lượng của Trung Quốc sử dụng AI trong các quyết định giao dịch. High-Flyer đang xây dựng các cụm máy chủ riêng để huấn luyện mô hình AI, với mục tiêu đạt được AI “siêu thông minh” thông qua DeepSeek.
DeepSeek V3 là một bước tiến quan trọng trong lĩnh vực AI “mở”. Nó cho thấy sự phát triển nhanh chóng của AI tại Trung Quốc và tiềm năng cạnh tranh với các mô hình AI hàng đầu thế giới. Tuy nhiên, những hạn chế về quan điểm chính trị cũng là một vấn đề cần được quan tâm.
Từ khoá:
Tin tài trợ
-
Tài trợMobile
Tai nghe boAt Nirvana X: Độ trễ thấp 60ms, lý tưởng cho game thủ
boAt vừa giới thiệu tai nghe Nirvana X TWS tại thị trường Ấn Độ, với điểm nhấn là trình điều khiển kép, công nghệ AI giúp cuộc gọi rõ ràng hơn và các tính năng dành cho game thủ. Tai nghe hiện đang được bán với giá ưu đãi trong thời gian giới hạn. Tính […] -
Tài trợKhám phá
Viltrox ra mắt ống kính “siêu mỏng” 28mm f/4.5 cho Fujifilm X
Vài tuần sau khi ra mắt ống kính Viltrox 28mm f/4.5 cho máy ảnh Sony FE, hãng sản xuất này tiếp tục giới thiệu phiên bản dành cho Fujifilm X. Viltrox không thay đổi nhiều về thiết kế và thông số kỹ thuật, ống kính vẫn phủ được vòng tròn ảnh của cảm biến full-frame, […] -
Tài trợQuảng cáo
Anker ra mắt cáp USB-C 2-trong-1 siêu dài, biến hình linh hoạt
Anker vừa “lên đời” cáp USB-C 2-trong-1 với phiên bản dài hơn. Trước đó, vào tháng 6 năm ngoái, Anker đã ra mắt chiếc cáp “độc đáo” này trên thị trường toàn cầu, nhấn mạnh tính tiện lợi khi di chuyển và khả năng giúp bàn làm việc gọn gàng hơn. Dài hơn, linh hoạt […] -
Tài trợQuảng cáo
BenQ LH750: Máy chiếu “siêu sáng” 5.000 ANSI lumens cho phòng họp
BenQ vừa ra mắt LH750, một mẫu máy chiếu mới dành cho phòng họp. Hãng quảng cáo thiết bị này được thiết kế để “trình chiếu sống động và rực rỡ” với nguồn sáng LED có độ sáng lên đến 5.000 ANSI lumens. Tuổi thọ của đèn LED dự kiến khoảng 30.000 giờ ở chế […]
Bài viết liên quan
NBA “bắt tay” startup Phần Lan, phát triển bóng rổ “thông minh” với AI
DeepSeek “khốn đốn” vì quá tải máy chủ, người dùng mất kết nối
Snapchat “chia tay” Google và OpenAI, phát triển công cụ tạo ảnh AI riêng
Google “nâng cấp” SynthID, “bắt bài” ảnh chỉnh sửa bằng AI trên Magic Editor
DeepSeek gặp rào cản pháp lý tại châu Âu vì bảo mật dữ liệu người dùng
Humphrey: Trí tuệ nhân tạo mới giúp hiện đại hóa hành chính
AI mô phỏng tiến hóa 500 triệu năm để tạo ra protein mới
Trung Quốc đón đầu xu hướng với robot AI phục vụ đường sắt
OpenAI ra mắt Operator: AI “lướt web” và hoàn thành nhiệm vụ
Google đã giành được sự chú ý lớn hơn Samsung tại sự kiện Unpacked
OpenAI “ém hàng” Operator, công cụ AI với khả năng đáng kinh ngạc?
ChatGPT “chống lại” Google: Lãnh đạo sản phẩm làm chứng chống độc quyền
MiniMax vs. OpenAI: Cuộc chiến mới trong lĩnh vực AI?
GenEx: Công nghệ biến ảnh tĩnh thành thế giới ảo sống động
Máy tính lượng tử lớn nhất: AI giúp tối ưu hóa sắp xếp nguyên tử
Trợ lý ảo Mercedes-Benz được nâng cấp với AI đàm thoại của Google
Adobe “cách mạng hóa” chỉnh sửa ảnh với công cụ AI mới
Nvidia ủng hộ Trump, chỉ trích chính sách AI của Biden
Elon Musk: Dữ liệu tổng hợp là chìa khóa cho tương lai AI
ĐĂNG KÝ NHẬN TIN
NGAY HÔM NAY
Đăng ký để nhận thông tin sớm nhất về những câu chuyện nóng hổi hiện nay trên thị trường, công nghệ được cung cấp hàng ngày.
Bằng cách nhấp vào “Đăng ký”, bạn chấp nhận Điều khoản dịch vụ và Chính sách quyền riêng tư của chúng tôi. Bạn có thể chọn không tham gia bất cứ lúc nào.
5
s
Nhận xét (0)