DeepSeek, phòng thí nghiệm AI đến từ Trung Quốc, đang trở thành hiện tượng sau khi ứng dụng chatbot của họ vươn lên dẫn đầu bảng xếp hạng App Store và Google Play. Thành công này đặt ra câu hỏi về vị thế dẫn đầu của Mỹ trong lĩnh vực AI và tác động đến nhu cầu chip AI toàn cầu.
DeepSeek là gì?
DeepSeek được hậu thuẫn bởi High-Flyer Capital Management, một quỹ phòng hộ tại Trung Quốc chuyên ứng dụng AI vào giao dịch tài chính. Quỹ này được sáng lập bởi Liang Wenfeng vào năm 2015, trước khi chính thức ra mắt DeepSeek vào năm 2023 như một phòng nghiên cứu AI độc lập.
Không giống nhiều công ty AI khác, DeepSeek tự xây dựng hệ thống trung tâm dữ liệu để huấn luyện mô hình của mình. Tuy nhiên, do lệnh cấm xuất khẩu phần cứng từ Mỹ, DeepSeek buộc phải sử dụng chip Nvidia H800 – phiên bản yếu hơn của H100 mà các công ty Mỹ được phép sử dụng.
DeepSeek có đội ngũ nhân sự khá trẻ và tuyển dụng mạnh mẽ từ các trường đại học hàng đầu Trung Quốc. Đặc biệt, họ còn chiêu mộ những người không có nền tảng khoa học máy tính để mở rộng phạm vi kiến thức của mô hình AI.
Thành công của DeepSeek đến từ đâu?
DeepSeek ra mắt ba mô hình AI đầu tiên vào tháng 11/2023, nhưng chỉ thực sự bùng nổ khi giới thiệu DeepSeek-V2 vào mùa xuân năm ngoái. Đây là một mô hình AI tổng hợp có khả năng xử lý cả văn bản và hình ảnh với chi phí vận hành rẻ hơn đáng kể so với các đối thủ. Thành công của DeepSeek-V2 khiến các đối thủ trong nước như ByteDance hay Alibaba phải hạ giá dịch vụ AI hoặc cung cấp miễn phí một số mô hình.
Sự đột phá tiếp tục được nhân rộng với DeepSeek-V3 vào tháng 12/2024, được cho là có hiệu suất vượt trội so với các mô hình nguồn mở như Llama của Meta và thậm chí cả GPT-4o của OpenAI theo các bài kiểm tra nội bộ.
Không dừng lại ở đó, DeepSeek còn phát triển mô hình R1 – một AI tập trung vào khả năng suy luận, giúp kiểm chứng thông tin trước khi đưa ra câu trả lời. Điều này giúp R1 tránh được các lỗi phổ biến của AI thông thường, đặc biệt trong các lĩnh vực khoa học, toán học và vật lý.
Hạn chế và tranh cãi
Tuy nhiên, vì được phát triển tại Trung Quốc, các mô hình của DeepSeek phải tuân thủ quy định kiểm duyệt nội dung của chính phủ nước này. Điều đó đồng nghĩa với việc chatbot của DeepSeek sẽ không trả lời các câu hỏi liên quan đến những chủ đề nhạy cảm như sự kiện Thiên An Môn hay vấn đề Đài Loan.
Mặt khác, DeepSeek chưa công khai mô hình kinh doanh rõ ràng. Họ cung cấp dịch vụ với mức giá rất thấp, thậm chí miễn phí, khiến nhiều chuyên gia nghi ngờ về tính bền vững. Dù vậy, hiệu quả vượt trội về chi phí vẫn giúp họ thu hút hàng triệu lượt tải về và hàng trăm mô hình phái sinh trên nền tảng Hugging Face.
DeepSeek tác động đến ngành AI như thế nào?
Sự trỗi dậy của DeepSeek đã khiến thị trường AI chấn động. Giá cổ phiếu Nvidia giảm 18% trong một ngày, CEO OpenAI Sam Altman phải lên tiếng phản hồi, trong khi Microsoft nhanh chóng tích hợp DeepSeek vào nền tảng Azure AI Foundry. Ngay cả Mark Zuckerberg cũng phải nhấn mạnh rằng đầu tư vào hạ tầng AI vẫn là lợi thế chiến lược của Meta.
Dù vậy, không phải ai cũng chào đón DeepSeek. Một số chính phủ như Hàn Quốc và bang New York (Mỹ) đã cấm sử dụng DeepSeek trên thiết bị của cơ quan nhà nước, lo ngại ảnh hưởng của AI Trung Quốc.
Tương lai của DeepSeek sẽ ra sao?
DeepSeek chắc chắn sẽ tiếp tục ra mắt các mô hình AI tiên tiến hơn. Nhưng trong bối cảnh Mỹ ngày càng siết chặt kiểm soát với AI nước ngoài, con đường của DeepSeek vẫn còn nhiều thách thức. Sự cạnh tranh giữa các công ty AI lớn trên toàn cầu đang bước vào một giai đoạn gay cấn hơn bao giờ hết.
Bài viết liên quan
Người dùng Bluesky tranh luận về dữ liệu cá nhân và huấn luyện AI
Người dùng ‘phù phép’ ảnh, xóa bỏ watermark bằng AI mới của Google
Google sẽ loại bỏ trợ lý ảo khỏi phần lớn điện thoại trong năm nay
Notepad sắp được tích hợp tính năng tóm tắt bằng AI
Dự án Kaito: AI phân tích dữ liệu crypto, “bão táp” sau airdrop
Google ra mắt Gemini tùy chỉnh: AI giờ đây ‘hiểu’ bạn hơn
Sam Altman khoe khả năng viết của ChatGPT: AI có thể thay thế nhà văn hay chỉ là bản sao vô hồn?
Teledyne FLIR ra mắt camera nhiệt phóng xạ: “Mắt thần” cho drone, AI và công nghiệp
Manus AI ra mắt AI Agent “siêu năng lực”: Giải quyết vấn đề phức tạp, vượt trội chatbot thông thường
Meta thành công ‘tape-out’ chip AI đầu tiên, sử dụng công nghệ TSMC
OpenAI ra mắt công cụ mới giúp doanh nghiệp tạo chatbot AI “thông minh” hơn
Google Gemini: Cuộc cách mạng AI tại nơi làm việc
Tự động hóa lịch trình với nút AI mới của Google trong Gmail
PlayStation: Sony đang phát triển nhân vật game thông minh AI
Sony mạnh tay gỡ bỏ hơn 75.000 bài hát deepfake AI
Mistral OCR: API nhận dạng ký tự quang học với độ chính xác “vượt trội”
AI “phát điên” sau khi được tinh chỉnh bằng mã lỗi, đưa ra lời khuyên bạo lực và ủng hộ phát xít
Maserati MC20 lập kỷ lục tốc độ mới với “tài xế robot” AI
Google “mạnh tay” với tìm kiếm AI bất chấp lỗi “ảo giác”

ĐĂNG KÝ NHẬN TIN
NGAY HÔM NAY
Đăng ký để nhận thông tin sớm nhất về những câu chuyện nóng hổi hiện nay trên thị trường, công nghệ được cung cấp hàng ngày.
Bằng cách nhấp vào “Đăng ký”, bạn chấp nhận Điều khoản dịch vụ và Chính sách quyền riêng tư của chúng tôi. Bạn có thể chọn không tham gia bất cứ lúc nào.
5
s
Nhận xét (0)