DeepSeek: Từ A đến Z về ứng dụng trò chuyện AI được giới công nghệ quan tâm

12:02 30/09/2025

6 phút đọc

Trong tuần vừa qua, DeepSeek – ứng dụng chatbot trí tuệ nhân tạo đến từ Trung Quốc – đã tạo nên một cơn sốt trên toàn cầu, leo lên vị trí dẫn đầu các bảng xếp hạng ứng dụng trên cả Apple App Store và Google Play.

DeepSeek: Từ A đến Z về ứng dụng trò chuyện AI được giới công nghệ quan tâm - Techlade

Nguồn ảnh: Techlade

Sự trỗi dậy mạnh mẽ và bất ngờ của DeepSeek, với các mô hình AI được đào tạo bằng kỹ thuật tiết kiệm điện toán hiệu quả, đã khiến giới phân tích tại Phố Wall và các chuyên gia công nghệ đặt ra câu hỏi lớn: Liệu Mỹ có còn duy trì được vị thế dẫn đầu trong cuộc đua AI và nhu cầu đối với chip AI có tiếp tục tăng trưởng bền vững?

Vậy, DeepSeek đến từ đâu và làm thế nào mà cái tên này lại nhanh chóng đạt được danh tiếng quốc tế chỉ trong một thời gian ngắn như vậy?

DeepSeek có xuất phát điểm từ High-Flyer Capital Management, một quỹ phòng hộ định lượng (quantitative hedge fund) của Trung Quốc chuyên sử dụng AI để đưa ra các quyết định giao dịch. Ông Liang Wenfeng, một người đam mê AI và được cho là đã bắt đầu nghiên cứu giao dịch khi còn là sinh viên tại Đại học Chiết Giang, đã đồng sáng lập High-Flyer vào năm 2015. Đến năm 2019, công ty chính thức ra mắt như một quỹ phòng hộ tập trung vào phát triển và triển khai các thuật toán AI.

Năm 2023, High-Flyer thành lập DeepSeek như một phòng thí nghiệm chuyên nghiên cứu các công cụ AI, hoạt động tách biệt khỏi mảng kinh doanh tài chính. Sau đó, phòng thí nghiệm này đã tách ra thành một công ty độc lập mang tên DeepSeek, với High-Flyer là một trong những nhà đầu tư. Ngay từ những ngày đầu, DeepSeek đã tự xây dựng các cụm trung tâm dữ liệu riêng để phục vụ cho việc huấn luyện mô hình. Tuy nhiên, giống như nhiều công ty AI khác ở Trung Quốc, DeepSeek chịu ảnh hưởng từ lệnh cấm xuất khẩu phần cứng của Mỹ. Để huấn luyện một trong những mô hình gần đây của mình, công ty buộc phải sử dụng chip Nvidia H800, một phiên bản kém mạnh mẽ hơn so với chip H100 mà các công ty Mỹ được phép sử dụng.

DeepSeek: Từ A đến Z về ứng dụng trò chuyện AI được giới công nghệ quan tâm - Techlade

Nguồn ảnh: Online

Đội ngũ kỹ thuật của DeepSeek được cho là có xu hướng trẻ tuổi. Công ty tích cực tuyển dụng các nhà nghiên cứu AI có bằng tiến sĩ từ các trường đại học hàng đầu Trung Quốc. Đặc biệt, theo ghi nhận của The New York Times, DeepSeek còn tuyển dụng cả những người không có nền tảng khoa học máy tính để giúp công nghệ của họ hiểu rõ hơn về nhiều lĩnh vực khác nhau.

DeepSeek lần đầu tiên giới thiệu các mô hình của mình – DeepSeek Coder, DeepSeek LLM và DeepSeek Chat – vào tháng 11 năm 2023. Tuy nhiên, phải đến mùa xuân năm ngoái, khi startup này ra mắt thế hệ mô hình tiếp theo là DeepSeek-V2, ngành công nghiệp AI mới thực sự bắt đầu chú ý. DeepSeek-V2, một hệ thống đa năng có khả năng phân tích văn bản và hình ảnh, đã đạt hiệu suất cao trong nhiều tiêu chuẩn AI khác nhau, và quan trọng hơn, chi phí vận hành lại thấp hơn đáng kể so với các mô hình cạnh tranh cùng thời điểm. Điều này đã buộc các đối thủ nội địa của DeepSeek, bao gồm ByteDance và Alibaba, phải cắt giảm giá sử dụng cho một số mô hình của họ, thậm chí là cung cấp miễn phí một số dịch vụ khác. DeepSeek-V3, ra mắt vào tháng 12 năm 2024, càng làm tăng thêm sự nổi tiếng của hãng.

Theo các thử nghiệm đánh giá nội bộ của DeepSeek, DeepSeek V3 vượt trội hơn cả các mô hình có thể tải về công khai như Llama của Meta, lẫn các mô hình “đóng” chỉ có thể truy cập qua API như GPT-4o của OpenAI.

Mô hình lý luận (reasoning model) R1 được DeepSeek phát hành vào tháng 1 cũng gây ấn tượng mạnh, với tuyên bố rằng hiệu suất của R1 ngang bằng với mô hình o1 của OpenAI trên các tiêu chuẩn quan trọng. Đặc điểm của một mô hình lý luận là khả năng tự kiểm tra tính xác thực của thông tin, giúp nó tránh được những sai sót thường gặp. Mặc dù các mô hình lý luận thường mất nhiều thời gian hơn để đưa ra giải pháp, nhưng đổi lại, chúng có xu hướng đáng tin cậy hơn trong các lĩnh vực như vật lý, khoa học và toán học.

Tuy nhiên, các mô hình của DeepSeek, bao gồm R1 và DeepSeek V3, cũng có một mặt hạn chế. Là AI được phát triển ở Trung Quốc, chúng phải chịu sự giám sát của cơ quan quản lý Internet nước này nhằm đảm bảo các câu trả lời “thể hiện các giá trị xã hội chủ nghĩa cốt lõi”. Ví dụ, trong ứng dụng chatbot của DeepSeek, R1 sẽ không trả lời các câu hỏi liên quan đến Thiên An Môn hoặc quyền tự trị của Đài Loan.

Vào tháng 3, DeepSeek đã vượt mốc 16,5 triệu lượt truy cập. Ông David Carr, biên tập viên tại Similarweb, chia sẻ với Techlade rằng: “Trong tháng 3, DeepSeek đứng ở vị trí thứ hai, mặc dù lưu lượng truy cập đã giảm 25% so với tháng 2 dựa trên số lượt truy cập hàng ngày.” Dù vậy, con số này vẫn còn rất nhỏ bé khi so với ChatGPT, ứng dụng đã vượt qua 500 triệu người dùng hoạt động hàng tuần trong cùng tháng 3.

Trong tháng 5, DeepSeek tiếp tục phát hành phiên bản cập nhật của mô hình lý luận AI R1 trên nền tảng dành cho nhà phát triển Hugging Face. Gần đây nhất, vào tháng 9, DeepSeek đã công bố mô hình thử nghiệm mới V3.2-exp, được thiết kế để giảm đáng kể chi phí suy luận khi được sử dụng trong các tác vụ ngữ cảnh dài.

Nếu DeepSeek có một mô hình kinh doanh, thì mô hình đó vẫn chưa rõ ràng. Công ty định giá các sản phẩm và dịch vụ của mình thấp hơn nhiều so với giá thị trường và thậm chí cung cấp một số miễn phí, đồng thời không nhận vốn từ các nhà đầu tư dù có rất nhiều quỹ đầu tư mạo hiểm quan tâm. DeepSeek lý giải rằng những đột phá về hiệu suất đã cho phép họ duy trì lợi thế cạnh tranh về chi phí cực lớn. Tuy nhiên, một số chuyên gia đã bày tỏ nghi ngờ về các số liệu mà công ty cung cấp.

Dù thực hư thế nào, các nhà phát triển đã đón nhận nhiệt tình các mô hình của DeepSeek, vốn không phải là mã nguồn mở theo nghĩa thông thường nhưng có sẵn dưới các giấy phép cho phép sử dụng thương mại. Theo Clem Delangue, Giám đốc điều hành của Hugging Face, nền tảng lưu trữ các mô hình của DeepSeek, các nhà phát triển trên Hugging Face đã tạo ra hơn 500 mô hình “phái sinh” của R1, đạt tổng cộng 2,5 triệu lượt tải xuống.

Thành công của DeepSeek trước các đối thủ lớn hơn và đã có tên tuổi được mô tả là “đảo lộn cuộc chơi AI,” dù cũng có ý kiến cho rằng sự việc này bị “thổi phồng quá mức.” Ít nhất, thành công của công ty đã góp phần khiến giá cổ phiếu của Nvidia giảm 18% vào tháng 1 và khiến Giám đốc điều hành OpenAI, Sam Altman, phải lên tiếng công khai. Vào tháng 3, các cơ quan thuộc Bộ Thương mại Mỹ đã thông báo với nhân viên rằng DeepSeek sẽ bị cấm sử dụng trên các thiết bị chính phủ của họ, theo nguồn tin từ Reuters.

Dù có những rào cản, Microsoft đã thông báo rằng DeepSeek hiện đã có mặt trên dịch vụ Azure AI Foundry của hãng. Khi được hỏi về tác động của DeepSeek đối với chi tiêu AI của Meta trong cuộc họp báo cáo thu nhập quý đầu tiên, Giám đốc điều hành Mark Zuckerberg nhấn mạnh rằng việc chi tiêu cho cơ sở hạ tầng AI sẽ tiếp tục là một “lợi thế chiến lược” cho Meta. Trong tháng 3, OpenAI gọi DeepSeek là một công ty “được nhà nước trợ cấp” và “do nhà nước kiểm soát,” đồng thời khuyến nghị chính phủ Mỹ cân nhắc cấm các mô hình của DeepSeek.

Trong cuộc họp báo cáo thu nhập quý IV của Nvidia, Giám đốc điều hành Jensen Huang đã ca ngợi “sự đổi mới xuất sắc” của DeepSeek, cho rằng các mô hình “lý luận” như của hãng này rất tốt cho Nvidia vì chúng đòi hỏi khả năng điện toán cao hơn rất nhiều.

Cùng lúc đó, một số công ty và thậm chí là các quốc gia và chính phủ, bao gồm cả Hàn Quốc và bang New York, đã cấm sử dụng DeepSeek trên các thiết bị chính phủ. Vào tháng 5, phó chủ tịch kiêm chủ tịch Microsoft, Brad Smith, cho biết trong một phiên điều trần tại Thượng viện rằng nhân viên Microsoft không được phép sử dụng DeepSeek do lo ngại về bảo mật dữ liệu và tuyên truyền.

Về tương lai của DeepSeek, mọi thứ vẫn còn bỏ ngỏ. Việc cải tiến mô hình chắc chắn sẽ tiếp diễn. Tuy nhiên, chính phủ Mỹ dường như đang ngày càng cảnh giác với những gì họ coi là ảnh hưởng xấu từ nước ngoài. Vào tháng 3, The Wall Street Journal đưa tin rằng Mỹ có khả năng sẽ cấm DeepSeek trên các thiết bị chính phủ.

Nguồn tin: TechCrunch

Chia sẻ bài viết:

Từ khoá:

Tin tài trợ

Nhận xét (0)

Bài viết liên quan

ĐĂNG KÝ NHẬN TIN

NGAY HÔM NAY

Đăng ký để nhận thông tin sớm nhất về những câu chuyện nóng hổi hiện nay trên thị trường, công nghệ được cung cấp hàng ngày.

    Bằng cách nhấp vào “Đăng ký”, bạn chấp nhận Điều khoản dịch vụ và Chính sách quyền riêng tư của chúng tôi. Bạn có thể chọn không tham gia bất cứ lúc nào.