Startup AI Mistral vừa ra mắt API mới dành cho việc kiểm duyệt nội dung. API này, cũng chính là API hỗ trợ tính năng kiểm duyệt trên nền tảng chatbot Le Chat của Mistral, có thể được điều chỉnh cho phù hợp với các ứng dụng và tiêu chuẩn an toàn cụ thể. API này được hỗ trợ bởi một mô hình tinh chỉnh (Ministral 8B) được huấn luyện để phân loại văn bản bằng nhiều ngôn ngữ, bao gồm tiếng Anh, tiếng Pháp và tiếng Đức, thành một trong chín loại: tình dục, thù địch và phân biệt đối xử, bạo lực và đe dọa, nội dung nguy hiểm và phạm pháp, tự gây hại, sức khỏe, tài chính, pháp luật và thông tin nhận dạng cá nhân.

API kiểm duyệt có thể được áp dụng cho cả văn bản thô hoặc văn bản hội thoại, Mistral cho biết: “Trong vài tháng qua, chúng tôi đã chứng kiến sự quan tâm ngày càng tăng trong ngành và cộng đồng nghiên cứu đối với các hệ thống kiểm duyệt mới dựa trên AI, có thể giúp việc kiểm duyệt trở nên có khả năng mở rộng và mạnh mẽ hơn trên các ứng dụng”. Bộ phân loại kiểm duyệt nội dung của chúng tôi tận dụng các danh mục chính sách phù hợp nhất để tạo ra các rào cản hiệu quả và giới thiệu một cách tiếp cận thực dụng đối với an toàn mô hình bằng cách giải quyết các tác hại do mô hình tạo ra như lời khuyên không đủ tiêu chuẩn và thông tin nhận dạng cá nhân.
Các hệ thống kiểm duyệt do AI hỗ trợ rất hữu ích về mặt lý thuyết. Nhưng chúng cũng dễ bị ảnh hưởng bởi những thành kiến và lỗ hổng kỹ thuật tương tự như các hệ thống AI khác.
Ví dụ: một số mô hình được huấn luyện để phát hiện độc tính lại coi các cụm từ trong tiếng Anh bản ngữ của người Mỹ gốc Phi (AAVE), ngữ pháp không chính thức được sử dụng bởi một số người Mỹ da đen, là “độc hại” một cách không tương xứng. Các nghiên cứu đã phát hiện ra rằng các bài đăng trên mạng xã hội về người khuyết tật cũng thường bị gắn cờ là tiêu cực hoặc độc hại hơn bởi các mô hình phát hiện độc tính và tình cảm công khai thường được sử dụng.
Mistral tuyên bố rằng mô hình kiểm duyệt của họ có độ chính xác cao – nhưng cũng thừa nhận rằng nó vẫn đang được phát triển. Đáng chú ý, công ty không so sánh hiệu suất của API của mình với các API kiểm duyệt phổ biến khác, như Perspective API của Jigsaw và API kiểm duyệt của OpenAI.
“Chúng tôi đang hợp tác với khách hàng của mình để xây dựng và chia sẻ các công cụ kiểm duyệt có khả năng mở rộng, gọn nhẹ và có thể tùy chỉnh”, công ty cho biết và sẽ tiếp tục hợp tác với cộng đồng nghiên cứu để đóng góp những tiến bộ về an toàn cho lĩnh vực rộng lớn hơn.”
Mistral cũng đã công bố API hàng loạt vào hôm nay. Công ty cho biết họ có thể giảm 25% chi phí của các mô hình được phục vụ thông qua API của mình bằng cách xử lý các yêu cầu khối lượng lớn một cách không đồng bộ. Anthropic, OpenAI, Google và những công ty khác cũng cung cấp các tùy chọn xử lý hàng loạt cho API AI của họ.
Tin tài trợ
- Vũ trụ
Premium
Hubble của NASA và ESA công bố hình ảnh ngoạn mục về lõi thiên hà Xì gà
Bức ảnh mới nhất từ Kính viễn vọng không gian Hubble của NASA và ESA vừa hé lộ những chi tiết chưa từng thấy về thiên hà Messier 82 (M82), nơi hàng triệu ngôi sao rực rỡ đang ẩn mình sau những đám mây bụi và khí với hình thù độc đáo. Bức ảnh mang […] - Thủ thuật
Premium
Lý do màn hình nhấp nháy khi chơi game và cách khắc phục
Hiện tượng màn hình nhấp nháy khi chơi game đã trở thành một nỗi ám ảnh đối với nhiều game thủ, gây khó chịu và ảnh hưởng đáng kể đến trải nghiệm. Theo các chuyên gia công nghệ, nguyên nhân chính của vấn đề này có thể nằm ở chính công nghệ đồng bộ hóa […] - Mobile
Premium
iPhone 17 Pro và iPhone Air vừa ra mắt đã dính lỗi trầy xước
Ngay khi vừa được bày bán tại các Apple Store trên toàn cầu, bộ đôi iPhone 17 Pro và iPhone Air – hai mẫu máy đang nhận được sự quan tâm đặc biệt của cộng đồng công nghệ – đã bắt đầu ghi nhận những phản ánh đầu tiên về hiện tượng trầy xước. Điều […] - Khám phá
Premium
Jimmy Kimmel bị đình chỉ: ‘Văn hóa tẩy chay’ hay áp lực chính trị?
Mới đây, đài truyền hình ABC, thuộc sở hữu của Disney, đã đột ngột đình chỉ chương trình nổi tiếng Jimmy Kimmel Live. Quyết định này được đưa ra ngay sau khi nam MC có một bình luận gây tranh cãi về vụ án mạng liên quan đến Charlie Kirk. Sự việc nhanh chóng trở […]
Bài viết liên quan
Thiết bị ‘siêu máy tính AI’ cá nhân của Nvidia sẵn sàng ra mắt thị trường vào 15/10
California thiết lập khung pháp lý cho các ứng dụng chatbot AI
Fan hâm mộ Taylor Swift phản ứng trước nghi vấn cô dùng hình ảnh tạo bởi AI trong chiến dịch quảng bá
Nền tảng ChatGPT của OpenAI chính thức trình làng tính năng tích hợp đa ứng dụng
Nội bộ OpenAI đang đối mặt với những thách thức từ chiến lược truyền thông xã hội mới của công ty
Toyota bổ sung khoản vốn 1,5 tỷ USD, khẳng định niềm tin vào các dự án startup công nghệ
OpenAI công bố mô hình Sora 2 và ứng dụng chia sẻ video, mục tiêu cạnh tranh với Tiktok
Thông tin sai lệch của nền tảng Deepseek AI về chủ quyền biển đảo Việt Nam gây tranh cãi
DeepSeek: Từ A đến Z về ứng dụng trò chuyện AI được giới công nghệ quan tâm
Robot siêu nhỏ “đi bộ trên nước” lấy cảm hứng từ côn trùng nước
Microsoft ra động thái hạn chế quân đội Israel sử dụng dịch vụ đám mây và AI
Insta360 Wave ra mắt: Loa hội nghị AI có 8 micro, tự động tóm tắt cuộc họp và pin 12 giờ
Elon Musk ‘hạ giá’ Grok, mời chào Chính phủ Liên bang Mỹ với giá ‘rẻ như cho’
Databricks chi 100 triệu USD, tích hợp mô hình OpenAI vào sản phẩm để thúc đẩy doanh nghiệp ứng dụng
Spotify ban hành quy định mới về dán nhãn âm nhạc do AI sáng tác
Google Cloud đẩy mạnh chiến lược, không ngừng mở rộng phạm vi hoạt động
Gemini 2.5 Deep Think giành huy chương vàng tại ICPC 2025
Việt Nam đứng trước thách thức và cơ hội lớn trong làn sóng phát triển AI
Tham vọng của Thượng nghị sĩ Scott Wiener: Buộc Big Tech tiết lộ rủi ro từ trí tuệ nhân tạo

ĐĂNG KÝ NHẬN TIN
NGAY HÔM NAY
Đăng ký để nhận thông tin sớm nhất về những câu chuyện nóng hổi hiện nay trên thị trường, công nghệ được cung cấp hàng ngày.
Bằng cách nhấp vào “Đăng ký”, bạn chấp nhận Điều khoản dịch vụ và Chính sách quyền riêng tư của chúng tôi. Bạn có thể chọn không tham gia bất cứ lúc nào.


Nhận xét (0)