Startup AI Mistral vừa ra mắt API mới dành cho việc kiểm duyệt nội dung. API này, cũng chính là API hỗ trợ tính năng kiểm duyệt trên nền tảng chatbot Le Chat của Mistral, có thể được điều chỉnh cho phù hợp với các ứng dụng và tiêu chuẩn an toàn cụ thể. API này được hỗ trợ bởi một mô hình tinh chỉnh (Ministral 8B) được huấn luyện để phân loại văn bản bằng nhiều ngôn ngữ, bao gồm tiếng Anh, tiếng Pháp và tiếng Đức, thành một trong chín loại: tình dục, thù địch và phân biệt đối xử, bạo lực và đe dọa, nội dung nguy hiểm và phạm pháp, tự gây hại, sức khỏe, tài chính, pháp luật và thông tin nhận dạng cá nhân.
API kiểm duyệt có thể được áp dụng cho cả văn bản thô hoặc văn bản hội thoại, Mistral cho biết: “Trong vài tháng qua, chúng tôi đã chứng kiến sự quan tâm ngày càng tăng trong ngành và cộng đồng nghiên cứu đối với các hệ thống kiểm duyệt mới dựa trên AI, có thể giúp việc kiểm duyệt trở nên có khả năng mở rộng và mạnh mẽ hơn trên các ứng dụng”. Bộ phân loại kiểm duyệt nội dung của chúng tôi tận dụng các danh mục chính sách phù hợp nhất để tạo ra các rào cản hiệu quả và giới thiệu một cách tiếp cận thực dụng đối với an toàn mô hình bằng cách giải quyết các tác hại do mô hình tạo ra như lời khuyên không đủ tiêu chuẩn và thông tin nhận dạng cá nhân.
Các hệ thống kiểm duyệt do AI hỗ trợ rất hữu ích về mặt lý thuyết. Nhưng chúng cũng dễ bị ảnh hưởng bởi những thành kiến và lỗ hổng kỹ thuật tương tự như các hệ thống AI khác.
Ví dụ: một số mô hình được huấn luyện để phát hiện độc tính lại coi các cụm từ trong tiếng Anh bản ngữ của người Mỹ gốc Phi (AAVE), ngữ pháp không chính thức được sử dụng bởi một số người Mỹ da đen, là “độc hại” một cách không tương xứng. Các nghiên cứu đã phát hiện ra rằng các bài đăng trên mạng xã hội về người khuyết tật cũng thường bị gắn cờ là tiêu cực hoặc độc hại hơn bởi các mô hình phát hiện độc tính và tình cảm công khai thường được sử dụng.
Mistral tuyên bố rằng mô hình kiểm duyệt của họ có độ chính xác cao – nhưng cũng thừa nhận rằng nó vẫn đang được phát triển. Đáng chú ý, công ty không so sánh hiệu suất của API của mình với các API kiểm duyệt phổ biến khác, như Perspective API của Jigsaw và API kiểm duyệt của OpenAI.
“Chúng tôi đang hợp tác với khách hàng của mình để xây dựng và chia sẻ các công cụ kiểm duyệt có khả năng mở rộng, gọn nhẹ và có thể tùy chỉnh”, công ty cho biết và sẽ tiếp tục hợp tác với cộng đồng nghiên cứu để đóng góp những tiến bộ về an toàn cho lĩnh vực rộng lớn hơn.”
Mistral cũng đã công bố API hàng loạt vào hôm nay. Công ty cho biết họ có thể giảm 25% chi phí của các mô hình được phục vụ thông qua API của mình bằng cách xử lý các yêu cầu khối lượng lớn một cách không đồng bộ. Anthropic, OpenAI, Google và những công ty khác cũng cung cấp các tùy chọn xử lý hàng loạt cho API AI của họ.
Tin tài trợ
-
Tài trợKhoa học
Cuối cùng cũng có ứng dụng cho phép sửa bài đăng Bluesky trên iPhone và Mac
Với hơn 24 triệu người dùng, Bluesky đang nổi lên như một đối thủ đáng gờm của X (Twitter). Tuy nhiên, ứng dụng và giao diện web của Bluesky vẫn còn thiếu nhiều tính năng hữu ích so với các nền tảng mạng xã hội khác. Skeets, ứng dụng dành cho iPhone, iPad và Mac […] -
Tài trợKhám phá
Biến máy Mac thành “cây thông Noel” với ứng dụng Festivitas
Bạn đang muốn hòa mình vào không khí lễ hội nhưng vẫn còn bận rộn với công việc? Ứng dụng macOS mới Festivitas sẽ giúp bạn trang trí màn hình máy tính Mac với những dây đèn lấp lánh, được treo từ thanh menu và chiếu sáng dock của bạn. Ý tưởng thú vị này […] -
Tài trợMobile
Realme 14x: Smartphone tầm trung với nhiều tính năng mới
Realme tiếp tục phát huy chiến lược ra mắt các mẫu smartphone tầm trung với việc chuẩn bị giới thiệu Realme 14x trong thời gian tới. Mặc dù chưa có thông báo chính thức từ hãng, một số thông tin và hình ảnh rò rỉ đã tiết lộ những đặc điểm đáng chú ý của […] -
Tài trợAI
Android tích hợp AI vào tính năng chia sẻ file, trợ năng như thế nào?
Google vừa công bố một loạt tính năng AI mới cho hệ sinh thái Android, tập trung vào khả năng truy cập, cá nhân hóa và tích hợp ứng dụng. Nâng cao trải nghiệm người dùng Phụ đề biểu cảm (Expressive Captions): Tự động tạo phụ đề nắm bắt cảm xúc và cường độ của […]
Bài viết liên quan
Android tích hợp AI vào tính năng chia sẻ file, trợ năng như thế nào?
Meta “lột xác” Llama, bất ngờ với những cải tiến vượt bậc
Sử dụng Threads? Hãy cẩn thận với dữ liệu cá nhân của bạn!
Google DeepMind tạo ra thế giới 3D tương tác chỉ bằng AI
iGenius và Nvidia: “Cặp đôi hoàn hảo” tạo nên bước đột phá trong lĩnh vực AI?
Google Photos ra mắt tính năng “Nhìn lại năm 2024” đầy cảm xúc
AI siêu thông minh: Lo ngại về sự phát triển vượt tầm kiểm soát
Grok “tuyên chiến” với ChatGPT, miễn phí cho người dùng X
LGM-Aero: Công nghệ AI giúp thiết kế máy bay chỉ trong vài ngày
ChatGPT Pro giá 200 USD/tháng, bạn có sẵn sàng chi trả?
PaliGemma 2: AI cải tiến khả năng nhận diện hình ảnh
Copilot Vision: Tính năng mới giúp Microsoft Edge thông minh hơn
Hunyuan Video: AI của Tencent biến văn bản thành video
IKEA Home Smart cập nhật tính năng mới
Cleerly: Khám phá công nghệ AI giúp phát hiện bệnh tim từ sớm
Vì sao ChatGPT gặp khó khăn trong việc tìm kiếm tin tức?
Salesforce “thắng lớn” nhờ đầu tư vào AI, cổ phiếu tăng vọt
Humane và tham vọng phát triển CosmOS cho thiết bị thông minh
Quảng cáo do AI tạo ra: Khác biệt đến khó hiểu?
ĐĂNG KÝ NHẬN TIN
NGAY HÔM NAY
Đăng ký để nhận thông tin sớm nhất về những câu chuyện nóng hổi hiện nay trên thị trường, công nghệ được cung cấp hàng ngày.
Bằng cách nhấp vào “Đăng ký”, bạn chấp nhận Điều khoản dịch vụ và Chính sách quyền riêng tư của chúng tôi. Bạn có thể chọn không tham gia bất cứ lúc nào.
5
s
Nhận xét (0)