Startup AI Mistral vừa ra mắt API mới dành cho việc kiểm duyệt nội dung. API này, cũng chính là API hỗ trợ tính năng kiểm duyệt trên nền tảng chatbot Le Chat của Mistral, có thể được điều chỉnh cho phù hợp với các ứng dụng và tiêu chuẩn an toàn cụ thể. API này được hỗ trợ bởi một mô hình tinh chỉnh (Ministral 8B) được huấn luyện để phân loại văn bản bằng nhiều ngôn ngữ, bao gồm tiếng Anh, tiếng Pháp và tiếng Đức, thành một trong chín loại: tình dục, thù địch và phân biệt đối xử, bạo lực và đe dọa, nội dung nguy hiểm và phạm pháp, tự gây hại, sức khỏe, tài chính, pháp luật và thông tin nhận dạng cá nhân.

API kiểm duyệt có thể được áp dụng cho cả văn bản thô hoặc văn bản hội thoại, Mistral cho biết: “Trong vài tháng qua, chúng tôi đã chứng kiến sự quan tâm ngày càng tăng trong ngành và cộng đồng nghiên cứu đối với các hệ thống kiểm duyệt mới dựa trên AI, có thể giúp việc kiểm duyệt trở nên có khả năng mở rộng và mạnh mẽ hơn trên các ứng dụng”. Bộ phân loại kiểm duyệt nội dung của chúng tôi tận dụng các danh mục chính sách phù hợp nhất để tạo ra các rào cản hiệu quả và giới thiệu một cách tiếp cận thực dụng đối với an toàn mô hình bằng cách giải quyết các tác hại do mô hình tạo ra như lời khuyên không đủ tiêu chuẩn và thông tin nhận dạng cá nhân.
Các hệ thống kiểm duyệt do AI hỗ trợ rất hữu ích về mặt lý thuyết. Nhưng chúng cũng dễ bị ảnh hưởng bởi những thành kiến và lỗ hổng kỹ thuật tương tự như các hệ thống AI khác.
Ví dụ: một số mô hình được huấn luyện để phát hiện độc tính lại coi các cụm từ trong tiếng Anh bản ngữ của người Mỹ gốc Phi (AAVE), ngữ pháp không chính thức được sử dụng bởi một số người Mỹ da đen, là “độc hại” một cách không tương xứng. Các nghiên cứu đã phát hiện ra rằng các bài đăng trên mạng xã hội về người khuyết tật cũng thường bị gắn cờ là tiêu cực hoặc độc hại hơn bởi các mô hình phát hiện độc tính và tình cảm công khai thường được sử dụng.
Mistral tuyên bố rằng mô hình kiểm duyệt của họ có độ chính xác cao – nhưng cũng thừa nhận rằng nó vẫn đang được phát triển. Đáng chú ý, công ty không so sánh hiệu suất của API của mình với các API kiểm duyệt phổ biến khác, như Perspective API của Jigsaw và API kiểm duyệt của OpenAI.
“Chúng tôi đang hợp tác với khách hàng của mình để xây dựng và chia sẻ các công cụ kiểm duyệt có khả năng mở rộng, gọn nhẹ và có thể tùy chỉnh”, công ty cho biết và sẽ tiếp tục hợp tác với cộng đồng nghiên cứu để đóng góp những tiến bộ về an toàn cho lĩnh vực rộng lớn hơn.”
Mistral cũng đã công bố API hàng loạt vào hôm nay. Công ty cho biết họ có thể giảm 25% chi phí của các mô hình được phục vụ thông qua API của mình bằng cách xử lý các yêu cầu khối lượng lớn một cách không đồng bộ. Anthropic, OpenAI, Google và những công ty khác cũng cung cấp các tùy chọn xử lý hàng loạt cho API AI của họ.
Có thể bạn sẽ thích
- Baidu phát triển công nghệ AI để “dịch” tiếng động vật: Giao tiếp xuyên loài đang dần trở thành hiện thực?
- RAW Ring: Nhẫn AI có thể phát hiện ngoại tình
- Netflix đang triển khai một hệ thống quảng cáo mới, tích hợp trí tuệ nhân tạo tạo sinh (generative AI), và điều này có thể mang đến những trải nghiệm quảng cáo mang tính xâm nhập cao. Mục tiêu của kế hoạch này là nâng cao tính liên quan của quảng cáo bằng cách sử dụng AI để cung cấp những trải nghiệm hữu ích hơn cho người xem. Tuy nhiên, thực tế có vẻ như hệ thống mới sẽ bao gồm các quảng cáo dạng lớp phủ tương tác xuất hiện giữa chương trình (midroll) và khi tạm dừng (pause overlays), gây gián đoạn trực tiếp đến quá trình xem của người dùng. Điều đáng chú ý là hệ thống quảng cáo này sẽ không áp dụng cho những người dùng trả phí cho gói không quảng cáo. Thay vào đó, nó sẽ tự động được triển khai cho những người đang sử dụng gói Netflix có quảng cáo. Hệ Thống Quảng Cáo AI Của Netflix Hoạt Động Như Thế Nào? Sau khi ra mắt nền tảng quảng cáo nội bộ vào tháng trước, Netflix đang nỗ lực phát triển công nghệ quảng cáo “sáng tạo” hơn. Ý tưởng cốt lõi là các quảng cáo được tạo ra bởi AI tạo sinh sẽ hòa quyện với nội dung các chương trình của Netflix, từ đó tạo ra những trải nghiệm tương tác cho người xem. Hiện tại, việc bỏ qua hoặc lướt qua các quảng cáo trên Netflix tương đối dễ dàng. Tuy nhiên, bản cập nhật này có vẻ sẽ mang tính xâm nhập cao hơn nhiều và khó bỏ qua hơn. Thậm chí, do sự pha trộn tinh tế với nội dung, việc nhận diện quảng cáo có thể trở nên khó khăn hơn. Động Lực Nào Thúc Đẩy Netflix Thực Hiện Điều Này? Netflix giải thích rằng động thái này sẽ giúp họ sở hữu “lượng khán giả tương tác và tập trung nhất ở bất kỳ đâu”. Đây rõ ràng là một yếu tố hấp dẫn đối với các nhà quảng cáo hơn là người xem. Mặc dù vậy, Netflix cho rằng người xem có thể sẽ sẵn lòng tham gia vào các trải nghiệm quảng cáo tương tác này. Thời Điểm Triển Khai Quảng Cáo AI Của Netflix? Dự kiến, các quảng cáo AI mới sẽ được triển khai tại tất cả các quốc gia có gói quảng cáo vào năm 2026. Hệ thống này sẽ xuất hiện trên gói dịch vụ có chi phí thấp nhất của Netflix. Do đó, người dùng có thể vẫn còn thời gian để cân nhắc nâng cấp lên gói không quảng cáo nếu muốn tránh những quảng cáo AI mới này. Có vẻ như kỷ nguyên của việc xem trực tuyến không bị gián đoạn, hoặc phải trả phí cao hơn để có được điều đó, đang dần đi đến hồi kết khi giá cả dịch vụ có xu hướng tăng lên trong nỗ lực sản xuất nội dung chất lượng cao nhất đồng thời duy trì lợi nhuận.
Bài viết liên quan
Người dùng Bluesky tranh luận về dữ liệu cá nhân và huấn luyện AI
Người dùng ‘phù phép’ ảnh, xóa bỏ watermark bằng AI mới của Google
Google sẽ loại bỏ trợ lý ảo khỏi phần lớn điện thoại trong năm nay
Notepad sắp được tích hợp tính năng tóm tắt bằng AI
Dự án Kaito: AI phân tích dữ liệu crypto, “bão táp” sau airdrop
Google ra mắt Gemini tùy chỉnh: AI giờ đây ‘hiểu’ bạn hơn
Sam Altman khoe khả năng viết của ChatGPT: AI có thể thay thế nhà văn hay chỉ là bản sao vô hồn?
Teledyne FLIR ra mắt camera nhiệt phóng xạ: “Mắt thần” cho drone, AI và công nghiệp
Manus AI ra mắt AI Agent “siêu năng lực”: Giải quyết vấn đề phức tạp, vượt trội chatbot thông thường
Meta thành công ‘tape-out’ chip AI đầu tiên, sử dụng công nghệ TSMC
OpenAI ra mắt công cụ mới giúp doanh nghiệp tạo chatbot AI “thông minh” hơn
Google Gemini: Cuộc cách mạng AI tại nơi làm việc
Tự động hóa lịch trình với nút AI mới của Google trong Gmail
PlayStation: Sony đang phát triển nhân vật game thông minh AI
Sony mạnh tay gỡ bỏ hơn 75.000 bài hát deepfake AI
Mistral OCR: API nhận dạng ký tự quang học với độ chính xác “vượt trội”
AI “phát điên” sau khi được tinh chỉnh bằng mã lỗi, đưa ra lời khuyên bạo lực và ủng hộ phát xít
Maserati MC20 lập kỷ lục tốc độ mới với “tài xế robot” AI
Google “mạnh tay” với tìm kiếm AI bất chấp lỗi “ảo giác”

ĐĂNG KÝ NHẬN TIN
NGAY HÔM NAY
Đăng ký để nhận thông tin sớm nhất về những câu chuyện nóng hổi hiện nay trên thị trường, công nghệ được cung cấp hàng ngày.
Bằng cách nhấp vào “Đăng ký”, bạn chấp nhận Điều khoản dịch vụ và Chính sách quyền riêng tư của chúng tôi. Bạn có thể chọn không tham gia bất cứ lúc nào.
5
s
Nhận xét (0)