Công nghệ trí tuệ nhân tạo (AI) có khả năng sáng tạo nội dung mới, nhưng cũng tiềm ẩn nhiều rủi ro như thiên vị, phân phát văn bản độc hại. Vậy làm thế nào để đảm bảo an toàn khi sử dụng chúng?

Rick Caccia, Giám đốc điều hành của WitnessAI, tin rằng điều đó hoàn toàn khả thi.
Caccia cho biết: “Bảo mật các mô hình AI là một vấn đề thực sự, đối với các nhà nghiên cứu AI thì điều này rất quan trọng, nhưng an toàn khi sử dụng lại là vấn đề khác. Tôi ví nó như một chiếc xe thể thao: sở hữu động cơ mạnh mẽ (ví dụ như mô hình AI) không giúp ích gì nếu bạn không có phanh và hệ thống lái tốt. Kiểm soát là yếu tố quan trọng không kém tốc độ.”
Các doanh nghiệp đang rất quan tâm đến những giải pháp kiểm soát này, bởi tiềm năng tăng năng suất của AI tạo sinh văn bản tuy hấp dẫn nhưng cũng đi kèm nhiều hạn chế về mặt công nghệ.
Một cuộc thăm dò của IBM cho thấy 51% giám đốc điều hành đang tuyển dụng cho các vị trí liên quan đến AI tạo sinh văn bản, những vị trí này thậm chí không tồn tại trong năm ngoái. Tuy nhiên, theo khảo sát của Riskonnect, chỉ có 9% công ty cho biết họ đã sẵn sàng để quản lý các mối đe dọa – bao gồm cả những mối đe dọa liên quan đến quyền riêng tư và sở hữu trí tuệ – phát sinh từ việc sử dụng AI tạo sinh văn bản.
Nền tảng của WitnessAI hoạt động như một trung gian, can thiệp vào tương tác giữa nhân viên và các mô hình AI tạo sinh văn bản do công ty sử dụng (không phải các mô hình được bảo vệ bằng API như GPT-4 của OpenAI, mà giống với Llama 3 của Meta). Nền tảng này sẽ áp dụng các chính sách và biện pháp bảo vệ để giảm thiểu rủi ro.
“Một trong những hứa hẹn của AI doanh nghiệp là nó giúp mở khóa và dân chủ hóa dữ liệu doanh nghiệp cho nhân viên để họ có thể làm việc tốt hơn. Nhưng việc mở khóa quá nhiều dữ liệu nhạy cảm – hoặc bị rò rỉ hoặc đánh cắp – sẽ là một vấn đề.”
WitnessAI cung cấp quyền truy cập vào một số module, mỗi module tập trung vào việc giải quyết một dạng rủi ro của AI tạo sinh văn bản. Ví dụ, một module cho phép các tổ chức triển khai các quy tắc để ngăn chặn nhân viên từ các nhóm cụ thể sử dụng các công cụ chạy bằng AI tạo sinh văn bản theo những cách không được phép (chẳng hạn như hỏi về báo cáo thu nhập trước khi phát hành hoặc dán mã nguồn nội bộ). Một module khác sẽ xóa thông tin độc quyền và nhạy cảm khỏi các yêu cầu gửi đến mô hình và triển khai các kỹ thuật để bảo vệ mô hình chống lại các cuộc tấn công có thể buộc chúng hoạt động lệch hướng.
Caccia nói: “Chúng tôi cho rằng cách tốt nhất để giúp các doanh nghiệp là xác định vấn đề theo một cách hợp lý – ví dụ như việc áp dụng AI một cách an toàn – và sau đó bán một giải pháp giải quyết vấn đề đó. Giám đốc an ninh thông tin (CISO) muốn bảo vệ doanh nghiệp và WitnessAI giúp họ thực hiện điều đó bằng cách đảm bảo bảo vệ dữ liệu, ngăn chặn việc can thiệp vào yêu cầu và thực thi các chính sách dựa trên danh tính. Giám đốc bảo mật thông tin (CPO) muốn đảm bảo rằng các quy định hiện hành – và sắp tới – được tuân thủ, và chúng tôi cung cấp cho họ khả năng giám sát và báo cáo về hoạt động và rủi ro.”
Tuy nhiên, WitnessAI cũng đặt ra một vấn đề nan giải về quyền riêng tư: Tất cả dữ liệu đều phải đi qua nền tảng của họ trước khi đến được mô hình. Mặc dù công ty minh bạch về điều này, thậm chí còn cung cấp các công cụ để theo dõi nhân viên truy cập vào các mô hình nào, các câu hỏi họ đặt ra cho mô hình và các phản hồi họ nhận được. Nhưng nó cũng có thể tạo ra những rủi ro riêng tư khác.
Ông Caccia khẳng định nền tảng của họ được thiết kế riêng biệt và mã hóa để đảm bảo dữ liệu bí mật của khách hàng không bị rò rỉ. Nền tảng này hoạt động với độ trễ tính bằng mili giây, đồng thời tích hợp sẵn tính năng phân tách theo quy định. Điều này có nghĩa là hoạt động trí tuệ nhân tạo (AI) của từng doanh nghiệp sẽ được bảo vệ riêng biệt, hoàn toàn khác biệt so với các dịch vụ phần mềm theo mô hình SaaS (phục vụ nhiều khách hàng trên cùng một nền tảng).
Ông cho biết WitnessAI tạo ra một phiên bản riêng biệt của nền tảng cho mỗi khách hàng, được mã hóa bằng khóa của riêng họ. Do đó, dữ liệu hoạt động AI của khách hàng được cô lập hoàn toàn – WitnessAI không thể truy cập được.
Tuy nhiên, đối với nhân viên lo ngại về khả năng giám sát của nền tảng WitnessAI, vấn đề phức tạp hơn. Các cuộc khảo sát cho thấy mọi người thường không thích bị theo dõi hoạt động tại nơi làm việc, bất kể lý do gì, và cho rằng điều này ảnh hưởng tiêu cực đến tinh thần làm việc. Gần 1/3 số người tham gia khảo sát của Forbes cho biết họ có thể cân nhắc nghỉ việc nếu nhà tuyển dụng theo dõi hoạt động trực tuyến và liên lạc của họ.
Mặc dù vậy, ông Caccia khẳng định sự quan tâm đến nền tảng WitnessAI vẫn mạnh mẽ, với 25 công ty đang trong giai đoạn thử nghiệm. (Dịch vụ sẽ chính thức ra mắt vào quý 3). Ngoài ra, WitnessAI đã huy động được 27,5 triệu USD từ các quỹ đầu tư mạo hiểm, thể hiện sự tin tưởng vào tiềm năng của nền tảng.
Số tiền đầu tư này sẽ được sử dụng để tăng quy mô đội ngũ của WitnessAI từ 18 người lên 40 người vào cuối năm. Mở rộng quy mô là yếu tố then chốt để WitnessAI vượt qua các đối thủ trong lĩnh vực giải pháp tuân thủ và quản trị mô hình AI mới nổi, không chỉ từ các ông lớn công nghệ như AWS, Google và Salesforce mà còn từ các startup như CalypsoAI.
Ông Caccia nói: “Chúng tôi đã lên kế hoạch hoạt động đến năm 2026 ngay cả khi không bán được sản phẩm nào. Nhưng hiện tại, lượng khách hàng tiềm năng đã gần gấp 20 lần mục tiêu doanh số của chúng tôi trong năm nay. Đây là vòng gọi vốn đầu tiên và ra mắt công chúng của chúng tôi, và việc cho phép sử dụng AI an toàn là một lĩnh vực mới, tất cả các tính năng của chúng tôi đều được phát triển hướng đến thị trường mới này.”
Tin tài trợ
- Vũ trụ
Premium
Hubble của NASA và ESA công bố hình ảnh ngoạn mục về lõi thiên hà Xì gà
Bức ảnh mới nhất từ Kính viễn vọng không gian Hubble của NASA và ESA vừa hé lộ những chi tiết chưa từng thấy về thiên hà Messier 82 (M82), nơi hàng triệu ngôi sao rực rỡ đang ẩn mình sau những đám mây bụi và khí với hình thù độc đáo. Bức ảnh mang […] - Thủ thuật
Premium
Lý do màn hình nhấp nháy khi chơi game và cách khắc phục
Hiện tượng màn hình nhấp nháy khi chơi game đã trở thành một nỗi ám ảnh đối với nhiều game thủ, gây khó chịu và ảnh hưởng đáng kể đến trải nghiệm. Theo các chuyên gia công nghệ, nguyên nhân chính của vấn đề này có thể nằm ở chính công nghệ đồng bộ hóa […] - Mobile
Premium
iPhone 17 Pro và iPhone Air vừa ra mắt đã dính lỗi trầy xước
Ngay khi vừa được bày bán tại các Apple Store trên toàn cầu, bộ đôi iPhone 17 Pro và iPhone Air – hai mẫu máy đang nhận được sự quan tâm đặc biệt của cộng đồng công nghệ – đã bắt đầu ghi nhận những phản ánh đầu tiên về hiện tượng trầy xước. Điều […] - Khám phá
Premium
Jimmy Kimmel bị đình chỉ: ‘Văn hóa tẩy chay’ hay áp lực chính trị?
Mới đây, đài truyền hình ABC, thuộc sở hữu của Disney, đã đột ngột đình chỉ chương trình nổi tiếng Jimmy Kimmel Live. Quyết định này được đưa ra ngay sau khi nam MC có một bình luận gây tranh cãi về vụ án mạng liên quan đến Charlie Kirk. Sự việc nhanh chóng trở […]
Bài viết liên quan
Thiết bị ‘siêu máy tính AI’ cá nhân của Nvidia sẵn sàng ra mắt thị trường vào 15/10
California thiết lập khung pháp lý cho các ứng dụng chatbot AI
Fan hâm mộ Taylor Swift phản ứng trước nghi vấn cô dùng hình ảnh tạo bởi AI trong chiến dịch quảng bá
Nền tảng ChatGPT của OpenAI chính thức trình làng tính năng tích hợp đa ứng dụng
Nội bộ OpenAI đang đối mặt với những thách thức từ chiến lược truyền thông xã hội mới của công ty
Toyota bổ sung khoản vốn 1,5 tỷ USD, khẳng định niềm tin vào các dự án startup công nghệ
OpenAI công bố mô hình Sora 2 và ứng dụng chia sẻ video, mục tiêu cạnh tranh với Tiktok
Thông tin sai lệch của nền tảng Deepseek AI về chủ quyền biển đảo Việt Nam gây tranh cãi
DeepSeek: Từ A đến Z về ứng dụng trò chuyện AI được giới công nghệ quan tâm
Robot siêu nhỏ “đi bộ trên nước” lấy cảm hứng từ côn trùng nước
Microsoft ra động thái hạn chế quân đội Israel sử dụng dịch vụ đám mây và AI
Insta360 Wave ra mắt: Loa hội nghị AI có 8 micro, tự động tóm tắt cuộc họp và pin 12 giờ
Elon Musk ‘hạ giá’ Grok, mời chào Chính phủ Liên bang Mỹ với giá ‘rẻ như cho’
Databricks chi 100 triệu USD, tích hợp mô hình OpenAI vào sản phẩm để thúc đẩy doanh nghiệp ứng dụng
Spotify ban hành quy định mới về dán nhãn âm nhạc do AI sáng tác
Google Cloud đẩy mạnh chiến lược, không ngừng mở rộng phạm vi hoạt động
Gemini 2.5 Deep Think giành huy chương vàng tại ICPC 2025
Việt Nam đứng trước thách thức và cơ hội lớn trong làn sóng phát triển AI
Tham vọng của Thượng nghị sĩ Scott Wiener: Buộc Big Tech tiết lộ rủi ro từ trí tuệ nhân tạo

ĐĂNG KÝ NHẬN TIN
NGAY HÔM NAY
Đăng ký để nhận thông tin sớm nhất về những câu chuyện nóng hổi hiện nay trên thị trường, công nghệ được cung cấp hàng ngày.
Bằng cách nhấp vào “Đăng ký”, bạn chấp nhận Điều khoản dịch vụ và Chính sách quyền riêng tư của chúng tôi. Bạn có thể chọn không tham gia bất cứ lúc nào.


Nhận xét (0)