Cloudflare giăng ‘mê cung AI’, bẫy các bot thu thập dữ liệu web
16:42 29/03/2025
3 phút đọc
Cloudflare, một trong những công ty cơ sở hạ tầng internet mạng lớn nhất thế giới, vừa công bố AI Labyrinth, một công cụ mới để chống lại các bot thu thập dữ liệu web, thường xuyên “cào” dữ liệu trang web để huấn luyện AI mà không được phép. Trong một bài đăng trên blog, công ty cho biết khi phát hiện “hành vi bot không phù hợp”, công cụ miễn phí tùy chọn này sẽ dụ các trình thu thập thông tin theo một chuỗi liên kết đến các trang mồi được tạo bằng AI, nhằm “làm chậm, gây nhầm lẫn và lãng phí tài nguyên” của những kẻ hành động không thiện chí.
Từ lâu, các trang web đã sử dụng phương pháp “tự giác” thông qua tệp robots.txt, một tệp văn bản cho phép hoặc từ chối quyền thu thập dữ liệu cho các trình thu thập thông tin. Tuy nhiên, các công ty AI, kể cả những công ty nổi tiếng như Anthropic và Perplexity AI, bị cáo buộc là đã phớt lờ tệp này. Cloudflare cho biết họ thấy hơn 50 tỷ yêu cầu trình thu thập dữ liệu web mỗi ngày và mặc dù họ có các công cụ để phát hiện và chặn những yêu cầu độc hại, điều này thường khiến kẻ tấn công chuyển sang các chiến thuật khác trong “cuộc chạy đua vũ trang không bao giờ kết thúc”.
Thay vì chặn bot, Cloudflare cho biết AI Labyrinth phản công bằng cách khiến chúng xử lý dữ liệu không liên quan đến dữ liệu thực tế của trang web. Công ty cho biết nó cũng hoạt động như “một bẫy mật ong thế hệ tiếp theo”, thu hút các trình thu thập dữ liệu AI tiếp tục theo dõi các liên kết đến các trang giả ngày càng sâu hơn, trong khi người bình thường sẽ không làm vậy. Điều này giúp dễ dàng nhận diện dấu vân tay của các bot độc hại để đưa vào danh sách các tác nhân xấu của Cloudflare, cũng như xác định “các mẫu và chữ ký bot mới” mà họ không thể phát hiện được theo cách khác. Theo bài đăng, các liên kết này không hiển thị cho khách truy cập là người dùng.
Bạn có thể đọc thêm về cách AI Labyrinth hoạt động trên blog của Cloudflare, nhưng đây là một số chi tiết khác từ bài đăng:
“Chúng tôi nhận thấy rằng việc tạo ra một tập hợp các chủ đề đa dạng trước, sau đó tạo nội dung cho từng chủ đề, mang lại kết quả đa dạng và thuyết phục hơn. Điều quan trọng đối với chúng tôi là không tạo ra nội dung không chính xác góp phần vào việc lan truyền thông tin sai lệch trên Internet, vì vậy nội dung chúng tôi tạo ra là có thật và liên quan đến các sự kiện khoa học, chỉ là không liên quan hoặc độc quyền đối với trang web đang được thu thập dữ liệu.”
Quản trị viên trang web có thể chọn sử dụng AI Labyrinth bằng cách điều hướng đến phần Quản lý Bot trong cài đặt bảng điều khiển Cloudflare của trang web của họ và bật nó lên. Công ty cho biết đây “chỉ là lần lặp lại đầu tiên của việc sử dụng AI tạo sinh để ngăn chặn bot”. Họ dự định tạo ra “toàn bộ mạng lưới các URL được liên kết” mà các bot kết thúc trong đó sẽ khó nhận ra là giả. Như Ars Technica lưu ý, AI Labyrinth nghe giống như Nepenthes, một công cụ được thiết kế để loại bỏ các trình thu thập dữ liệu “trong nhiều tháng” trong một địa ngục dữ liệu rác được tạo bằng AI.
Cloudflare đang sử dụng AI để chống lại AI, tạo ra một “mê cung” thông tin giả để làm chậm và đánh lừa các bot thu thập dữ liệu trái phép. Công cụ này không chỉ bảo vệ dữ liệu trang web mà còn giúp Cloudflare xác định và chặn các bot độc hại một cách hiệu quả hơn. Đây là một bước tiến quan trọng trong cuộc chiến chống lại việc lạm dụng dữ liệu web cho mục đích huấn luyện AI.
Từ khoá:

Tin tài trợ
-
Tài trợ
Casio ra mắt bộ đôi piano điện Celviano: Sang trọng, hiện đại
Casio ra mắt bộ đôi piano điện Celviano: Sang trọng, hiện đạiCasio America, Inc. vừa công bố mở rộng dòng sản phẩm đàn piano điện với hai model mới thuộc dòng Celviano: AP-300 và AP-S200. Cả hai đều được “ưu ái” gọi là “những cây đàn piano hoàn hảo cho người mới bắt đầu”. Thiết kế “sang chảnh”, tính năng hiện đại AP-300 và AP-S200 đều […]
Bài viết liên quan
Casio ra mắt bộ đôi piano điện Celviano: Sang trọng, hiện đại
Casio ra mắt bộ đôi piano điện Celviano: Sang trọng, hiện đại
Kidwants KN1: Mini PC “biến hình” thành chuột, tiện lợi bất ngờ
Kidwants KN1: Mini PC “biến hình” thành chuột, tiện lợi bất ngờ
Pixy Mini Pro: Nâng tầm trải nghiệm sạc pin với thiết kế siêu tiện lợi
Pixy Mini Pro: Nâng tầm trải nghiệm sạc pin với thiết kế siêu tiện lợi
CapacMouse Pro: Chuột không dây nhỏ như chìa khóa xe hơi
CapacMouse Pro: Chuột không dây nhỏ như chìa khóa xe hơi
Microplastic trong não người: Phát hiện chấn động về tác động của ô nhiễm nhựa
Microplastic trong não người: Phát hiện chấn động về tác động của ô nhiễm nhựa
Thiết bị đo đường huyết không xâm lấn: Bước đột phá mới cho bệnh nhân tiểu đường
Thiết bị đo đường huyết không xâm lấn: Bước đột phá mới cho bệnh nhân tiểu đường
BYD: Pin thể rắn sẽ được trình làng vào năm 2027, “phổ cập” sau năm 2030
BYD: Pin thể rắn sẽ được trình làng vào năm 2027, “phổ cập” sau năm 2030
Xiaomi SU7 Ultra: Sedan điện 1.526 mã lực đánh bại Tesla Model S Plaid
Xiaomi SU7 Ultra: Sedan điện 1.526 mã lực đánh bại Tesla Model S Plaid
TL-WR3002X: Router Wi-Fi 6 di động, tốc độ ‘khủng’ từ TP-Link
TL-WR3002X: Router Wi-Fi 6 di động, tốc độ ‘khủng’ từ TP-Link
Xpeng G6 2025: SUV điện nâng cấp mạnh mẽ, sạc siêu nhanh chỉ 12 phút
Xpeng G6 2025: SUV điện nâng cấp mạnh mẽ, sạc siêu nhanh chỉ 12 phút
Ngân hàng Trung ương Hàn Quốc bác bỏ khả năng đưa Bitcoin vào dự trữ ngoại hối
Ngân hàng Trung ương Hàn Quốc bác bỏ khả năng đưa Bitcoin vào dự trữ ngoại hối
Gigabyte MO27U2: Màn hình 27 inch 4K dành cho game thủ, tích hợp công nghệ OLED kép
Gigabyte MO27U2: Màn hình 27 inch 4K dành cho game thủ, tích hợp công nghệ OLED kép
LG Display sản xuất hàng loạt tấm nền OLED 5K2K cho game thủ, chế độ 330Hz siêu mượt
LG Display sản xuất hàng loạt tấm nền OLED 5K2K cho game thủ, chế độ 330Hz siêu mượt
MyMini: Máy chơi game cầm tay hoài cổ giá rẻ, hỗ trợ giả lập N64
MyMini: Máy chơi game cầm tay hoài cổ giá rẻ, hỗ trợ giả lập N64
ViewSonic ColorPro VP2788-5K: Màn hình 5K giá mềm cạnh tranh Apple Studio Display
ViewSonic ColorPro VP2788-5K: Màn hình 5K giá mềm cạnh tranh Apple Studio Display
Teac ra mắt mâm đĩa than TN-180BT với kết nối Bluetooth: Trải nghiệm hoài cổ nhưng tiện lợi hơn
Teac ra mắt mâm đĩa than TN-180BT với kết nối Bluetooth: Trải nghiệm hoài cổ nhưng tiện lợi hơn
iRobot ra mắt loạt Roomba mới: Nỗ lực giành lại ngôi vương giữa cạnh tranh khốc liệt
iRobot ra mắt loạt Roomba mới: Nỗ lực giành lại ngôi vương giữa cạnh tranh khốc liệt
Seagate x Genshin Impact: Ra mắt SSD di động phiên bản đặc biệt 1TB
Seagate x Genshin Impact: Ra mắt SSD di động phiên bản đặc biệt 1TB
Thị trường tiền mã hóa khởi sắc: BNB, Cronos và ZetaChain có gì đáng chú ý?
Thị trường tiền mã hóa khởi sắc: BNB, Cronos và ZetaChain có gì đáng chú ý?

ĐĂNG KÝ NHẬN TIN
NGAY HÔM NAY
Đăng ký để nhận thông tin sớm nhất về những câu chuyện nóng hổi hiện nay trên thị trường, công nghệ được cung cấp hàng ngày.
Bằng cách nhấp vào “Đăng ký”, bạn chấp nhận Điều khoản dịch vụ và Chính sách quyền riêng tư của chúng tôi. Bạn có thể chọn không tham gia bất cứ lúc nào.
5
s
Nhận xét (0)