Cloudflare giăng ‘mê cung AI’, bẫy các bot thu thập dữ liệu web
16:42 29/03/2025
3 phút đọc
Cloudflare, một trong những công ty cơ sở hạ tầng internet mạng lớn nhất thế giới, vừa công bố AI Labyrinth, một công cụ mới để chống lại các bot thu thập dữ liệu web, thường xuyên “cào” dữ liệu trang web để huấn luyện AI mà không được phép. Trong một bài đăng trên blog, công ty cho biết khi phát hiện “hành vi bot không phù hợp”, công cụ miễn phí tùy chọn này sẽ dụ các trình thu thập thông tin theo một chuỗi liên kết đến các trang mồi được tạo bằng AI, nhằm “làm chậm, gây nhầm lẫn và lãng phí tài nguyên” của những kẻ hành động không thiện chí.

Từ lâu, các trang web đã sử dụng phương pháp “tự giác” thông qua tệp robots.txt, một tệp văn bản cho phép hoặc từ chối quyền thu thập dữ liệu cho các trình thu thập thông tin. Tuy nhiên, các công ty AI, kể cả những công ty nổi tiếng như Anthropic và Perplexity AI, bị cáo buộc là đã phớt lờ tệp này. Cloudflare cho biết họ thấy hơn 50 tỷ yêu cầu trình thu thập dữ liệu web mỗi ngày và mặc dù họ có các công cụ để phát hiện và chặn những yêu cầu độc hại, điều này thường khiến kẻ tấn công chuyển sang các chiến thuật khác trong “cuộc chạy đua vũ trang không bao giờ kết thúc”.
Thay vì chặn bot, Cloudflare cho biết AI Labyrinth phản công bằng cách khiến chúng xử lý dữ liệu không liên quan đến dữ liệu thực tế của trang web. Công ty cho biết nó cũng hoạt động như “một bẫy mật ong thế hệ tiếp theo”, thu hút các trình thu thập dữ liệu AI tiếp tục theo dõi các liên kết đến các trang giả ngày càng sâu hơn, trong khi người bình thường sẽ không làm vậy. Điều này giúp dễ dàng nhận diện dấu vân tay của các bot độc hại để đưa vào danh sách các tác nhân xấu của Cloudflare, cũng như xác định “các mẫu và chữ ký bot mới” mà họ không thể phát hiện được theo cách khác. Theo bài đăng, các liên kết này không hiển thị cho khách truy cập là người dùng.
Bạn có thể đọc thêm về cách AI Labyrinth hoạt động trên blog của Cloudflare, nhưng đây là một số chi tiết khác từ bài đăng:
“Chúng tôi nhận thấy rằng việc tạo ra một tập hợp các chủ đề đa dạng trước, sau đó tạo nội dung cho từng chủ đề, mang lại kết quả đa dạng và thuyết phục hơn. Điều quan trọng đối với chúng tôi là không tạo ra nội dung không chính xác góp phần vào việc lan truyền thông tin sai lệch trên Internet, vì vậy nội dung chúng tôi tạo ra là có thật và liên quan đến các sự kiện khoa học, chỉ là không liên quan hoặc độc quyền đối với trang web đang được thu thập dữ liệu.”
Quản trị viên trang web có thể chọn sử dụng AI Labyrinth bằng cách điều hướng đến phần Quản lý Bot trong cài đặt bảng điều khiển Cloudflare của trang web của họ và bật nó lên. Công ty cho biết đây “chỉ là lần lặp lại đầu tiên của việc sử dụng AI tạo sinh để ngăn chặn bot”. Họ dự định tạo ra “toàn bộ mạng lưới các URL được liên kết” mà các bot kết thúc trong đó sẽ khó nhận ra là giả. Như Ars Technica lưu ý, AI Labyrinth nghe giống như Nepenthes, một công cụ được thiết kế để loại bỏ các trình thu thập dữ liệu “trong nhiều tháng” trong một địa ngục dữ liệu rác được tạo bằng AI.
Cloudflare đang sử dụng AI để chống lại AI, tạo ra một “mê cung” thông tin giả để làm chậm và đánh lừa các bot thu thập dữ liệu trái phép. Công cụ này không chỉ bảo vệ dữ liệu trang web mà còn giúp Cloudflare xác định và chặn các bot độc hại một cách hiệu quả hơn. Đây là một bước tiến quan trọng trong cuộc chiến chống lại việc lạm dụng dữ liệu web cho mục đích huấn luyện AI.
Từ khoá:
Tin tài trợ
- Vũ trụ
Premium
Hubble của NASA và ESA công bố hình ảnh ngoạn mục về lõi thiên hà Xì gà
Bức ảnh mới nhất từ Kính viễn vọng không gian Hubble của NASA và ESA vừa hé lộ những chi tiết chưa từng thấy về thiên hà Messier 82 (M82), nơi hàng triệu ngôi sao rực rỡ đang ẩn mình sau những đám mây bụi và khí với hình thù độc đáo. Bức ảnh mang […] - Thủ thuật
Premium
Lý do màn hình nhấp nháy khi chơi game và cách khắc phục
Hiện tượng màn hình nhấp nháy khi chơi game đã trở thành một nỗi ám ảnh đối với nhiều game thủ, gây khó chịu và ảnh hưởng đáng kể đến trải nghiệm. Theo các chuyên gia công nghệ, nguyên nhân chính của vấn đề này có thể nằm ở chính công nghệ đồng bộ hóa […] - Mobile
Premium
iPhone 17 Pro và iPhone Air vừa ra mắt đã dính lỗi trầy xước
Ngay khi vừa được bày bán tại các Apple Store trên toàn cầu, bộ đôi iPhone 17 Pro và iPhone Air – hai mẫu máy đang nhận được sự quan tâm đặc biệt của cộng đồng công nghệ – đã bắt đầu ghi nhận những phản ánh đầu tiên về hiện tượng trầy xước. Điều […] - Khám phá
Premium
Jimmy Kimmel bị đình chỉ: ‘Văn hóa tẩy chay’ hay áp lực chính trị?
Mới đây, đài truyền hình ABC, thuộc sở hữu của Disney, đã đột ngột đình chỉ chương trình nổi tiếng Jimmy Kimmel Live. Quyết định này được đưa ra ngay sau khi nam MC có một bình luận gây tranh cãi về vụ án mạng liên quan đến Charlie Kirk. Sự việc nhanh chóng trở […]
Bài viết liên quan
Hubble của NASA và ESA công bố hình ảnh ngoạn mục về lõi thiên hà Xì gà
Lý do màn hình nhấp nháy khi chơi game và cách khắc phục
Jimmy Kimmel bị đình chỉ: ‘Văn hóa tẩy chay’ hay áp lực chính trị?
Pinterest bị sập toàn cầu, nghi vấn do sự cố từ Amazon Web Services
XP-Pen Artist Ultra 16: Bảng vẽ 4K AMOLED cho dân thiết kế chuyên nghiệp
Robot siêu nhỏ “đi bộ trên nước” lấy cảm hứng từ côn trùng nước
Coros Apex 4: Đối thủ mới của Garmin trong thế giới đồng hồ thể thao GPS?
Vision Mini: Kính “xem TV” di động với màn hình 3.8K, hỗ trợ người cận thị nặng
Asus TUF Gaming A16 (2025): Đã đến lúc đáng mua thật sự
TASCAM FR-AV4: Cỗ máy ghi âm 4 kênh dành cho phim trường, “chống peak” không cần chỉnh gain
FiiO Snowsky Tiny: DAC nhỏ gọn bằng ngón tay, phát nhạc Hi-Res, sạc nhanh
FiiO FT13: Khi gỗ quý, sợi carbon và âm nhạc Hi-Res gặp nhau trong một kiệt tác tai nghe
Camera siêu phổ thu nhỏ: Khi điện thoại thông minh “nhìn” được nhiều màu hơn cả mắt người
Oppo Find X9/X9 Pro lộ diện: Thiết kế giống OnePlus 15, xác nhận dùng Dimensity 9500
Hisense ra mắt màn hình gaming G7 Ultra: Mini LED 4K, 2.000 nits
Mini-PC D12 Plus ra mắt toàn cầu: Trang bị chip AMD Krackan/Strix Point, có cổng OCuLink
Nubia Z80 Ultra tiếp tục lộ diện chi tiết: Camera ẩn dưới màn hình, pin 7.100 mAh
GameSir hé lộ tay cầm di động phong cách Game Boy tại Tokyo Game Show 2025
Xiaomi ra mắt Sound 2 Max: Loa flagship công suất 100W, vỏ kim loại và hỗ trợ âm thanh vòm

ĐĂNG KÝ NHẬN TIN
NGAY HÔM NAY
Đăng ký để nhận thông tin sớm nhất về những câu chuyện nóng hổi hiện nay trên thị trường, công nghệ được cung cấp hàng ngày.
Bằng cách nhấp vào “Đăng ký”, bạn chấp nhận Điều khoản dịch vụ và Chính sách quyền riêng tư của chúng tôi. Bạn có thể chọn không tham gia bất cứ lúc nào.


Nhận xét (0)