Cloudflare 发布报告指出,Perplexity AI 使用爬虫绕过网站的 no-crawl 指令( robots.txt ),通过频繁更换 User-Agent 、切换 IP 地址和 ASN ,以及冒充标准浏览器身份(如 Chrome )等方式来避开网站及 Cloudflare 的屏蔽措施,从而继续抓取和索引网站内容。

https://blog.cloudflare.com/perplexity-is-using-stealth-undeclared-crawlers-to-evade-website-no-crawl-directives/ Perplexity is using stealth, undeclared crawlers to evade website no-crawl directives
 
 
Back to Top
OKHK