我一直在尝试从数据库中抓取网站数据来构建游戏,并且经常因验证码请求而被阻止。当我检查网站的Robots.txt文件时,看到以下内容:
Disallow: /a/
Disallow: /contact-us/
这是什么意思?
根据Google文档。
一个机器人。txt文件告诉搜索引擎搜寻器该搜寻器可以或不能从您的网站请求哪些页面或文件。这主要是为了避免您的网站因请求而过载;这不是将网页拒之门外的机制。
本文收集自互联网,转载请注明来源。
如有侵权,请联系 [email protected] 删除。
我来说两句