禁止标题页robots.txt

Aleksandar 发表于 Dev

23

亚力山大

我想禁止索引robots.txt中的header.php。档案网址：

https://example.com/header.php

但是我不确定什么是正确的：

Disallow: /header.php

要么

Disallow: header.php

怀特先生

中指定的URL路径robots.txt应始终以斜杠（即相对于根）开头。

根据Google的robots.txt规范：

如果指定了[path]值，则相对于从中提取了robots.txt文件的网站的根目录（使用相同的协议，端口号，主机和域名）可以看到。路径值必须以“ /”开头以指定根。路径区分大小写。

因此，您应该写：

Disallow: /header.php

但是，这可以防止爬网，如果链接到该URL ，也不一定可以防止编制索引。虽然，我怀疑这只是一个HTML片段（？），所以在这种情况下，应该执行阻止爬网的工作。（但是请注意，如果包含许多包含项，则最好将它们包含在子目录中，而只需阻止该子目录即可。）

上线之前，请robots.txt在Google的robots.txt测试器中测试您的文件。

本文收集自互联网，转载请注明来源。

如有侵权，请联系 [email protected] 删除。

编辑于 2021-01-22

我来说两句

0 条评论

登录后参与评论

上一篇：如何使用Scala的异常处理从JDBC连接类返回连接？

相关文章

Robots.TXT禁止语法

被robots.txt禁止：scrapy

在Robots.txt中允许和禁止

Robots.txt禁止使用特定类型的URL

如何禁止不遵守robots.txt的漫游器？

需要定位/禁止robots.txt中的子域

如何使用robots.txt文件禁止登录页面？

禁止在robots.txt中使用Umbraco imagegen.ashx，原因是图片被禁止搜索

如何使用robots.txt在服务器中禁止目录

删除后，可能会禁止robots.txt上的整个网站产生后果吗？

禁止robots.txt中的查询字符串仅包含一个网址

robots.txt - 禁止文件夹但允许文件夹内的文件

禁止在robots.txt中的特定网址中使用所有参数

robots.txt仅需要某些文件和文件夹，并且禁止所有操作

Robots.txt禁止使用正则表达式进行路径

Robots.txt：禁止重复的子目录，但允许主目录

如何使用robots.txt在Codeigniter中禁止某些控制器

禁止robots.txt中包含语言代码的子目录

Robots.txt-禁止所有页面，但允许所有子目录

robots.txt禁止在根域上使用Google Bot，但允许使用Google Image Bot？

robots.txt 允许和禁止几个页面，这对其他页面意味着什么？

robots.txt中的Noindex

Laravel中的robots.txt

抓狂并尊重robots.txt

Robots.txt：禁止显示文件夹名称，无论文件夹显示在哪个深度

为txt文件生成标题

robots.txt仅显示主页

搜索脚本会忽略robots.txt

在 Django 中更改 robots.txt

TOP 榜单

文章

热门标签

归档