如果你不想某个网页出现在 Google 搜索结果中,你可以在该网页的 HTML 代码中添加 noindex 元标记,或在 HTTP 响应中返回 noindex 标头。当 Googlebot 下次抓取该网页并发现该标记或标头时,就会完全阻止该网页出现在 Google 搜索结果中,不论是否有其他网站链接到该网页。
重要提示:为让 noindex 指令生效,网页不得被 robots.txt 文件屏蔽,并且必须能被抓取工具访问。如果该网页被 robots.txt 文件屏蔽或抓取工具无法访问该网页,那么抓取工具将永远无法看到 noindex 指令,因此该网页可能仍会显示在搜索结果中,例如,如果有其他网页链接到该网页的话。
推荐阅读:谷歌noindex robots 规则
如何实施 noindex?
方法有两种:一种是作为元标记(<meta> 标记)实施,另一种是作为 HTTP 响应标头实施。这两种方法的效果相同,从中选择更方便您网站采用的那一种方法即可。
<meta> 标记
若想阻止大部分搜索引擎网页抓取工具将您网站中的某个网页编入索引,请将以下元标记放入该网页的 <head> 部分中:
<meta name="robots" content="noindex">
若想仅阻止 Google 网页抓取工具将网页编入索引,请放入以下元标记:
<meta name="googlebot" content="noindex">
推荐阅读:详细了解 noindex 元标记
HTTP 响应标头
除了使用元标记,您还可在响应中返回一个值为 noindex 或 none 的 X-Robots-Tag 标头。下面是一个 HTTP 响应示例,它含有一个 X-Robots-Tag,用来指示抓取工具不要将某一网页编入索引:
HTTP/1.1 200 OK
(…)
X-Robots-Tag: noindex
(…)
推荐阅读:详细了解 noindex 响应标头
总结
总而言之,不想让某些页面谷歌收录,不想出现在搜索结果里(比如登录页等),一定要用noindex,不要用robots.txt,也不要用nofollow。
还没有评论,来说两句吧...