利用 Html 元标记控制搜索引擎蜘蛛

摘要：快照不被百度缓存： meta name = Baiduspider content = noarchive

所有搜索引擎，抓取这个页面、爬行链接、禁止快照： meta name = robots content = index,follow,noarchive ---------------------------------------------------------- meta name = robo...

快照不被百度缓存：

<metaname="Baiduspider"content="noarchive">

所有搜索引擎，抓取这个页面、爬行链接、禁止快照：

<metaname="robots"content="index,follow,noarchive">

----------------------------------------------------------

<metaname="robots"content="noarchive">

以上的一段代码限制了所有的搜索引擎建立你的网页快照。如果我们需要仅仅限制一个搜索引擎建立快照的话，就可以像如下这样去写

<metaname="Baiduspider"content="noarchive">

需要注意的是，这样的标记仅仅是禁止搜索引擎为你的网站建立快照，如果你要禁止搜索引擎索引你的这个页面的话，请参照后面的办法。

第二种情况：禁止搜索引擎抓取本页面。

在SEO中，禁止搜索引擎抓取本页面或者是允许搜索引擎抓取本页面是经常会用到的。因此我们需要对这一部分重点做一次讨论。

为了让搜索引擎禁止抓取本页面，我们一般的做法是在页面的元标记中加入如下的代码：

<METANAME="ROBOTS"CONTENT="NOINDEX,FOLLOW">

在这里，META NAME="ROBOTS"是泛指所有的搜索引擎的，在这里我们也可以特指某个搜索引擎，例如META NAME="Googlebot"、META NAME="Baiduspide"等。content部分有四个命令：index、noindex、follow、nofollow，命令间以英文的 “,”分隔。

INDEX 命令：告诉搜索引擎抓取这个页面

FOLLOW 命令：告诉搜索引擎可以从这个页面上找到链接，然后继续访问抓取下去。

NOINDEX 命令：告诉搜索引擎不允许抓取这个页面

NOFOLLOW 命令：告诉搜索引擎不允许从此页找到链接、拒绝其继续访问。

根据以上的命令，我们就有了一下的四种组合

<METANAME="ROBOTS"CONTENT="INDEX,FOLLOW">：可以抓取本页，而且可以顺着本页继续索引别的链接 

<METANAME="ROBOTS"CONTENT="NOINDEX,FOLLOW">：不许抓取本页，但是可以顺着本页抓取索引别的链接 

<METANAME="ROBOTS"CONTENT="INDEX,NOFOLLOW">：可以抓取本页，但是不许顺着本页抓取索引别的链接 

<METANAME="ROBOTS"CONTENT="NOINDEX,NOFOLLOW">：不许抓取本页，也不许顺着本页抓取索引别的链接

这里需要注意的是，不可把两个对立的反义词写到一起，例如

<METANAME="ROBOTS"CONTENT="INDEX,NOINDEX">

或者直接同时写上两句

<METANAME="ROBOTS"CONTENT="INDEX,FOLLOW"><METANAME="ROBOTS"CONTENT="NOINDEX,FOLLOW">

这里有一个简便的写法，如果是

<METANAME="ROBOTS"CONTENT="INDEX,FOLLOW">

的形式的话，可以写成：

<METANAME="ROBOTS"CONTENT="ALL">

如果是

<METANAME="ROBOTS"CONTENT="NOINDEX,NOFOLLOW">

的形式的话，可以写成：

<METANAME="ROBOTS"CONTENT="NONE">

当然，我们也可以把禁止建立快照和对于搜索引擎的命令写到一个命令元标记中。从上面的文章中我们得知，禁止建立网页快照的命令是noarchive，那么我们就可以写成如下的形式：

<METANAME="ROBOTS"CONTENT="INDEX,FOLLOW,noarchive">

如果是对于单独的某个搜索引擎不允许建立快照，例如百度，我们就可以写成：

<METANAME=" Baiduspider"CONTENT="INDEX,FOLLOW,noarchive">

如果在元标记中不屑关于蜘蛛的命令，那么默认的命令即为如下

<METANAME="ROBOTS"CONTENT="INDEX,FOLLOW, archive">

因此，如果我们对于这一部分把握不准的话，可以直接写上上面的这一行命令，或者是直接留空。

在SEO中，对于蜘蛛的控制是非常重要的一部分内容，所以希望各位看官准确把握这部分的内容。

利用 Html 元标记控制搜索引擎蜘蛛的更多相关文章

机器学习实战 - 读书笔记(07) - 利用AdaBoost元算法提高分类性能
前言最近在看Peter Harrington写的"机器学习实战",这是我的学习笔记,这次是第7章 - 利用AdaBoost元算法提高分类性能. 核心思想在使用某个特定的算法是, ...
Web前端开发如何利用css样式来控制Html中的h1/h2/h3标签不换行
H1/H2/H3/H4标题标签常常使用在一个网页中唯一标题.重要栏目.重要标题等情形下. H1在一个网页中最好只使用一次,如对一个网页唯一标题使用.H2.H3.H4标签则可以在一个网页中多次出现, ...
python利用Trie(前缀树)实现搜索引擎中关键字输入提示（学习Hash Trie和Double-array Trie）
python利用Trie(前缀树)实现搜索引擎中关键字输入提示(学习Hash Trie和Double-array Trie) 主要包括两部分内容:(1)利用python中的dict实现Trie:(2) ...
【转载】机器学习实战 - 读书笔记(07) - 利用AdaBoost元算法提高分类性能
原文地址: https://www.cnblogs.com/steven-yang/p/5686473.html ------------------------------------------- ...
利用ManualResetEvent来来控制异步调用的打印的线程的暂停和恢复(转)
利用ManualResetEvent来来控制异步调用的打印的线程的暂停和恢复打印过程可能很长,这时候有可能需要暂停下来做一些事情,然后回来继续接着打印打印过程中有2个线程:一个是程序运行的主线程, ...
利用Nutch和Tomcat构建搜索引擎
利用Nutch和Tomcat构建搜索引擎 1.安装环境及软件版本介绍本教程是在Linux Ubuntu 12.04 desktop i386操作系统上搭建,结合使用了Nutch-1.2和Apache ...
Qt中利用QTime类来控制时间,这里简单介绍一下QTime的成员函数的用法:
Qt中利用QTime类来控制时间,这里简单介绍一下QTime的成员函数的用法: ------------------------------------------------------------ ...
Day 5-8 自定义元类控制类的实例化行为
__call__方法: 对象后面加括号,触发执行. 注:构造方法的执行是由创建对象触发的,即:对象 = 类名() :而对于 __call__ 方法的执行是由对象后加括号触发的,即:对象() 或者类( ...
利用DNS进行命令控制和搭建隧道
目录利用DNS进行命令控制(DNS-Shell) 利用DNS搭建隧道利用DNS进行命令控制(DNS-Shell) DNS-Shell是一款通过DNS信道实现交互式Shell的强大工具,该工具的服务 ...

随机推荐

浅谈Java五大设计原则之责任链模式
首先我们得先定义一个责任链模式: 责任链模式是一种线性执行流程,多个对象都有机会去执行同一个任务,只是在执行过程中, 由于执行的权利和范围不一样,那么当自己不能处理此任务时,就必须将这个任务抛给下一个 ...
Mac wifi已打开但尚未连接到网络
把网络偏好设置里面的询问新网络关闭了然后重启电脑试一下应该就可以了
【代码笔记】iOS-首页3张图片变化
一,效果图. 二,工程图. 三,代码. RootViewController.h #import <UIKit/UIKit.h> @interface RootViewController ...
【原】Mac下统计任意文件夹中代码行数的工具——cloc
这里介绍一个Mac系统统计代码行数的工具cloc. 1.首先,安装homebrew,已安装的请跳过. 打开终端工具Terminal,输入下列命令.过程中会让你按RETURN键以及输入mac桌面密码,按 ...
(视频)《快速创建网站》 4.2 完结篇 – 应用运营vs.发射卫星，遥测(Telemetry) 技术
本文是<快速创建网站>系列的第10篇(完结篇),如果你还没有看过之前的内容,建议你点击以下目录中的章节先阅读其他内容再回到本文.访问本系列目录,请点击:http://devopshub.c ...
FreeMarker 日期转换
${parameters.fieldDate?date} //标准日期转日期字符串 ${parameters.fie ...
SQL Server 2012实施与管理实战指南(笔记)——Ch6连接的建立和问题排查
6.连接的建立和问题排查会话的建立分成2个部分: 1.连接,即找到这个实例 2.认证,告诉sql server谁要连接目录 6.连接的建立和问题排查 6.1协议选择和别名 6.1.1 服务器网络配 ...
Mina 快速入门
Mina是什么 Mina是一个基于NIO的网络框架,使用它编写程序时,可以专注于业务处理,而不用过于关心IO操作.不论应用程序采用什么协议(TCP.UDP)或者其它的,Mina提供了一套公用的接口,来 ...
0013 Java学习笔记-面向对象-static、静态变量、静态方法、静态块、单例类
static可以修饰哪些成员成员变量---可以修饰构造方法---不可以方法---可以修饰初始化块---可以修饰内部类(包括接口.枚举)---可以修饰总的来说:静态成员不能访问非静态成员静 ...
支付宝APP支付开发- IOException : DerInputStream.getLength(): lengthTag=127, too big.
支付宝APP支付Java开发报错: IOException : DerInputStream.getLength(): lengthTag=127, too big. 后来排查是因为没有设置私钥.

利用 Html 元标记控制搜索引擎蜘蛛

利用 Html 元标记控制搜索引擎蜘蛛的更多相关文章

随机推荐

热门专题