想查询一个网站内容,却禁止右键复制内容了,如果该网站被百度等搜索引擎索引,你就可以通过快照进去,查看快照页面。复制对应的文本内容。所以很多文库内容不需要下载,不需要注册都可以找到对应的文章和好文字进行复制,找到好内容。
但是不是所有的网站都是如此慷慨,弄个快照就给你复制的。话说百度等搜索引擎禁止查看快照有没有好处,或者坏处呢?简单点说就是拒绝好质量的文字被窃取,这样做只供展示,不做其它用途。
如果yeencms真正想复制文字,那就查看代码。里面肯定有文字的,只是不太好看,需要重新编辑整理。如果禁用右键那就复制链接到相关查看源码的工具里面,站长工具就有查看链接的选项,自己去瞧瞧。
屏蔽搜索引擎快照的方法如:
目前搜索引擎的网页快照是从你的网站抓取CSS文件,如果在你的CSS文件中设置一个网页重定向,这样我们就可以来控制搜索引擎的快照指向任何一个页面!
例如,如果百度快照中缓存的文件为style.css,那么我们在服务器上编辑这个文件,在CSS文件中加入以下语句,即可控制百度缓存快照重定向,从而实现屏蔽百度网页快照内容的功能。
body{onload:expression(location.href='http://www.yeencms.com/');}
以上语句在IE浏览器下测试通过。理论上,根据这个方法,我们可以控制百度网页快照的内容重定向到任何一个我们指定的网址,甚至是第三方网站。为了实现网页的正常显示,百度快照屏蔽CSS的可能性会非常校
这个方法也可用于屏蔽百度Google等其他搜索引擎的网页快照。
如果还没有过瘾,在推荐几种百度快照屏蔽方法。让你知道原来百度快照可以看到,但是无法访问,或者跳转指定页面。那就跟着yeencms一起学习下吧:
第一种情况:屏蔽百度快照
<METANAME="ROBOTS"content="noarchive">
限制了所有搜索引擎建立你的网页快照
<METAname=Baiduspidercontent=noarchive>
只限制其中一个搜索引擎建立快照
注意:上面meta标签仅是禁止搜索引擎为你的网站建立快照,如果是要禁止搜索引擎索引你某个页面,可以使用两种方法:
1、建立“Robots.txt”屏蔽
2、使用“META标签”屏蔽
第二种情况:禁止搜索引擎抓取本页面
在网站优化过程中、有时还是会要用到禁止搜索引擎抓取某单个页面,而这种情况如果动态、一般都会使用“Robots.txt”屏蔽。
META标签最常用:
<METANAME="DESCRIPTION" CONTENT=""/>
<METANAME="KEYWORDS" content=""/>
而对于用来屏蔽搜索引擎蜘蛛或允许比较少见:
<METANAME="ROBOTS"CONTENT="NOINDEX,FOLLOW">
NAME="ROBOTS"//是泛指所有的搜索引擎,也可以特指某个搜索引擎,例如METANAME="Googlebot"、METANAME="Baiduspide"
content=“index”//部分有四个命令:index、noindex、follow、nofollow
INDEX命令:告诉搜索引擎抓取这个页面
FOLLOW命令:告诉搜索引擎可以从这个页面上找到链接,然后继续访问抓取下去。
NOINDEX命令:告诉搜索引擎不允许抓取这个页面
NOFOLLOW命令:告诉搜索引擎不允许从此页找到链接、拒绝其继续访问。
根据以上的命令,我们就有了一下的四种组合:
<METANAME="ROBOTS"CONTENT="INDEX,FOLLOW">:可以抓取本页,而且可以顺着本页继续索引别的链接;
<METANAME="ROBOTS"CONTENT="NOINDEX,FOLLOW">:不许抓取本页,但是可以顺着本页抓取索引别的链接;
<METANAME="ROBOTS"CONTENT="INDEX,NOFOLLOW">:可以抓取本页,但是不许顺着本页抓取索引别的链接;
<METANAME="ROBOTS"CONTENT="NOINDEX,NOFOLLOW">:不许抓取本页,也不许顺着本页抓取索引别的链接。
既然如此,就知道该如何做了吧,为了页面权重的集中,为什么都可以做相对应的抓取或者索引。这样也是对信息的一种保护,也是对网站链接一种更好的运用,百度等搜索引擎喜欢在你的网站上看到这些指令。