正在阅读:

分析百度蜘蛛工作原理,有效提高网站收录的思维

2,993

分析百度蜘蛛工作原理,有效提高网站收录的思维

如何提高网站收录?首先要熟悉Spider的脾气,搜索引擎用来爬行和访问页面的程序被称为蜘蛛(spider),也叫机器人(bot)。蜘蛛其实就是搜索引擎的下属,辛勤的工作者。搜索引擎命令它到互联网上浏览网页,每天奔波在各大网站页面之中,从而得到互联网的所有数据,然后把这些数据存到百度搜索引擎的数据库中。

浅析百度蜘蛛工作原理

Spider抓取系统是搜索引擎数据来源的重要保证,如果把web理解为一个有向图,那么spider的工作过程可以认为是对这个有向图的遍历。从一些重要的种子URL开始,通过页面上的超链接关系,不断的发现新URL并抓取,尽最大可能抓取到更多的有价值网页。对于类似百度这样的大型spider系统,因为每时每刻都存在网页被修改、删除或出现新的超链接的可能,因此,还要对spider过去抓取过的页面保持更新,维护一个URL库和页面库。

Spider和人一样,会有第一印象。它会提取你网站是做什么的,提取你网站的题目,提取你的排版,若是你做的这些布局不太合理,会导致你网站的收录时间要比其他人多1-2周,甚至更久。如果当它已经爬取过你的网站了,就不要再改动了,结局并不是你所能承担的后果。要改的话最好在蜘蛛没来过你网站之前就改好,这就得在网站上线之前就策划好。

随着搜索引擎的不断更新,百度在数据库中就会降低那些陈旧信息的权重,提高那些最新的信息。这也培养了蜘蛛的喜新厌旧,对于"新鲜的血液",总会乐此不疲的去抓取,若是你天天都给它喂食"新鲜的血液",那么它来你网站的次数就越多,对你的网站就更加青睐。

人越多的网址Spider越喜欢去,人们都喜欢的网站,必有其值得欣赏的地方。这也导致了很多大论坛的权重愈来愈高,尤其是一些视频网站,优酷、土豆之类的。因为天天看的人数很多,点击量大并且跳出率很低。

还有很多蜘蛛不太喜欢的站点,像网站栏目不清晰、有大量js代码的、有flash的、有跳转的等等这些类型的网站。蜘蛛看不懂,收录的质量就会降低很多。研究好蜘蛛的一些特征,观察好他的动向对网站绝对有意想不到的收获。在<如何分析SEO网站优化数据,都需要分析哪些数据?>文章中我也提到让大家多看网站日志。

有效提高网站收录:增加多入口与锚链接

一般在网站的最初阶段,由于网站的权重比较低甚至没有权重。这时候搜索引擎蜘蛛不可能无限去挖掘你网站上的东西。一般来说你需要尽量把最新的东西放到首页、栏目以及各个重要页面之上,使你的文章增加更多的入口,Spider看到了这些更新的东西就会去看内容是否吸引它,另外文章内容也可以在相应的长尾关键词加上描连接。总的来说合理的内链不但可以增加收录量,还会让这些页面获得更好的排名。

原创文章与定时定量更新

这个在之前的文章中就提到过很多次了,大家可以看看<原创文章对SEO的作用>无论百度、360等搜索引擎都喜欢原创文章,尤其定时定量发布原创文章的网站,我们应该适当的投其所好。

提高合作网站的质量

如果你的合作网站权重,质量都很高。就会提高搜索引擎对你网站的信任度。自然而然地你的网站就会成为搜索引擎蜘蛛的重点关注对象。

网站地图与404页面

制作网站地图是为了方便搜索引擎蜘蛛根据导航索引爬行网站。至于404页面大家可以看看<404页面到底要怎样做?>来了解一下。

长尾关键词的挖掘与建设

网站建设的过程中想要获得更多流量,离不开长尾关键词的挖掘与建设。而长尾关键词想要获得排名,只有高质量资讯内容。当大量长尾关键词都获得排名以后,就算由搜索引擎算法改变而导致的核心关键词浮动,也不要因此而懊恼。因为即使核心关键词排名丢失,长尾关键词排名还是在的,并不会直接导致网站流量消失。

目前有:3条访客评论,博主回复2

  1. 徐晓怡
    2015-12-27 02:27

    [不]

  2. 姜文
    2015-08-10 11:28

    一看你就没有看我之前的文章

  3. 群伟伟博客

    人越多的网址Spider越喜欢去,,这个对我感触挺大的。

留下脚印,证明你来过。

*

*

流汗坏笑撇嘴大兵流泪发呆抠鼻吓到偷笑得意呲牙亲亲疑问调皮可爱白眼难过愤怒惊讶鼓掌