网站地图 (XML / TXT
    服务咨询电话
0551-65321807
  服务咨询及项目合作
272579841@qq.com
  点击此处立即在线沟通
点击这里给我发消息[售前服务咨询]
点击这里给我发消息[售后服务咨询]
网站首页 > Spider抓取过的页面还会二次抓取吗?
来源:合肥网站优化 发布时间:2017/3/24 浏览次数:1110次

  最近有同事问合肥网站优化小编,Spider抓取过的页面还会二次抓取吗?相信很多朋友都弄不太清楚这个问题,今天小编在这里统一回答下。
  Spider抓取过的页面还会二次抓取吗?肯定会的!spider把网页抓取到本地,该网页被分析索引并参与了排名,并不意味着spider对该网页的工作就已结束。现在的互联网信息瞬息万变,页面的更新改动或者删除都会使已经抓取的页面失效,所以spider对网页进行再抓取也是必须的,不过,要使spider对你的网页进行二次抓取应该具备以下四点:用户体验(UE)、历史更新频率、网页类型和网页权重。 
  1、 用户体验 
  整个互联网的网页数量是巨大的,已被百度抓取并索引的中文网页应该是千亿级别的,但是对用户有用的信息却是凤毛麟角。当用户进行搜索时,返回的结果能否满足用户的搜索需求直接关系到用户体验度的好坏。试想,用户看到的页面信息显示的是过时的信息,用户对搜索引擎的印象又会是如何呢?为了能够给用户提供及时的信息,搜索引擎爬虫需要对网页进行再抓取和更新。理论上,这些网页被搜索到的次数越多,再次抓取该页面的频率就会越高。 
  2、 历史更新频率 
  搜索引擎有自己的套发现某网页更新频率的策略。Spider的再次抓取是为了发现页面上的新变化。如果页面上没有新的内容出现,搜索引擎则会降低对该页面的抓取频率,如果接连无新内容出现,搜索引擎甚至会停止对该页面的索引。  
  还有一点需要指出的是,所谓的页面变化是指页面的主体内容的变化,非主体内容的变化,不在搜索引擎爬虫再次抓取之列。  
  3、 网页类型  
  不同的网页类型有不同的更新频率。在同一个站点内网站首页,目录页,专题页和问作业的更新频率肯定是不同的。所以对于同一站点内的网页,是spider也会采用不同的抓取频率。一般情况下首页和目录页是spider经常光顾的页面,根据专题页面的实效性或者其他特征,spider可能会在某一时间段内进行频繁抓取, 实效性过后就会降低对其的抓取频率;对于文章页spider很可能第一次来过之后就不会再来了。 
  网页很多,但是网页的类型却并不是所想象的那么多,每个类型的网页都会有自己的布局和更新规律,搜索引擎有足够的能力发现网页的类型并设置合理的再次抓取频率。网页类型归类和网页历史更新频率是被综合使用最多的,一般在同一站点内同类网页会有相同的更新频率,者也会方便spider对网页更新频率的判断。 
  4、 网页权重  
  网页权重也是决定抓取频率的重要因素。权重高的网页抓取的频率高,反之,抓取的频率就低。用户体验度也是决定网页权重的因素。在其他条件对等的情况下,权重高的网页抓取频率要比权重低的网页抓取频率高。
  以上就是合肥网站优化小编整理的内容,希望可以帮到大家!更多相关资讯欢迎访问http://www.zosyo.com/


>> 相关文章:

·安徽SEO优化提升网站排名
·合肥SEO优化推广打造地方品牌的必备策略
·合肥网站制作经验分享
·安徽网站制作如何推广自己的网站
·合肥网站优化需要掌握哪些技巧
·合肥网站建设中的网友构成元素
·安徽网站优化与网络营销策略探讨
·安徽网站建设常见企业网站类型解析