网站页面代码长度对收录的影响

  此前在百度站长平台的站长学院中,百度民间的工程师分享了这样一个案例,一个网站主题内容由js生成,没有对用户拜访做优化,然而对搜寻引擎爬虫做了很多有针对性的优化,外表看起来非常完满,然而却没有被百度收录。究其缘由发现,这个网站将图片二进制内容间接放到了html中,招致页面长渡过长,从而没有被百度收录。可能很多站长看了这个案例会疑惑,做了好多年网站,还从没遇到这样的案例。难道页面长度也是影响网站收录的重要要素吗。

  剖析这个成绩,首先咱们要理解什么是网站页面长度。这里所谓的页面长度并非直观意义上阅读网站页面所看到的长度。而是指的页面代码长度。普通的网站,都会将图片的链接或许门路间接加到html代码中,对页面长度没有太大影响,而这个网站的案例并不多见,它间接将图片的二进制内容放到html代码中,也就是间接应用了base64编码,才招致了网站不收录的状况。

  百度站长平台给出的剖析缘由:

  1、网站针对爬虫爬取做的优化,间接将图片二进制内容放到了html中招致页面长渡过长,网站页面长度达164k;

  2、 站点优化后将主体内容放于最初,图片却放于后面;

  3、爬虫抓取内容后,页面内容过长被截断,已抓取局部无奈辨认到主体内容,最终招致页面被认定为空短而不收录。

  工程师倡议:

  1、不倡议站点应用js生成主体内容,如js渲染出错,很可能招致页面内容读取谬误,页面无奈抓取

  2、 如站点针对爬虫爬取做优化,倡议页面长度在128k之内,不要过长

  3、针对爬虫爬取做优化,请将主体内容放于后方,防止抓取截断造成的内容抓取不全

  其实这个成绩,普通网站都不会呈现,只是极多数网站会采纳如此不正当的页面优化形式。不过也给宽广网站提了个醒,在平常优化网站时,页面长度也是权衡一个页面品质是否被收录的次要要素之一。

  网站前端和内容上,页面过长能否影响收录?

  剖析完了网站页面长度招致不收录的缘由,可能有人要问,我的网站页面长度都管制在正当范畴内,也不是js生成的主题内容,为什么收录成果还是普通。这个成绩,就要思考网站模版页面的设计,以及内容长度上关于收录的影响了。在这里,笔者也给出了一下几点倡议:

  1、文章倡议设置摘要栏,并且不倡议文章扫尾应用图片。如今很多网站的文章,都会设置摘要。普通摘要不易过长,大略50-100个字即可。这样不只进步了用户的浏览体验,关于搜寻引擎抓取也起到了很好的促成作用。像百度,就比拟喜爱摘要设置正当的文章内容。如今有很多网站,在公布内容时,喜爱配图。图文结合的文章的确无利于浏览,也受搜寻引擎欢送。然而假如注释以图片扫尾的话,百度首先抓取到的是图片,而后再抓取内容,这样的文章其实是不利于抓取的。所以倡议将图文搁置在文章两头的地位,并且设置摘要,这样的内容才是搜寻引擎最喜爱抓取的款式。

  2、文章过长倡议设置分页。如今很多网站喜爱发长文,有的网站设置了分页,而有的网站则是一拉到底,内容很长。不只不利于用户浏览,搜寻引擎爬虫也不喜爱这样的文章。太长,用户不断要下拉滚动条,假如图片太多,还会影响加载速度。同理,搜寻引擎爬虫也存在抓取艰难的成绩。一朝一夕,便会升高对网站的内容评估,影响收录。

  3、频道栏目页文章不宜设置过多条数。如今的频道栏目页图文摘要的方式成为支流,进而添加了页面下拉的长度。假如设置过长,用户阅读体验不佳,更不利于搜寻引擎爬虫抓取。频道栏目页的显示条数,宜设置在30条左右。此前笔者的网站设置了每页显示50条,普遍用户反映不不便阅读。经过测试,百度抓取的成果也不是很理想。频道栏目的文章摘要,也应该对立为固定的字数,50-100字最佳。由于标准的图片和摘要,也是搜寻引擎爬虫抓取权衡网站品质的重要要素。可以手动设置最好,由于在摘要中手动设置适当的要害词,也无利于页面和文章的收录。

  明天讲了这么多,最重要的还是页面的标准。即便你的网站做的再美丽,在优化中不服从网站页面的标准,收录也不会失去显著的晋升。