【百度算法解密】关于页面更新时间的显示与SEO的关系(hin重要)

说起页面更新时间的显示方式,你可能觉得这个小细节不值一提,but本文要说的恰恰相反,这可能关乎你网站能否正常收录,正常展示,甚至判断是否原创的一个重要标准。本文稍后将引用一些实例和百度官方的文档来证明。

2017年6月,百度内测原创保护工具,久久SEO博客节选了整个原创工具内测期间,百度原创内测QQ群管理员(百度官方技术)在群中发布的一些知识点如下:

1.原创文章文章的数字最好大于500字;
2.发布一小时内提交;
3.原创文章时间最好精确到秒,表明作者,表明出处;
4.文学作品、商品信息、翻译不在原创保护内;
5.新站也可以加入到原创保护中;
6.二级域名也可以申请原创保护;
7.pc站和移动站是同步的,目前先建议提交pc站的;
8.原创提交也会占用链接提交的配额;
9.地方性网站,每个地域都可以申请原创保护;

上面第3点,对页面发布时间进行了重点强调,精确到时分秒,显示格式如下:

2017-12-05 22:04:46

下面会说一些博主遇到的具体例子。

第一个就是,有网友在百度站长论坛提问,为什么百度显示的收录时间不是发布时间,经过查看其网页,在网站侧边栏有一个 专辑更新时间 ,在html代码里,这个时间显示在h1标签下的发布时间之前,让百度误以为是文章的发布时间抓取了,从而造成时间提取错误;

第二个案例:是博主自己的一个网站,显示时间格式也是按照标准的年与日时分秒,但是快照总是更新到几天前,文章确实半年前发布的,这是什么鬼?经过仔细分析,发现原来是文章底部相关推荐调用了最新的文章,偏偏却在最新文章的下面写上了 发布于:让百度提取了最新文章的时间,从而导致搜索显示时间近乎实时的更新,由此猜测百度针对同一个页面多个时间显示时,是可能会优先提取最近的时间的;

第三个案例:是关于收录的问题,SEO编辑反馈,当日收录的文章,site看不到,但是直接搜索url却能看到当日已经收录,这是为何呢?经过反复测试,当页面中加入精确到时分秒的时间以后,site即可看到正常收录;

第四个案例:有站长问为什么我的收录都是显示1天内,别人的确实10分钟前?经过查看对方网站,原来是他的站点发布时间没有精确到时分秒,那百度不知道具体你哪个时间点发的,只能给你显示1天内啦。

第五个案例:百度站长官方发布的《页面无用时间信息导致网页不被爬虫抓取》,原文可以看: http://ziyuan.baidu.com/college/articleinfo?id=1100

其中说了几个重点:

1,网页上切忌勿乱加时间,如我们网站的(始于201499日)这种时间是一个大忌
2,网页内容尽可能加上产出时间,也就是发布时间

通过以上几个例子,可以总结以下几点:

1.发布时间很重要,不要让页面显示过多的无关时间;

2.发布时间是判断是否原创的一个重要标准;

3.时间最好用年月日时分秒的方式显示;

本文起草与2017年7月30日,完稿与2017-12-5 22:17:01 累死求,顶着腰疼的压力苦逼哈哈的键盘侠

发表评论

电子邮件地址不会被公开。 必填项已用*标注