怎么辨别文章是不是原创
大家都知道在网站优化中有两个词:原创和伪原创。原创就是第一次在互联网上发布,以前从没有出现过的内容;伪原创想必大家都很熟悉吧!通过修改之后发布到互联网上的内容,可能是修改标题、内容,不管是增加或减少文字都是伪原创。
那么搜索引擎是怎么辨别文章是不是原创呢?一般来讲有以下几个方面的因素决定:
1、快照日期。
2、蜘蛛抓取日期。
3、页面外链的多少。
4、文章修改的程度。
比如我在网站上更新了一篇文章,搜索引擎来到网站抓取到这篇文章后,放到数据库,在数据库中对比有没有类似的内容,如果没有就认为是原创。
有一点要说明的是,如果文章刚刚发表就被转载了,谁先被搜索引擎抓取到,谁就是原创。意思就是A网站刚刚发表了文章,B网站转载了。蜘蛛先抓取到了B网站,那么就会认定B网站的文章是原创的。
有时候搜索引擎蜘蛛也不能明确的区别原创和伪原创。毕竟它只是个程序,思维模式都已经固定了。如果我们把标题改过,文章的段落改过,那么蜘蛛将很难确定这篇文章是否有过收录,也许它可以确定有部分内容是重复的,但它也不能因为这些而将这篇文章确认为是转载!
快照日期显示时间最早的,也不一定就是原创。
如果文章发表的时间比较短,快照的时间越早的地址将有可能被认为是原创。但是文章发表的时间如果已经很长了,说不定搜索引擎已经重新获取过快照了,快照的日期就发生了改变。
百度对于原创和伪原创文章的辨别是从多方面考虑的。很多人对于伪原创都比较反感,其实我个人并不这样想,伪原创也是学习分享SEO优化的另一种方式。毕竟大家分享了自己的经验就是为了让大家学习的。有些人看懂了,学会了,认同了某一种观点再用自己的话表述出来又有什么不对呢?