有很多原因导致相同的的内容刊登在不同网站,重复内容有机会能够让搜索结果显示相同资讯,让搜索结果的质数下降。为避免这情况发生,Google 表示会采取不收录重复内容网页的措施。当然现实之中,大家都经常可发现重复内容的网页出现在搜索结果内,尤以国内网站主。或者可以理解为Google 未算做得太彻底。不过作为内容的原作者,一定不希望自己的网站不被收录,而被复制的网站却收录了。为此,我们不应把重复内容的问题掉以轻心。
第一:站内和夸站重复内容
重复内容的网页可分为站内和夸网站两大类,前者大多是由于制作网站时的疏忽或内容管理系统的设定不当,导致不同URL显示同一内容,Google网站管理员说明中心很详细介绍减少站内重复内容的方法 。在以上网页中有一小段其实是关于夸站重复内容的,如果你一不留神,可能错过了。这小小一段文字其实才是重复内容最受网站制作者和SEOers 关注的地方。
第二:夸站重复内容的成因
为什么不同网站会刊登相同内容呢?原因有几个:
A.原作者把内容转发到其他网站或论坛,以增加阅读率或作推广宣传之用
B.social bookmark /网志联播等服务,特别是中文网站的服务,不少以自己网域的URL来显示其他网站的内容,例如365Bloglink
C.网站参加了blog network,自动供稿(这就是「联合显示」)
D.不问自取你的网站内容,称这行为「采集」,这是现在网站经常出现相同内容的主因.如何令Google相信你是原作者?
夸站重复内容最大问题是Google 有机会不能分辨谁是原作者,结果原作的网站反而不被收录。因此解决的方法就是使搜索引擎知道你是原作者。 Google官方blog提议我们参考《 Ranking As The Original Source For Content You Syndicate 》一文。其实最重要而自己可以控制的一点,就是在自己的原文中加入这网页的URL。
第三:入原文的URL
最简单的方法,就是在原文的网页上加入这网页的自我连结(例如在结尾加入)。有些网站采用这方法,但如果你觉得这方法不好看,就要谨记以下的方法:
当你手动把内容转发到其他网站或论坛,请记得在文中加上这原文的URL
一般social bookmark、网志联络、blog network 和部分采集网都是读取网站的RSS Feed 取得你的网站内容,因此你可以只在RSS Feed 加入原文的网址,Wordpress 用家可使用RSS 相关的插件,例如Better Feed和RSS Footer 。Feedburner用户则可使用Feedflare做到相同的效果 。
第四:另一些自保方法
上述的方法不能阻挡刻意偷取内容的网站,采集网站一般以程式读取网页的内容,加工减料去除原文网址。因此我建议大家制作了新内容后,应该尽快通知搜索引擎,希望可以第一时间收录你的网页资料。网志通常都有Ping 的功能,可以即时通知搜索引擎。而如果你的网站不是blog,则应该尽快更新你的sitemap,及用搜索引擎的站长工具,通知他们你的网站更新了,详细方法可参考《 把网站加入到Yahoo及Google的方法(三) 》 。