观察:Google是如何判断网站的原创性的



2008-07-15 12:13:07 北京时间
 记得我曾经在Google中文网站管理员博客在《由抄袭造成的重复内容》文章中看到过:“鉴别内容的原创来源是Google所擅长的,在大多数情况下原创内容源都能被正确地识别出来,从而不会给发布真正原创内容的网站带来任何负面影响……当有人剽窃了您网站中的内容,并将其展示在其他网站上牟利。Google在不同网站遇到相同内容的时候,会基于许多不同的依据来判断究竟哪个网站才是原创,而这样的判断通常是准确的。”

  根据我对网站 www.bitjob.net 猎头公司 观察,Google识别原创内容源的能力有时候比较准,但有时候不太准,不准的情况主要是在中文网站上,因为Google无法用简单的链接权重来平衡门户网站和个人博客之间的孰是孰非。

  目前的中国互联网仍然是主流门户网站的天下,个人博客的生存环境异常艰辛,个人辛辛苦苦的写作往往得不到回报,产生的内容却因为种种原因无法给个人带来应该得到的回报,所有的流量都逐步流向主流门户网站。通常情况下,Google给予门户网站的权值和网站权威度都非常高,当一篇完全相同的文章同时出现在门户网站和个人博客上的时候,Google往往认为原创者是门户网站,除非个人博客的权值非常大。

  门户网站为了内容的大量更新而雇佣了不少“网站编辑”,“网站编辑”通过人肉筛选的方法从个人博客上挑选出优秀的文章,并将这些文章复制到门户网站,复制内容的同时通常会删除原始文章的作者和文章中的链接地址,同时小幅修改文章的标题,经过这一番“处理”,Google通常很难判断出到底哪个文章是原创,当一个原创个人博客的文章被大量门户网站复制之后,Google搜索引擎可能会惩罚这个原创博客,不再索引上面的文章。




发表评论

请文明参与讨论,禁止漫骂攻击。本站保留不刊登无关和不雅评论的权力。


用户名: 密码: 匿名

相关新闻
相信很多朋友都听过100万的故事,讲的是一个有名的工程师去检修
近日讨论最多的是地摊男事件,缘由一名地摊男卖网站,获得了为数
前段时间对某个企业应用网站进行了一次优化分析,解决这个网站经
实际上百度早就已经制定了百度与站长的建站指南,公布了如何让网
当用户在防问Internet信息服务(IIS)的服务器上的内容时时,IIS

广告
© 2008 The Czz5 Company. All Rights Reserved. 关于我们 - 联系我们 - 广告业务 - 网站地图 - 版权声明 - 友情连接 - 网站投稿 - 致信编辑