网站推广

浅论搜索引擎对原创和伪原创的判定机制

  做网站说白了就是做服务,而服务好不好关键就在于网站提供什么样的内容给客户,内容的质量越好,网站就越容易被客户接受,客户就会喜欢上你的网站,对你网站产生了依赖,这就表明一个成功的网站诞生了,可是对于个人站长来说,网站的内容更新实在很困难,都知道原创的内容非常好,可是原创的难度是可想而知的,于是很多站长就搞起了伪原创,可是现在搜素引擎也越来越智能化了,那么对于我们个人站来说了解搜素引擎对原创和伪原创的判定机制是很有必要的,这样有助于我们在网站内容更新的时候把握好原创和伪原创的比例,从而实现轻松做网站!

  先来谈谈搜素引擎是如何分辨原创和伪原创的,对于中文来说计算机还是不能够做到真正人工智能化的,对于英文网站来说计算机的判定能力会高很多,这是中文和英文对一个词的表达有着不同的规律造成的!比如说争夺天下这个成语,就有很多意思来表达,像逐鹿中原,问鼎中原都能够表示这个意思,而英文只能够通过一个句子来表达,这说明我们中文的博大精深,最起码这些年计算机是没有办法分析出中通过全篇改变同义词这样的伪原创文章的!

  当然搜索引擎基本上都会有这样的动作,那就是根据关键词来进行有机的筛选,因为对于网站的内容来说关键词基本上是不会变的,而判定原创和伪原创主要的方法就是对关键词的分析,如果两篇文章的关键词出现在相似的位置,那么就会被搜索引擎认为这两篇文章其中一篇是伪原创的!

  这么说大家恐怕还不是很明白,那么就让笔者通过具体的实例来给大家做一下介绍!首先计算机会取出两篇文章,然后就开始通过程序分析了!

  1:先设定一个比例,比如定义为M,标注按照0.5的系数!

  2:把文章A根据字数分成三段,B篇文章也分成三段,然后就根据算法将文字转变成计算机识别的符号,这个符号我们姑且用ADSDFAGFAG来表示,当然正确的符号应该是按照二进制代码表示的!

  3:当把A、B两篇文章都转变成符号后,计算机就开始来进行比较分析了,这时候相似度会出现一个比例,如果超过第一步设定的比例是0.5的话,说明两篇文章是相似雷同的,一旦发现雷同搜素引擎自然就会寻找其他参数来决定谁是原创和伪原创了!

  介绍到这里大家应该对搜索引擎判定原创的工作机制有了一定的了解了,那么我们就可以从这方面着手,做出一份高质量的伪原创来,甚至让搜索引擎也认为是原创的文字!

  一:修改标题,我们的中文的复杂性是众所周知的,在外国人的眼中就好比天书,在计算机的眼中自然也大致如此,毕竟计算机是老外发明的嘛,根据原先标题的意思重新组合语言,要写的吸引人的眼球才行!

  二:如果你的文字功底很不错,看了别人的文章之后就能够找到别人的中心思想来,然后你就可以根据这些中心思想稍微的发挥一下,再使用自己的文字来组织就能够形成相当不错的伪原创文章!

  三:通过同义词替换的方法,虽然这种伪原创能够在近段时间欺骗搜素引擎,但是笔者相信不久之后,这种简单的伪原创会被搜素引擎识破,到时候网站就可能会被K掉,所以建议大家要认真对待伪原创,不要幻想只要修改标题,同义词替换就能够欺骗到搜素引擎了!

  目前伪原创在互联网上基本上杜绝不了,也不可能杜绝,不是有这么一句话嘛,天下文章一大抄么,当然就看你抄的有没有水平了,有水平了就是高手,不过有能力最好还是写原创文章,这样才是做好网站的正途!

发布时间:2010-11-26 18:31:03