0755-23698839

去掉网站上的噪声数据以优化网站排名

新闻动态 2012-02-11 2105次 http://www.shenzhenwangluogongsi.com/news_208.html
新闻动态

昨天深圳网络公司【创络科技】特意将网站优化过程中比较接近数据挖掘层面的信息做了一下简单的介绍,今天创络将继续介绍有关搜索引擎是如何去掉网站上的噪声数据的。可能有很多朋友在做网站优化的时候,会经常伪原创一些文章来放到自己的网站上,但是收录的效果和网站的权重却没有实质上的提升,这就是没有搞清楚搜索引擎是如何去判断一个文章是否是原创的机理,这个问题创络将在本文中加以说明。

搜索引擎会去掉文章中无意义的停止词,例如:“的”、“地”、“得”。其实,无论是英文还是中文,页面中都会出现一些频率很高却对内容没有影响的词,还有一些感叹词和副词也是如此,例如:“啊”、“呀”、“以”、“却”等等。这些词在搜索引擎眼里统称为停止词,搜索引擎在索引一篇文章之前会讲这些词语删除掉,以使索引到的数据更加干净且便于节省计算时间。

搜索引擎还会去掉那些相关性很差的网页内容,因为这些页面有极大的可能对网站的主题没有任何帮助,比如版权声明、联系方式等。还有在论坛中,我们常见的无意义回帖和不相关的回帖都不会被收录,这就是为什么大多数的论坛会对这样的帖子加以处罚的原因。这样的噪声数据对网站内容本身没有意义,还分散了网站的主题内容,如果对这些噪声数据加以索引,那就是在浪费时间。

如果要伪原创一篇文章,那么就根据本文前面一部分提到的内容一样,不要简单的处理掉原来文章中的那些副词和感叹词,这样跟没做完全一样,本文由深圳网站建设公司创络科技收集整理,转载请注明www.shenzhenwangluogongsi.com

原文地址:http://www.chuangluo.com/news_list_1296_403.html

除了搜索之外,您还可以看看下面的热门文章,是不是您正在寻找的资料?
上一条 返回目录 下一条