手机站
网通分站
电信主站
密 码:
用户名:
当前位置 : 主页>网站运营>搜索优化>列表

Google 搜索引擎spam 的种类

来源:互联网 作者:west263.com 时间:2008-02-22
西部数码-全国虚拟主机10强!40余项虚拟主机管理功能,全国领先!双线多线虚拟主机南北访问畅通无阻!免费赠送企业邮局,.CN域名,自助建站480元起,免费试用7天,满意再付款! P4主机租用799元/月.月付免压金!

a. 内容型(内容欺骗型与非欺骗型) b. 链接型 c. 复合型

Google 搜索引擎判断spam的一般方法

- 链接分析:网站(域名,IP)之间的链接,网页之间的链接的数目,应该限制在一定的数目内,并且要考虑分布的状况。

- 面单一词汇的分析:(有时叫关键词密度分析)页面单一词汇与页面全部词汇的比例和分布,当页面单一词汇集中在少数关键词上,有spam的嫌疑。

- 连接页面的相似性分析:相互连接的页面几乎完全相似则有spam的嫌疑。

- 内容的贝叶斯分析:关键词之间的相关性可以从训练spam样本和非spam样本得到。例如页面里出现:免费,或者铃声下载都不能判断为spam,但是同时出现“免费”,“铃声下载”就极有可能是spam。

- 相关分析:白名单,黑名单。

- 留言陷阱:例如建立多个blog系统,开放一些文章的留言,内容上说明是专门针对spam留言。这样当一些自动留言程序进行留言后链接就被记录下来,成为一个“陷阱”。

- 正文里非链接的文字的比例。现在采用两种page rank,一种是链接型网页,一种是内容型网页,链接型网页比较容易被判断当做spam,例如 hao123.com 。

责任编辑:飞翔的鱼 QQ:35996213

文章整理:西部数码--专业提供域名注册虚拟主机服务
http://www.west263.com
以上信息与文章正文是不可分割的一部分,如果您要转载本文章,请保留以上信息,谢谢!