搜索引擎反作弊的三个想法@rude
前一篇文章提到了内容农场和链接农场,都是比较传统的作弊方式。至于其他的,我们有时间一一列出。既然有作弊,搜索引擎也会有反作弊,以保持良好的显示结果。那么,搜索引擎如何反作弊呢?一般来说,会有以下三个想法:1。前段时间,同事A告诉我一件事。他的妹妹B出国留学,然后B出国留学qq告诉A洗衣服,洗手机,洗银行卡什么的,让A给B妈妈打电话寄点钱,A立刻执行,B妈妈也深信不疑,在即将到来的那一刻,B一个电话挽救了即将到来的损失。细思恐极。事实上,这也是一种直接的信任传播模式QQ上跟B的妈妈说,B母亲不会完全相信,但通过a的口一传,马上就不一般了。因为,A在B母亲的信任名单中。OK,这是一种反作弊的想法。在大量的网页数据中,通过技术或人工手段获取完全可靠的网页被设置为白名单。白名单中网页的信任值由链接向外扩散而递减或衰减。然后,设置一个值,高于此值,是的OK网页,低于这个值,对不起,你作弊了。2.不信任传播模型实际上类似于这个想法。找到一群作弊网页,然后通过链接关系分析不信任分数。需要注意的是,信任分数是通过链接正向传递的,不信任分数是通过链接反向传递的。举个例子:A对于垃圾页面,指向A的链接B比指向A的链接C的概率要大得多。所谓异常发现模型,可以是作弊页面的特征,也可以是正常页面的特征。收集这些特征,然后判断一个页面是作弊还是正常,也是相当不错的OK一件事。让我们举一个简单的例子来识别链接农场:链接农场中的链接关系是由设计师精心安排的。因此,必然会有一些违背自然特征的行为,如:1)出链和入链的统计分布规律:正常页面出链和入链满足Power-law作弊链接违反分布;2)作弊链接Url网站往往太长,它包含更多的点画线和数字;3),如入链和出链的增长率,正常网页和作弊网页在这些变化模式上是不同的。推荐阅读Gomx补充会议,steven个人风格 @steven 文军营销c.seo当一个瓶颈无法解决问题时,比如互联网这个词可以在相关的垂直搜索领域找到另一种方法,比如在小米的主题商店里伪装的互联网壁纸或图集,这也可以产生良好的宣传效果。 5.请使用反作弊算法rude的ppt自行脑补处理;肖俊在其中...