设万维读者为首页 广告服务 技术服务 联系我们 关于万维
简体 繁体 手机版
分类广告
版主:红树林
万维读者网 > 五 味 斋 > 帖子
关于论坛猜马甲的理论探讨
送交者: 紫荆棘鸟 2014年08月26日14:38:54 于 [五 味 斋] 发送悄悄话
标题出现了“理论”一词,毫无疑问显得非常做作。但自从半年前被担任八婆党骨干以来,我还没有发表过一篇八婆文章。形势逼人,是到了码一小段八婆文章的时候了,否则我的江湖地位不保。

这里八婆一下如何猜论坛里的马甲。大家记得,前不久论坛突然冒出一个技惊四座的ID“小陈”,大家交头接耳并议论纷纷,其中一些沉不住气的八婆党开始八卦小陈的主ID到底是,其中我的猜测是,小陈是某位蓝同学的马甲(所以不会是点击率)。不料这个猜测刚出炉,就招致好玩和小梦等同学的批评。现在想来,当初的猜测十有八九是不靠谱的,基本上猜错了,八得不对。

为啥八得不对?很显然有两方面的因素:涉及如何八的计算水平以及涉及如何八的算法。前者属于个人能耐范畴(例如对candidates熟悉与否,等),不太俱备共性,这里不多说我们重点讨论后者:如何八的方法,或曰关于如何去八的algorithms。这里我提出两个algorithms,意在抛砖引玉,割腋赞裘,供大家批评,参考,补充。

方法一:封闭型八法。
这种八法的要诀在于,在具体开八前先固定所疑马甲的对象,然后从中选择那个可能性最大的ID。这里“所疑马甲的对象”这个集合是具体开八前就固定的,所以这种八法称为“封闭型八法”。显然这种算法能保证选出一位 ID (当然可能并列)。

举例:假设小陈可能是{风丽,小梦,djl,box,王福贵,贫嘴张大民},那么剩下的工作就是从中选择那个经计算后最可能的ID,并将他/她咬定为小陈。

方法:开放型八法。
这种八法的要诀在于,在具体开八前先选定所疑马甲的对象并不是固定的,任何ID都可以参与八卦计算,但在具体计算前我们需要选定个马甲相似度的阈值H,例如 H=0.6。八卦算法如下:
任意选定一个ID,如果此ID和马甲的相似度至少是阈值H,那么一口咬定此ID就是这个马甲,计算完毕;否则考察下一个ID。显然,如果阈值H设得过高(例如 0.95),那么开放型八法可能锁定不了马甲到底是谁。

举例:猜小陈,设定阈值H=0。6
考虑ID风丽,相似度=10%,小于阈值H,舍去;
考虑ID小梦,相似度=42%,小于阈值H,舍去;
考虑ID djl,相似度=35%,小于阈值H,舍去;
考虑ID box,相似度=17%,小于阈值H,舍去;
考虑ID王福贵,相似度=9%,小于阈值H,舍去;
考虑ID贫嘴张大民,相似度=15%,小于阈值H,舍去。。。

在实战中,小梦采用的应该是封闭型八法,并将ID锁定为点击率;我用的应该是阈值为50%的开放型八法,经过十来轮计算后,没有锁定任何一个ID。
0%(0)
0%(0)
标 题 (必选项):
内 容 (选填项):
实用资讯
回国机票$360起 | 商务舱省$200 | 全球最佳航空公司出炉:海航获五星
海外华人福利!在线看陈建斌《三叉戟》热血归回 豪情筑梦 高清免费看 无地区限制
一周点击热帖 更多>>
一周回复热帖
历史上的今天:回复热帖
2013: 素食的一个巨大害处,男人一定要看
2013: 我认为人类的教育已经异化,很难培养出
2012: 有了古狗维基,很容易知道八国联军在北
2012: 随便的诗。最后一句有点凑
2011: 珍曼: 写在飓风"爱晕"来临之
2011: 北边的几位哥们儿,钥匙3级台风正面骚
2010: 这个真不错,就是底足太黄太猛。
2010:
2009: 一休:大仲马,JULIA和刘能媳妇
2009: 大陆咋越混越不和谐,北韩崩了,缅甸不和