2014年11月16日
[知乎]有人说在知乎上若是名人,废话也可得赞,而且自从知乎首页改版后这种效应几乎越来越明显。这话有数据支持吗?如果不对,有反面数据支持吗?
谢GS邀,这个问题很难回答,因为外部用户很难获得全面的数据。但是,如果数据仅仅来源与某种片面的抽样,很难得出较有说服力的结论。所以,如果想要统计出有意义的结果,只能由知乎,基于完全的内部数据,来做。
GS 的问题本身,其实并不需要数据证明,废话也可得赞。只要举出一些实例来即可。说实话,这样的情况,很难避免,甚至也未必是制度造成的。需要证明的数据也许 是,随着名人粉丝数的增加,他的低质量回答获得高票赞同的概率会上升。但是,由于对何谓低质量回答,与如何算作高票,很难界定,所以这个统计很难进行。
所以,我的观点一直是,不反对马太效应,却反对失效了的马太效应。何谓有效呢?好的回答获得高的票数。何谓失效呢?一个回答,即获得高的赞同票,又引来高的反对票。这样的现象如果越来越多,就是非正常的冲突。
这里提供一个统计的思路:基尼系数与冲突概率。
基尼系数,是用来衡量收入分配是否均衡的。我们可以在这里用每个用户收到的赞同票来代表。
冲突概率,是我自己发明的一个概念,我们可以认为,一个回答,获得的赞同与反对都很高,甚至较为接近,可以算作是一个有冲突的答案。如果再辅之以评论数异常的多,还有很多的没有帮助这样的投票,可以认为冲突较为剧烈。
然后,知乎可以计算一个相关性:每个月统计一次全站基尼系数,以及这个月内出现的冲突回答占总回答数的比例。看看二者是否具有正相关性。
我个人的猜测,这二者是有相关性的,但是,很难在外部对其进行证明。也许知乎的内部人员,可以试着做一做,这本身也有一定的价值,有助于你们监控知乎整个社区的氛围。