王朝百科
分享
 
 
 

辛普森悖论

王朝百科·作者佚名  2010-02-12  
宽屏版  字体: |||超大  

当人们尝试探究两种变量是否具有相关性的时候,比如新生录取率与性别,报酬与性别等,会分别对之进行分组研究。辛普森悖论是在这种研究中,在某些前提下有时会产生的一种现象。即在分组比较中都占优势的一方,会在总评中反而是失势的一方。该现象于20世纪初就有人讨论,但一直到1951年E.H.辛普森在他发表的论文中,该现象才算正式被描述解释。后来就以他的名字命名该悖论。

为了避免辛普森悖论的出现,就需要斟酌各分组的权重,并乘以一定的系数去消除以分组数据基数差异而造成的影响。同时必需了解清楚情况,是否存在潜在因素,综合考虑。

(以下内容取材自维基百科与科普写作奖佳作奖作者林守德的向理性与直觉挑战的顽皮精灵-综观诡谲的悖论等文)

辛普森悖论(Simpson's Paradox)

【说明例】

校长,不好了,有很多男生在校门口抗议,他们说今年研究所女生录取率42%是男生21%的两倍,我们学校遴选学生有性别歧视,校长满脸疑惑的问秘书,我不是特别交代,今年要尽量提升男生录取率以免落人口实吗?

秘书赶紧回答说,确实有交代下去,我刚刚也查过的确是有注意到,今年法学院录取率是男性75%,女性只有49%。而商学院录取率是男性10%,女性为5%,二个学院都是男生录取率比较高,校长这是我作的调查报告

学院 女生 录取率 男生 录取率 合计 录取率

商学院 录取 49 49% < 15 75% 64 53.3%

申请 100 20 120

法学院 录取 1 5% < 10 10% 11 9.2%

申请 20 100 120

总计 录取 50 42% > 25 21% 75 31.25%

申请 120 120 240

秘书,你知道为什么个别录取率男皆大于女,但是总体录取率男却远小于女吗?

此例这就是统计上著名的辛普森悖论(Simpson's Paradox)

上面例子说明,简单的将分组资料相加汇总,是不一定能反映真实情况的。就上述例子录取率与性别来说,导致辛普森悖论有两个前提。

(1) 两个分组的录取率相差很大,就是说法学院录取率9.2%很低,而商学院53.3%却很高,另一方面,两种性别的申请者分布比重却相反,女生偏爱申请商学院,故商学院女生申请比率占83.3%,相反男生偏爱申请法学院,因此法学院女生申请比率只占0.833%。结果在数量上来说,录取率低的法学院,因为女生申请为数少,所以不录取的女生相对很少。而录取率很高的商学院虽然录取了很多男生,但是申请者却不多。使得最后汇总的时候,女生在数量上反而占优势。

(2) 性别并非是录取率高低的唯一因素,甚至可能是毫无影响的,至于在法商学院中出现的比率差可能是属于随机事件,又或者是其他因素作用,譬如学生入学成绩却刚好出现这种录取比例,使人牵强地误认为这是由性别差异而造成的。

【辛普森悖论(Simpson's Paradox)回避】

为了避免辛普森悖论出现,就需要斟酌个别分组的权重,以一定的系数去消除以分组资料基数差异所造成的影响,同时必需了解该情境是否存在其他潜在要因而综合考虑。

【辛普森悖论(Simpson's Paradox)于管理】

辛普森悖论就像是欲比赛100篮球以总胜率评价好坏,于是有人专找高手挑战20 场而胜1场,另外80场找平手挑战而胜40场,结果胜率41%,另一人则专挑高手挑战80场而胜8场,而剩下20场平手打个全胜,结果胜率为28%,比 41%小很多,但仔细观察挑战对象,后者明显较有实力。

量与质是不等价的,无奈的是量比质来得容易量测,所以人们总是习惯用量来评定好坏,而此数据却不是重要的。除了质与量的迷思之外,辛普森悖论的另外一个启示是:如果我们在人生的抉择上选择了一条比较难走的路,就得要有可能不被赏识的领悟,所以这算是怀才不遇这个成语在统计上的诠释啰!

 
 
免责声明:本文为网络用户发布,其观点仅代表作者个人观点,与本站无关,本站仅提供信息存储服务。文中陈述内容未经本站证实,其真实性、完整性、及时性本站不作任何保证或承诺,请读者仅作参考,并请自行核实相关内容。
如何用java替换看不见的字符比如零宽空格&#8203;十六进制U+200B
 干货   2023-09-10
网页字号不能单数吗,网页字体大小为什么一般都是偶数
 干货   2023-09-06
java.lang.ArrayIndexOutOfBoundsException: 4096
 干货   2023-09-06
Noto Sans CJK SC字体下载地址
 干货   2023-08-30
window.navigator和navigator的区别是什么?
 干货   2023-08-23
js获取referer、useragent、浏览器语言
 干货   2023-08-23
oscache遇到404时会不会缓存?
 干货   2023-08-23
linux下用rm -rf *删除大量文件太慢怎么解决?
 干货   2023-08-08
刀郎新歌破世界纪录!
 娱乐   2023-08-01
js实现放大缩小页面
 干货   2023-07-31
生成式人工智能服务管理暂行办法
 百态   2023-07-31
英语学习:过去完成时The Past Perfect Tense举例说明
 干货   2023-07-31
Mysql常用sql命令语句整理
 干货   2023-07-30
科学家复活了46000年前的虫子
 探索   2023-07-29
英语学习:过去进行时The Past Continuous Tense举例说明
 干货   2023-07-28
meta name="applicable-device"告知页面适合哪种终端设备:PC端、移动端还是自适应
 干货   2023-07-28
只用css如何实现打字机特效?
 百态   2023-07-15
css怎么实现上下滚动
 干货   2023-06-28
canvas怎么画一个三角形?
 干货   2023-06-28
canvas怎么画一个椭圆形?
 干货   2023-06-28
canvas怎么画一个圆形?
 干货   2023-06-28
canvas怎么画一个正方形?
 干货   2023-06-28
中国河南省郑州市金水区蜘蛛爬虫ip大全
 干货   2023-06-22
javascript简易动态时间代码
 干货   2023-06-20
感谢员工的付出和激励的话怎么说?
 干货   2023-06-18
 
>>返回首页<<
 
 
静静地坐在废墟上,四周的荒凉一望无际,忽然觉得,凄凉也很美
© 2005- 王朝网络 版权所有