开云·kaiyun(中国)体育官方网站 登录入口 kaiyun体育网页版登录只关注平均的因果效应-开云·kaiyun(中国)体育官方网站 登录入口

你的位置:开云·kaiyun(中国)体育官方网站 登录入口 > 新闻 >

kaiyun体育网页版登录只关注平均的因果效应-开云·kaiyun(中国)体育官方网站 登录入口

发布日期:2025-07-09 14:35    点击次数:91

itup01纲目kaiyun体育网页版登录

在上一章的现实中,咱们先容了因果推断中的基本想想,包括:咱们为什么温煦因果性,因果性和关系性的作用与相反等等。如若小伙伴们还莫得看过这篇著作,推选先回头阅读,这篇著作卤莽让你更好的了解因果推断的理念。

因果推断初学系列著作一:因果推断基本想想3 赞同 · 0 指摘著作

在这篇著作的现实中,咱们会先容如何去量度因果关系,以及在量度因果关系的历程中存在的问题。群众对著作现实有什么疑问,宽宥指摘区中揣度、交流。

如何量度因果关系

黄金表率:A/B实验

在第一章的现实中咱们有提到,由于存在反事实的问题,咱们无法量度并吞个体在并吞时间下不同计谋中的阐扬。那么咱们如何去量度某种计谋的末端呢?如若咱们不关注个体粒度的因果关系,只关注平均的因果效应,那么A/B实验是咱们最佳的决议。原因很肤浅,A/B实验的连忙分流不错保证两组用户的离别一致,这么每组的末端不错合计是东说念主群的潜在因果,因此咱们不错通过对比径直得回因果效应。

这亦然各大互联网公司都相配爱重A/B实验的原因,A/B实验卤莽匡助咱们无偏的得回因果效应,从而匡助业务进行更好的决策。

通过不雅测数据?

A/B实验虽好,然则咱们不一定在职何场景下都卤莽开启A/B实验。那么咱们是否不错通过不雅测数据得到因果关系呢?谜底是不错,但很难。底下咱们将通过一个具体的例子阐扬问题。

辛普森悖论:交流的数据,不同的论断?

下图展示了不同性别的病东说念主在吃药以及不吃药后的康复率。从数据中咱们不错看到,不论是男性如故女性,服药组的康复率都要高于未服药组,然则从举座的数据中看,服药组的康复率反而要低于未服药组。

图例一:服药东说念主群与未服药东说念主群的康复率

难说念这个药对男性和女性成心,然则对东说念主类无益?这很彰着是一个不实的论断。然则正确的论断到底是什么?这个问题很永劫候都把东说念主们搞的很费解。自后东说念主们把这种分组看相对概率与合并起来看相对概率出现论断违反的例子,叫作念”辛普森悖论“。但这其实是一个相配肤浅的数学餍足,即:通过A/B > a/b 以及 C/D > c/d 无法推出(A+C)/(B+D)>(a+c)/(b+d) ,但这个很肤浅的数学公式却频繁让许多东说念主绕不外弯。而这其实亦然一个很肤浅的混杂餍足(性别是服用药物和疾病康复的混杂因子)。

因果关系的两大天敌

混杂偏差

混杂偏差是因果推断中最常见的问题之一,这种问题主要出当今有些变量防碍易或者不成被不雅察到的场景。为了更便捷交融,咱们举一个肤浅的例子:吸烟的东说念主容易得肺癌,吸烟的东说念主也容易黄手指。”黄手指“和”肺癌“本莫得什么关联,然则因为”吸烟“这个共因,让两者之间产生了筹谋。然则咱们不成说黄手指会导致肺癌,因为这两者之间并莫得因果关系。”吸烟“这个共因也被称为混杂因子。而由于混杂因子带来的”伪关系“也称为混杂偏差,在第一章现实中提到的巧克力和诺贝尔奖的例子,亦然由于混杂因子导致。

图例二:黄手指-吸烟-肺癌的关系

更复杂也更为多量的情形,使混杂因子酿成的伪关系与确实的因果关系羼杂在一王人。以新冠与逝世率之间的关系为例:新冠会升迁逝世率。然则在这么的因果关系中,相配有可能存在混杂因子,举例年事:年青东说念主免疫力好,比拟于老年东说念主,感染新冠的几率更低,同期年青东说念主的逝世率自己就比老年东说念主低。因此“年事”成为了“感染新冠”与“逝世率”之间的混杂因子。如若咱们想要得到准确的新冠病毒与逝世率之间的因果关系,就必须商量排斥混杂因子的影响,举例:在进行统计时,咱们扬弃用户的年事。

❤(itup01)kaiyun体育网页版登录



友情链接:

TOP