1.定义
反事实counterfactual是对已有结果进行假设,再推理,估计其中一项影响因素的发生概率。
2.用处
近年来在机器学习中广泛应用,指代与因果分析相关的广泛性技术。
3.典型实例
1.已知 Alice 在工作中没有得到晋升,已知她是一名女性,已知我们可以观察到的关于她的情况和表现的一切事情,那么,如果 Alice 是男性,她的晋升概率又会如何?
我们问这个问题,目的是在检测性别对结果有多大的影响。但是我们在这里,需要明确的一点就是,这是一个单独的公平性概念,不是整个模型的公平性。也就是说,我们不知道模型是否公平或者我们假设模型是相对公平的。我们只是评估这个特例里面,Alice是男性,会对结果产生的影响。
2.假设我获得硕士学位,并且在此期间我留了很长的胡子,假设我没有留胡子,我还能获得硕士学位吗?
这里我已经获得硕士学位,并且我留有胡子。我想知道胡子对于我获得学位有多大影响,但事实是,有没有胡子,我都会获得学位。这里评估的是胡子对于获得学位的影响概率。
4.数学表示
回到Alice的例子,将其假设为两个例子:1.Alice是女性,在工作中兢兢业业;2.Alice是男性,其它信息和上一个例子完全一致。
则有
P1(晋升|Alice=女)
和 P2(晋升|Alice=男)
这两个概率之间,如果结果一致,我们就可以认为晋升和性别无关,如果结果不一致,我们就将P1和P2的差值,当作性别在模型中的影响概率。这是非常好理解的,但是这只是一个结果概率。
5.结论
反事实counterfactual通常被认为是不科学的,因为这不是在经验上可测得的。在机器学习中,我们可以在测试数据集上对模型进行测试,但那是在因果机器学习中,不是所有东西都可以直接测试或者根据已有经验进行测试的,毕竟过去的事情不可以重来。简而言之,就是因果机器学习只是假设既定事实中影响结果的某一因素,但是我们没办法验证这个因素在现实中会对最终结果产生的影响。
但是反事实技术可以给了解或者使用模型相关人员外的决策者一个参考,比如政客的军师通过研究往届选举人的特点,分析某些因素对选举结果的影响。比如间谍通过收集敌方情报,研究某一因素是否对自己国家有强威胁。