为什么

朱迪亚·珀尓 ([[Judea Pearl]])，现加州大学洛杉矶分校计算机科学教授，“贝叶斯网络”之父，2011 年因创立因果推理演算法获得图灵奖，同时也是美国国家科学院院士，IEEE 智能系统名人堂第一批 10 位入选者之一。
目前已出版 3 本关于因果关系科学的经典著作，分别为《启发法》(1984)、《智能系统中的概率推理》(1988) 和《因果论：模型、论证、推理》(2009)。他还获得过多项顶级科学荣誉，包括认知科学领域的鲁梅哈特奖、物理学及技术领域的富兰克林奖章以及科学哲学领域的拉卡托斯奖。
达纳·麦肯齐 (Dana Mackenzie)，普林斯顿大学数学博士，自由科学记者，知名科普作家，著有《无言的宇宙》等作品，其学术论文多次收录于《科学》《新科学家》《科学美国》《探索》等重量级期刊。

Outline #

推荐序
前言
导言：思维胜于数据
- 介绍因果模型能够解决的具体问题，发展历史，重大意义
- 现实的蓝图：介绍因果推断引擎，因果图
- 展望本书的内容
第一章：因果关系之梯
- 本书的第一章将观察、干预和反事实这三个台阶组合成因果关系之梯（ladder of causation），这是本书的核心隐喻。它将向你揭示利用因果图（我们主要的建模工具）进行推理的基本原理，同时引导你一步步成为一名精通因果推理的专家。事实上，在读过本书后，你将远远超过几代数据科学家，因为他们曾试图通过一个模型盲（model-blind）(https://www.neat-reader.cn/part0005.html#note4n) 的透镜解释数据，完全忽略了因果关系之梯所阐明的特质。
  - 因果关系的三个层级：观察能力（seeing）、行动能力（doing）和想象能力（imagining）
  - 迷你图灵测试：我称之为“迷你图灵测试”，其主要思路是选择一个简单的故事，用某种方式将其编码并输入机器，测试机器能否正确回答人类能够回答的与之相关的因果问题。
  - 论概率与因果关系：因果关系不能被简化为概率
第二章：从海盗到豚鼠：因果推断的起源
- 本书的第二章将讲述一个匪夷所思的故事：统计学科是如何让自己陷入了因果蒙昧的黑暗，以及这对所有依赖数据的科学产生了怎样深刻的影响。我会在这一章讲述遗传学家休厄尔·赖特的故事，他是本书中的一位大英雄，他在 20 世纪 20 年代绘制出了世界上第一张因果图，多年来他是少数几个敢于认真对待因果论的科学家之一。
  - 引：高尔顿身高遗传模型，向均值回归
  - 高尔顿和被丢弃的探索：相关性
  - 皮尔逊：狂热者的愤怒：统计学摒除因果
  - 休厄尔·赖特、豚鼠和路径图
  - “但它仍在动！”
    - 不受欢迎的两个原因
      - 路径分析“不适合解决包含‘固定程序’的问题。其使用者必须先有一个假设，并设计出一张恰当的、包含多重因果序列的结构图”。
      - 但赖特的传记作者威廉姆·普罗文指出了另一个可能造成路径分析不受欢迎的因素。20 世纪 30 年代中期以来，费舍尔一直将赖特视为自己的敌人。
    - 其他领域的发展
      - 社会学家将路径分析改名为结构方程建模（structural equation modeling，简称 SEM）
      - 在经济学领域，路径分析的代数部分演变为联立方程模型（simultaneous equation models，没有简称）
  - 从客观性到主观性——贝叶斯连接
第三章：从证据到因：当贝叶斯牧师遇见福尔摩斯先生
- 本书的第三章讲述的是一个同样奇妙的故事：我是如何通过对人工智能的研究，特别是对贝叶斯网络的研究，皈依了因果论。贝叶斯网络是让计算机得以在“灰色地带”进行思考的第一个工具，有段时期，我曾坚信它掌握着开启人工智能大门的钥匙。而到了 20 世纪 80 年代末，我终于确信自己错了，本章讲述的正是我从贝叶斯倡导者变身为“叛教者”的整段旅程。不过，贝叶斯网络仍然是人工智能领域的一个非常重要的工具，其涵盖了因果图的大部分数学基础。除了对贝叶斯法则和贝叶斯推理方法所做的浅显的、以因果关系为梳理逻辑的介绍外，第三章还将为读者提供一些贝叶斯网络的应用实例。
  - 电脑侦探波拿巴：举例子说明贝叶斯网络的应用
  - 贝叶斯牧师与逆概率问题：贝叶斯法则
  - 从贝叶斯法则到贝叶斯网络：
    - 大卫·鲁梅哈特的神经网络草图，表明了我们大脑的信息传递网络是如何学会识别短语“THE CAR”
  - 贝叶斯网络：应如何看待数据
    - 三种接合形式，链接合、叉接合和对撞接合
      - 1.A→B→C。这种接合形式是被称为“链”接合或中介接合的最简单的表现形式。
      - 2.A←B→C。这种接合形式被称为“叉”接合，B通常被视作A和C的共因（common cause）或混杂因子（confounder）。
      - 3.A→B←C。这是最让人着迷的一种接合形式，被称作“对撞”（collider）接合。
  - 我的行李箱在哪里？从亚琛到桑给巴尔
  - 真实世界中的贝叶斯网络
  - 从贝叶斯网络到因果图
第四章：混杂和去混杂：或者，消灭潜伏变量
- 本书的第四章讲述的是统计学对因果推断的主要贡献：随机对照试验（randomized controlled trial，简称 RCT）。从因果的角度来看，随机对照试验是一个进行人为干预的工具，用以解答 P（L|do（D））问题，可以说这就是该工具的本质特征。随机对照试验的主要目的是将目标变量（比如 D 和 L）与其他变量（Z）分离，因为如果不进行分离，则变量（Z）就会对二者产生影响。如何消除这种潜在变量带来的扭曲或“混杂”在近百年来一直未曾得到妥善解决。而本章将引导读者使用一种极其简单的方法来解决这个常见的混杂问题。这种方法就是在因果图中进行路径跟踪，你在 10 分钟之内便能掌握这种方法。
  - 对混杂的长期恐惧
  - 混杂的新范式
  - do 算子和后门标准
第五章：烟雾缭绕的争论：消除迷雾，澄清事实
- 本书的第五章将讲述因果论发展史乃至科学史上的一个重要时刻，当时，统计学家纠结于“吸烟是否会导致肺癌”这一问题。由于无法使用他们最喜欢的工具——随机对照试验，他们在是否接受某一方的结论上始终难以达成一致，甚至对于如何理解这个问题也一直存在分歧。关于吸烟的争论将因果论的重要性推到了风口浪尖。可以说，数百万人因吸烟而丧生或折寿，正是因为科学家没有适当的语言或方法论来回答这个因果问题。
  - 烟草：一种人为的流行病：因为缺乏因果框架，这个如今显而易见的结论在当年有着巨大的争论
  - 美国卫生局局长委员会和希尔标准
  - 吸烟对新生儿的影响使用对撞偏倚解释
  - 激烈的辩论：科学与文化
    - 科学家因阐明了可能导致不良社会后果的真理而受到道德斥责，类似的事件在历史中屡见不鲜。罗马教廷对伽利略思想的批判无疑是出于对当时社会秩序的真诚的关注和维护。查尔斯·达尔文的进化论和弗朗西斯·高尔顿的优生学也遭受了同样的待遇。
第六章：大量的悖论！
- 在第五章的严肃话题之后，我希望本书的第六章会让读者享受一些轻松时刻。这章的主题是悖论，包括蒙提·霍尔悖论、辛普森悖论、伯克森悖论等。此类经典悖论的确可以当作脑筋急转弯来消遣，但它们也有严肃的一面，尤其是当你从因果的角度来分析它们的时候。事实上，几乎所有这些悖论都体现了某种与因果直觉有关的冲突，从而也揭示出了这种因果直觉的内在构造。这些悖论是一种警示，用以提醒科学家们人类的直觉是根植于因果的，而不是根植于统计和逻辑的。我相信读者会从这些有趣的古老悖论中得到“柳暗花明又一村”的体验。
  - 令人费解的蒙提·霍尔悖论三门问题
  - 更多的对撞偏倚：伯克森悖论选择数据的问题，大部分是无意识的选择导致了奇怪的结论
  - 辛普森悖论如何解决混杂变量才是需要考虑的问题，什么时候应该分割数据，什么时候应该聚合数据，在于先验的因果关系
  - 图示中的辛普森悖论因果图确实是利器，这里考虑了连续变量
第七章：超越调整：征服干预之峰
- 终于，本书的第七章到第九章将带领读者踏上因果关系之梯激动人心的攀登之旅。我们会从第七章的干预问题入手，讲述我和我的学生们如何历经 20 年的努力，实现 do 类型问题解答的自动化。我们成功了。我还将在本章解释“因果推断引擎”的本质，以及它如何能够产生“是/否”问题的答案及图 0.1 中的被估量。对该引擎的深入分析将让读者学会如何在因果图中发现某些模式，这些模式将生成因果问题的直接答案。我将这些模式称为后门调整、前门调整和工具变量，它们是研究者在科学实践中进行因果推断的主要工具。
第八章：反事实：挖掘关于假如的世界
- 本书的第八章将通过讨论反事实把你带到因果关系之梯的顶端。反事实被视为因果论的基本组成部分这一认识至少要追溯到 1748 年，当时苏格兰哲学家大卫·休谟提出了这样一个多少有些别扭的因果定义：“我们可以给一个原因下定义说，它是先行于、接近于另一个对象的一个对象，而且在这里，凡与前一个对象类似的一切对象都和与后一个对象类似的那些对象处在类似的先行关系和接近关系中。或者，换言之，假如没有前一个对象，那么后一个对象就不可能存在。”大卫·刘易斯，普林斯顿大学的哲学家（于 2001 年去世），曾指出休谟实际上给出的是两个而非一个定义。第一个是规则性定义（因后面通常跟着果），第二个是反事实定义（“假如没有前一个对象……”）。尽管哲学家和科学家以往更多地将注意力集中于规则性定义，但刘易斯指出，反事实定义与人类直觉的联系更为紧密：“我们认为因是起重要作用的事物，并且它所引起的差异必然就是有它和没它所发生结果之不同。”
- 读者将在本章结尾兴奋地发现，我们现在可以越过学术争辩，估算出任何反事实问题答案的实际值（或概率），无论这个问题有多复杂。其中最有趣的问题就是某个观察到的事件的必要因（necessary cause）和充分因（sufficient cause）问题。例如，被告的行为有多大可能是原告受伤的必要因？人为因素引起的全球气候变化有多大可能是异常气候事件的充分因？
  - 最简单的路线：后门调整公式
  - 提到了 [[Ronald Fisher]] [[Jerzy Neyman]] 两人之间的斗争，和 [[漫谈现代统计 “四大天王”]] 相呼应了，这大概就是 RR 的魅力，在不同的信息之间建立 links
第九章：中介：寻找隐藏的作用机制
- 最后，本书的第九章讨论的主题是中介。在因果图中谈论箭头绘制时，你可能会想，如果药物 D 只是单纯地通过影响血压 Z（中介物）来影响病人的生存期，那么我们是否仍然要从药物 D 画一个直接指向生存期 L 的箭头？换言之，D 对 L 的影响是直接的还是间接的？如果两者都有，那么我们如何评估它们的相对重要性？这些问题不仅具有重大的科学意义，而且具有深刻的实际影响：如果我们了解了药物的作用机理，那么我们或许就可以开发出其他效果相同，但价格更低廉或副作用更少的药物。同样，读者将在本章结尾愉快地了解到，这一古老的中介机制问题将被简化为一道代数题，而科学家将通过使用因果工具包中的一些新工具轻松解决这些问题。
- mediation 中介作用的机制
- 坏血病：错误的中介物
  - 英国北极探险队悲剧
  - https://en.wikipedia.org/wiki/Albert_Szent-Gy%C3%B6rgyi Albert Szent-Györgyi 圣捷尔吉维生素 C 发现者 1937 年获得诺贝尔生理学或医学奖
- 先天因素与后天培养：巴巴拉·伯克斯的悲剧
  - 当时正是优生学运动的全盛时期，尽管现在我们已经明确知道这个观点是错的，但在那时，像弗朗西斯·高尔顿、卡尔·皮尔逊和特曼这些学界权威都积极地试图用研究证明该观点的合理性。[[优生运动]]
  - 1926 年独立提出路径图，休厄尔·赖特 6 年前提出
  - 1943 年 5 月 25 日，她从纽约的乔治·华盛顿桥上跳了下去，结束了自己的一生，享年 40 岁。
- 寻找一种语言（伯克利大学招生悖论）
  - 招生是否存在性别歧视？
    - 比如，UC Berkeley 的著名统计学家 Peter Bickel 教授 1975 年在 Science 上发表文章，报告了 Berkeley 研究生院男女录取率的差异。他发现，总体上，男性的录取率高于女性，然而按照专业分层后，女性的录取率却高于男性 (Bickel 等 1975)。在流行病学的教科书 (如 Rothman 等 2008) 中，都会讲到“混杂偏倚”（confounding bias），其实就是 Yule-Simpson’s Paradox，书中列举了很多流行病学的实际例子。
  - 再次提到了辛普森悖论
  - 中介谬误 Mediation Fallacy
  - 在卡尔森诉伯利恒钢铁公司案（1996）中，第七巡回法院在判决词中写道：“任何就业歧视案件的中心问题都是，假如雇员除属于不同的种族（或有不同的年龄、性别、宗教、出身国等）外，在其他的一切方面都一样，那么雇主是否会采取同样的行动。”这个定义清楚地表达了这样一种观点：我们必须先关闭或“冻结”所有以其他变量（如录取资格、院系选择等）为介导的从性别到录取的因果路径。换言之，歧视是性别对录取结果的直接效应。
  - CZ 重点是小心混杂因子的存在
- 黛西、小猫和间接效应
  - 定义直接效应，间接效应
- 线性“仙境”中的中介
  - CZ 没看太懂
- 拥抱“假如”世界
  - 中介公式的意义
- 中介个案研究
  - “全民学代数”：一套方案和它的副作用
  - 吸烟基因：中介与干预
    - [[Ronald Fisher]] 这位大神当初的假设居然被一定程度地确认了
  - 止血带：隐藏的谬误
    - 收集到的数据不够全面，只能报告无效的结果，不过加上了自己科学的直觉猜想
第十章：大数据，人工智能和大问题
- 本书的第十章将通过追溯我本人转向因果研究领域的起始地带领读者走向尾声。正是这个问题，即人类智能的自动化（有时也被称为“强人工智能”是否可能）引导我开始研究因果关系的。我相信因果推理对智能机器至关重要，它可以让智能机器使用我们的语言与我们交流策略、实验、解释、理论乃至遗憾、责任、自由意志和义务，并最终让智能机器做出自己的道德决策。
- All the impressive achievements of deep learning amount to just curve fitting.
- 因果模型与“大数据”
  - 可迁移性
- 强人工智能和自由意志
  - 但我至少可以说，我个人不喜欢模糊的系统，这就是我不研究此类系统的原因。
致谢
参考文献
如果能用一句话来概括本书的内容，那就是“你比你的数据更聪明”。数据不了解因果，而人类了解。我希望因果推断这门新科学能让我们更好地理解我们是如何做到这件事的，因为除了自我模拟，我们没有更好的方法来了解人类自身了。与此同时，在计算机时代，这种新的理解也有望被应用于增强人类自身的因果直觉，从而让我们更好地读懂数据，无论是大数据还是小数据。

Reference #

[[重读The Book of Why]]
关于因果的文章，统计之都还有系列文章 [[因果推断系列文章-COSX]]
[[孙嘉龙]]的读后感
图灵奖得主 Judea Pearl：机器学习是有局限的，AI 已经分化了 https://www.leiphone.com/news/201805/7Afa6yJ7gvwGGKRS.html