1 什么是休谟问题
归纳法是由一系列具体的事实概括出一般原理的方法。如何归纳呢?这就没有什么固定的方法了。我们看看几个例子。
如果迄今为止我们看到的每一只天鹅都是白的,可以归纳出“所有的天鹅都是白的”。我们看到迄今为止每天太阳都从东方升起,归纳出“太阳从东方升起”这个命题。
白天鹅的例子也是哲学界的经典例子。大家也都知道,因为后来在澳洲发现了黑天鹅,所以归纳出来的命题不对。
这就暴露出归纳法的一个问题:归纳法并不能保证归纳出来的一般命题是正确的。 这是因为归纳所依据的特例总是有限个,无法上升到一般的规律。无论以前观察到多少只白天鹅,都不能得出“所有的天鹅都是白色”的一般结论。这就是休谟对归纳法提出的诘难。
休谟声称没有什么正确的逻辑论证容许我们确认“那些我们不曾经验过的事例类似我们经验过的事例”。因此,“即使观察到对象时常或经常连结之后,我们也没有理由对我们不曾经验过的对象作出任何推论”。
休谟接着说,“我要重复我的问题,为什么我们可以从这条经验对那些我们不曾经验过的不属于以往事例的事情作出结论呢?”换句话说,企图靠诉诸经验为归纳法找根据,必然导致无穷倒退。结果是,“我们可以说理论决不能从观察陈述推演出来,也不能靠观察陈述为理论寻找理性论证”。
“罗素的火鸡”的寓言很生动地说明了休谟问题。罗素说,有一只火鸡,农夫每天来给它喂食。这是一只会归纳法的火鸡,在观察了两个月之后,它得出结论,“农夫来到鸡舍,我就有吃的”,之后每天的经历都在证实它的这个结论。但是有一天,农夫来到鸡舍,没有带来食物,而是拿着一把刀把它给宰了,因为这天是圣诞节。
与归纳法紧密相连的是因果律。因果律是哲学,科学,佛学和日常生活当中广泛使用的一个名词。但什么是因果律,并没有一个公认的定义。比如说,
定义: 在一个场景中,一个事件先发生,接着另外一件事情发生,多次循环,我们就称先发生的事件为因,后发生的事件为果。
休谟首先对按照这样定义的因果律产生了质疑,认为我们无从得知因果之间的关系,只能得知某些事物总是会连结在一起,而这些事物在过去的经验里又是从不曾分开过的。也就是说,我们所认为的因果关系是通过我们的这种习惯性联想形成的,是一种心理上的习惯。这样的话,这种事物之间的因果作用就是主观作用,不是客观作用,因而它不是一种客观规律。
休谟对于因果律的怀疑,是和他对归纳法的怀疑紧密联系的。把总是先后发生的两件事上升到因果律,而因果律是一个普遍必然性规律,这就需要归纳。休谟怀疑归纳法的合法性,当然也就质疑因果律的存在。
2 历史上对休谟问题的回应对于休谟问题,哲学史上有三类解决方法。
康德在《未来形而上学导论》这部书的序言中说:“我坦率地承认,就是休谟的提示在多年以前首先打破了我独断论的迷梦,并且在我对思辨哲学的研究上给了我一个完全不同的方向。”
为了解决休谟归纳问题,康德另辟蹊径,将传统的思路颠倒了过来,提出认识的过程不是主观符合客观的过程,而是客观去符合主观的过程。康德宣称,“人为自然立法”,并自称为 “哲学中的哥白尼式的革命”。
如何实现这一转变呢?康德说,人类有自己的认识框架,我们把接受的感觉经验以符合我们这一框架的结构呈现出来。
如果做一个比喻,这个认识框架就像是一副有色眼镜,客观世界经过这个眼镜之后才被人感觉到。我们看到的,是客观世界经过有色眼镜之后的现象界,而这个客观世界,在康德的话语体系里面叫做“物自体”,是不可知的。
康德承认物自体的存在,物自体为认识提供各种感性材料。但感性材料本身只是一种“杂多”,是纷乱无章的。这些感性的杂多,通过知性的认知框架得到综合,形成可以认识的表象世界。这个认知框架被称为“先验预设”,这其中就包括了时空观,以及十二范畴。
按照康德的观点,时间和空间,不再是实体存在的方式,而是人认识世界的方式。而被休谟所质疑的因果性,在康德这里成了先天的,因此也是普遍必然的,就避开了休谟的诘问。但是,如果通过归纳法都不能得出因果律,康德把因果律作为先天范畴而直接给予认定,就显得更粗暴了。
卡尔纳普是逻辑实证主义的主要代表人物,他试图用概率与休谟问题达成某种妥协。卡尔纳普区分了两种概率,其中概率1,也叫确证度,是他的核心概念,定义为证据e对假设h的确证程度,或者逻辑概率。而概率2是频率概率。
频率概率是赖欣巴哈提出的概念:在一个随机试验当中,如果总共的实验次数是N,而N(A)是事件A发生的次数,则A事件的概率为:
我们在这里就不详述卡尔纳普的确信度理论了。这个理论尽管一度非常被看好,但是也遭到了激烈的反对。这个理论当可以推导出全称命题的确信度为零的结论,这直接和经验相对立,卡尔纳普本人也承认这一点。大家也可以注意到,确信度的定义也是模糊不清的。所以卡尔纳普的理论被放弃了。
卡尔.波普尔是逻辑实证主义的坚定反对者,也是证伪主义的提出人。波普尔在其思想自传《无穷的探索》中声称,正是他“扼杀了逻辑实证主义”。虽然他不是有意的,但还是要对这个重要哲学流派的破产“负有责任”。
波普提出以“可证伪性”作为科学与非科学陈述的划界标准。在波普看来,所有的科学都只是一种猜测和假说,它们不会被最终证实,但却会被随时证伪。
象“所有的天鹅都是白色的”这样的命题,并不是归纳得到的,而是一种假说。 如果迄今为止看到的所有天鹅都是白的,那么就暂时接受这种假说。一旦发现了一只黑天鹅,那么这个命题就被证伪了。
从逻辑上说,如果能从理论H推导出具体可观察的命题E,证实主义是认为如果E正确,那么H正确,这在逻辑上犯了肯定后件的错误。而证伪主义的逻辑是,如果E错误则H错误,这是正确的逻辑。
从这点上看,证伪主义在逻辑上是严密的,所以获得了广泛的影响力。“科学只能被证伪,不能被证实”,已经成了一种教条。
然而,证伪主义也存在问题,最主要的反对来自于奎因的整体主义。整体主义认为经验并不能证伪理论。科学家设计一个实验去验证一个科学理论,需要用到很多的实验设备,这些实验设备本身就包含有一套理论。比如说,观察行星的轨迹需要用到望远镜,这里面就有光学理论。在波普那里,这些实验所用到的理论是作为背景知识,假定是正确的。而在奎因看来,背景知识是可错的,如果实验结果和理论的预测不相符,并不一定证伪理论,也许是实验设备出了问题。所以无法用实验去证伪一个理论。
除了来自整体主义的反驳,证伪理论还存在更深刻的弱点:如何证明反例是成立的?
比如说,要证伪“所有的天鹅是白色的”这个命题,只需要找到一只黑天鹅。假设我观察到了一只黑天鹅,如何保证“这是一只黑天鹅”这个命题是真的呢?这是一个需要证实的命题。
对于这个疑问,最强的辩护也只能是如此了,“我观察了那么多年,从来没有看错过,这次也不会错,这肯定是一只黑天鹅”。在这个论述当中,“这是一只黑天鹅”的正确性,需要依赖“我的感官一贯正确”这个全称命题,又需要归纳而陷入了休谟问题。
休谟问题是回避不了的,必须给予消解。
3 什么是概率?卡尔纳普采用概率的方法去消解休谟问题,方向是正确的。但是很可惜,他对概率这个基本概念的理解存在问题,这是他的理论失败的根本原因。因此,我们有必要了解一下什么是概率。
从纯数学的角度,概率论是一个公理体系。1933年,苏联数学家柯尔莫哥洛夫在他的《概率论基础》一书中,第一次给出了概率的测度论定义和一套严密的公理体系。他的公理化方法成为现代概率论的基础,使概率论成为严谨的数学分支。
但是我们就不在这里介绍这个概率的公理化定义。从操作的层面,前面介绍的赖欣巴哈从频率角度的定义就可以满足我们对概率的理解。而且,赖欣巴哈的定义也是满足概率的公理化定义。
针对概率的频率定义,会有一个疑问,当试验次数无穷多的时候,N(A)/N的极限一定存在吗?换句话说,概率一定存在吗?
当然是不一定的。比如说,我们可以设计这样的序列。一开始按照30%的可能性产生事件A,在某个时间点上,按照50%的可能性产生事件A,经过足够长的时间,使得N(A)/N为40%,然后再按照10%的可能性产生事件A,经过足够长的时间,使得N(A)/N降为30%,反复操作下去,那么N(A)/N就在30%和40%之间来回震荡,没有极限,也就是概率不存在。
虽然数学上可以设计出这样的序列,但是我们的物理世界却不是这样运行的。
我们假设物理世界是具有同一性的。我们进行随机试验的时候总是针对一个物理系统,这个系统会以一定的可能性产生事件A,这是物理系统的一个特性。如果系统的特性发生了改变,意味着物理系统的结构发生了改变。而我们认识世界的时候,只能认识保持同一性的物理世界。因此我们把概率存在作为认识世界的前提,这是事物具有同一性所要求的。
我们以罗素的火鸡作为例子。那只懂归纳法的火鸡,认为主人一来就是给它喂食的,但是到圣诞节这天却被杀了。这说明什么?说明系统发生了重大改变,由平常的日子转变到圣诞节,人的行为发生了改变。火鸡的归纳法并没有失效,它只是不知道系统发生了改变。
如果系统中存在有规律的变化,仍然可以从更大的视角看成一个系统,归纳仍然有效。比如,如果把视角换成鸡舍旁边的一只冷眼观察的母牛,它观察了很多年后,可以归纳出更加全面的结论:平常喂食,圣诞节杀鸡。如果是概率归纳,需要用到稍微复杂一点的联合概率的概念,就不详细介绍了。
如果小行星撞了地球,那么母牛的归纳结论又错了。原因还是相同的,是系统发生了变化。显然,我们不会把母牛的错误归咎于归纳法。
现代的物理学告诉我们,宇宙有开始,也有结束。 从这个意义上说,“太阳每天都会升起”在100亿年之后肯定是不对的,那个时候地球和太阳都已经不存在了。 所以,我们从根本的观念上来说,不能期望有一个永恒的真理。
我们得出一个具有普遍意义的结论,是为了指导未来的实践。为了达成这个目的,并不需要得到的结论是永恒正确和绝对正确的,只需要在一段时间内,以非常高的可信度正确就可以了。
如果假设我们认识的对象在一定的时间内具有同一性,那么归纳针对这样的系统来说就是有意义的。实际上,我们在生活实践当中已经不自觉地采用了这样的假设,并且通过归纳得出来的结论也在无时不刻地指导我们的实践。但是,针对休谟的诘问,我们需要在理论上提供严密的论证。
要达成这样的目的,概率无疑是我们需要采用的工具,这也是卡尔纳普选择的道路,只不过是他没有走通。
采用了概率的观点之后,“所有天鹅都是白色的”这样的全称命题,用概率的形式表达为“天鹅是白色的概率是100%”。请注意,“概率为100%”,是要比“所有的都是”要弱了一点。在无穷样本的时候,“概率为100%”允许有限的例外。这对于指导实践来说已经足够了。
概率为100%只是一个特列,普通意义下,概率是0~1之间的一个实数。比如,抛硬币正面朝上的概率为50%。
在采用了概率语言之后,一个全称命题就转化为单称命题的概率。而归纳的中心任务是估计这个概率,并且对估计的准确度作出评估。
4 如何估计概率?假如做了100次随机试验,事件A出现了90次,那么事件A的概率是多少呢?
这个问题的答案对于很多人来说是显而易见的,是90%了。确实如此,数学家们的答案也是这样的。但是,多数人并不知道,这里面用了一个最优算法,叫做最大似然法。
什么意思呢? 90%这个数值,只是对实际概率的一个估计,是存在误差的。实际的概率是任何一个0~1之间的数值,都有可能出现这样的试验结果。比如说,事件A的实际概率是80%,也有可能做100次试验出现90次事件A。但是,通过数学的计算表明,当实际的概率是90%的时候,“100次试验出现90次事件A”的概率最大,所以把实际的概率估计为90%,但绝不意味着实际的概率就是90%。
最大似然法是信号处理当中最常用的一个优化算法,就不在这里做仔细的推导了,请大家相信90%确实是最大似然意义下的最优估计。
如何评价估计结果的准确性,就需要用到置信度的概念。
5 置信度与置信区间置信度是一个命题正确的概率。
比如说,我们刚才的估计结果为90%,那么“事件A的概率为90%”这个结论的置信度是多少呢? 答案是0。
为什么呢?因为实际的概率是一个实数,是数轴上一个无限小的点,估计结果正好是真值的概率当然是0。所以,在谈置信度的时候,一定有一个置信区间,当真值落在置信区间之内,则命题正确,否则命题错误。
所以,正确的问题是,“如果100次随机试验当中事件A出现了90次,事件A的概率在85%~95%之内”的置信度是多少? “85%~95%”就是置信区间。
要回答这个问题,首先需要做一个假定,在没有任何观察事实的情况下,事件A的概率是平均分布的。
也就是说,事件A的概率是0~1之间的平均分布的随机数。在这个假定之下,对于每一个可能的概率,都计算一个“100次随机试验当中事件A出现90次”的概率,那么就形成了一条曲线,置信区间曲线下的面积与整条曲线下的面积的比值,就是真值落在置信区间之内的概率,也就是置信度。
我们算一个简单的例子:基于“观察到5只天鹅全都是白色的”的事实,计算“白天鹅的概率大于90%”的置信度。这里的置信区间为“90%~100%”。
我们以0.1为间隔,在每个概率下计算“观察到5只白天鹅”的概率,也就是“一只天鹅是白色的概率”的5次方。计算结果在图 1‑1当中显示。
![]()
图 1‑1 在各种概率下计算的观察到“5只白天鹅”的概率曲线
那么可以计算“白天鹅的概率大于90%”的置信度大概为72.3%。
非常容易验证,如果观察到的白天鹅的数量增多,那么图 1‑1中的曲线会变得陡峭,“白天鹅的概率大于90%”的置信度就会提高。同样的道理,如果要求一定的置信度,随着观察到的白天鹅的数量增多,置信区间就会变窄,从而趋近于100%。
这个结论并非只是一个感觉,或者特例,而是有严格的数学定律作为保证,这就是大数定律。
大数定律是严格的数学定律,也是概率论最基础的定律,有多种表达形式。简单地说,假设在一个随机试验当中,事件A发生的概率是P。如果做N次随机实验,当N很大的时候,发生事件A的次数非常接近NP。
如果我们抛硬币,每一面朝上的概率是50%。如果抛的次数很少,比如3次,那么3次都是正面朝上还是会经常看到的。但是如果抛一万次,基本上是5000次正面,5000次反面。可能不是正好5000,但是不会差太远。理论上,如果抛的次数无穷多,那么估计得到的概率就是50%,没有误差。尽管从次数上说,正反面的次数还是会不一样,但是这个差别与无穷一比就成为零了。
有大数定律作为理论后盾,就可以保证当随机试验的次数无穷多的时候,置信区间趋向于无穷小,而置信度逼近100%。大数定律本身说的就是这件事情,所以也无需进一步证明了。
6 结论人类已经几万亿次看到太阳从东方升起了,虽然我们依然不能得到“太阳一定从东方升起”的必然结论,但是从这样的事实可以得出,“太阳以接近100%的概率从东方升起”这个命题,有接近100%的置信度。
从这个意义上说,休谟的归纳问题已经被消解了。
休谟问题是横亘在认识论当中的基础问题。康德和波普尔无力解决这个问题,而采取了回避的态度,但是最终无法回避。卡尔纳普的概率方案是一个伟大的尝试,本文所实现的,正是卡尔纳普试图达到的目标。
三百年来,休谟问题始终是科学上空的一朵乌云。由于它的存在,科学被降级为“只能被证伪,不能被证实”的地位。休谟问题解决之后,科学从概率意义上可被证实了,科学也从此有了牢固的基础,具有了被称为真理的合法性。