接下来,我们深入探讨一种预测式AI产品——罪犯矫正替代性制裁分析管理(Correctional Offender Management Profiling for Alternative Sanctions,简写为COMPAS)系统。COMPAS系统通过被告对137个问题的回答来评估其风险,这些问题包括与被告过去的犯罪历史或未按时出庭记录相关的内容,还涉及一些被告几乎无法控制的因素,例如他们的家庭成员犯罪的频率,或者他们的朋友或熟人是否曾犯罪。此外,还有一些问题似乎企图通过判断被告的性格或贫困情况而决定是否惩罚他们,如“你会经常感到无聊吗?”“你每隔多久就会出现仅能勉强维持生计的情况?”等。
一个典型的例子是用于招聘的 AI 系统。在美国,约 3/4 的雇主使用自动化工具来筛选求职者。这些自动化招聘工具形式多样,有些是根据简历筛选候选人,有些是通过自动化视频面试评估候选人,还有一些则要求候选人完成谜题测试。这些工具通常作为筛选流程的第一步。如果某位候选人未能通过筛选,他的简历可能会被直接剔除,甚至无人再查看。然而,这一过程完全不透明。公司不会公开其软件是如何设计的,候选人也完全不了解自己被评估的标准。
为了应对不透明的招聘 AI 系统,求职者开发了一些策略。例如,他们会在简历中刻意填充职位描述中的关键词,甚至以白色字体添加顶尖大学的名称——这样人类阅读者看不到,但计算机可以识别。在需要通过 AI 评估的视频面试中,求职者可能会刻意使用诸如“集团”之类的华丽词汇,以提高他们的评分。
这些策略是否真正有效仍不确定。为了弄清楚这一点,一组记者展开了调查,研究了一家总部位于慕尼黑的初创公司 Retorio,该公司提供基于视频面试的 AI 招聘工具。他们的发现令人惊讶,外表的简单变化,如围上一条围巾或戴上眼镜,就足以显著改变 AI 工具给出的评分。将书架或画作添加到背景中可以提高分数,而仅仅使环境光线变暗 ( 内容未变 ) 则会导致评分降低。在另一项研究中,研究人员分析了招聘过程中使用的性格测试工具发现,将简历格式从 PDF 改为纯文本,就能改变 AI 对候选人的性格评分。
这与候选人在简历中添加关键词的策略类似。他们假设过去包含这些关键词的简历可能与更好的工作表现相关。因此,他们希望通过这些关键词提高被 AI 筛选到的机会,而不至于仅仅因为缺少某些词汇或用词不够高级就被淘汰。
为了避免负面结果而采取策略性行为 (俗称投机 ) 是一种常见现象。这就像教师为了提高学生的考试成绩而专门教授应试内容,或者消费者通过申请零售信用卡或填写资格预审表,试图在不改变消费习惯的情况下提升信用评分。然而,在基于 AI 的招聘中,情况更加复杂,因为候选人通常不知道哪些行为会真正影响他们的机会。AI 招聘并未帮助候选人做出能够提升实际技能的决策,而是倾向于鼓励他们对简历和申请材料进行表面性的修改和试验。
我们并不对候选人是否应尝试这些技巧发表立场。虽然投机行为的伦理问题很有趣,但这不是我们讨论的重点。我们的关注点在于,AI 公司在声称其模型具有高准确性时,往往忽略了人们采取策略性行为对模型输出的影响。当模型的结果可以通过表面上的简单修改轻易操控时,其准确性声明自然值得怀疑。此外,不透明的模型还会对被评估者造成时间成本上的浪费。例如,当候选人试图在简历中添加无法验证的虚假资历以迎合 AI 时,他们所花费的时间完全无助于其实际能力的提升。
有缺陷的 AI 系统并未让所有人平等承担其代价,预测式 AI 的使用对那些长期处于被系统性排斥和不利地位的群体造成了不成比例的伤害。
一个典型的例子是预测谁应获得更好的医疗护理。自 2010 年《平价医疗法案》 (Affordable Care Act) 在美国通过以来,保险公司开始要求医院以更低的成本提供服务,并威胁不执行的医院将被移除。为削减开支,医院的主要策略之一是识别高风险患者,为他们提供预防性护理,以避免未来昂贵的治疗费用,如住院。为此,医院开始依赖 AI 技术。于是,数十种模型被开发出来,用于评估患者的健康风险。开发者声称,AI 可以根据患者的医疗需求对他们进行排序,将更多资源分配给被判定为高风险的患者。
然而,更高的医疗费用并不总是反映出更高的健康需求。更高的账单可能是因为患者拥有更好的保险,在医院获得了更多的时间和关照,或是因为更多次地就诊。也可能是因为这些患者能够负担更高的自付费用和拥有更高的免赔额。在美国医疗系统中长期存在的不平等,使得这一问题进一步被放大。Optum 的预测式 AI 实际上将那些已经获得更好医疗服务的群体归类为高风险,从而使他们在未来继续享有更多的医疗资源和更好的护理。
我们的观点是肯定的。在美国,企业和政府在部署有缺陷的预测式 AI 时,确实有许多出于商业利益或官僚目的的误导性理由,但其中一个关键原因是,决策者本身也是人,他们与其他人一样,害怕面对随机性。这种恐惧让他们难以接受另一种决策方式,即承认未来是无法准确预测的。这意味着他们不得不直面一种令人不安的事实,他们无法完全掌控局面,无法准确选出优秀的工作表现者,也无法比一个大多依赖随机的过程表现得更好。