2017年2月,微软授予黄学东微软全球技术院士(Technical Fellow)的称号。微软全球技术院士是微软技术人员的最高荣誉,目前为止,全球仅有约二十个人获得,其中包括图灵奖得主 Butler W Lampson、Charles P. Thacker等,黄学东是首位入选华人科学家。
2020年,黄学东的微软生涯迎来巅峰:微软开始重视云计算与人工智能的结合,成立了 Azure AI 事业部。黄学东是 Azure 人工智能孵化的核心成员,从2020年开始担任 Azure AI 的全球人工智能首席技术官。萨提亚上台后,将云计算、人工智能与量子计算作为微软科技未来的三个发展方向之一,Azure AI 就承担了云计算与人工智能两块。
黄学东:微软在1992年就面试了我,但我一直没同意过来。当时我在CMU负责语音人工智能系统,获得了全美 DARPA 所有测试指标的各项第一名,而且是国防部测评历史上错误率最低的一次。微软就盯着我挖,挖了三个月,最后通知我说盖茨要见我。1993年1月,我正式开始加入微软。整整30年,微软依旧屹立不倒,这证明微软十分强大兴盛。我在微软30年也正好经历了微软 AI 的发展历程。
雷峰网:您加入微软雷德蒙研究院时,微软雷德蒙研究院有几个组?
黄学东:AI 方面只有两个组,一个是我带领的语音 AI 组,还有一个是基于规则系统设立的语言组。当时研究院的宗旨是让机器能听、能看、能学习,能像人一样工作,时至今日,微软的成果实际上已经实现了这一宗旨。
如果从历史的维度来讲述 ,IBM是做语音最早的公司 。50 年代IBM 就开始做机器翻译。70 年代 IBM 开始用语言模型( language model)进行语音研究,只是这个模型不够大,识读能力有限。后来IBM内部将做语音的方法应用用到机器翻译,改写了机器翻译的历史。所以 IBM 的语音对大模型的研究实际做出了巨大的贡献。
所谓机器翻译其实就是把你的问题翻译成你的结果。这个解释很简单,人一听就明白,也就是将过去已有事实转变为对未来的预测(history to future)。机器翻译经历了几次升级。第一次升级是IBM所带来的,机器翻译从规则方法切换到统计方法。第二次升级是微软带来的,Geoffrey Hinton 将深度学习应用到语音识别,这两者基本上是同步进行的,但应用至语音识别基本还是采用的Hidden Markov Model加上深度学习的混合体,并没有像第三次的谷歌Transformer机器翻译一样有革命性的突破。