近日,谷歌AI研究部门的研究者发表论文《Fully Supervised Speaker Diarization》,该论文开源了他们的扬声器分类技术,它能以92%的准确率识别出每个人声音的专属模式。Google 研究人员的新方法是通过递归神经网络(RNN)模拟说话者的输入,只要开始发言,每个说话者都会建立一个属于他的 RNN 模型,然后在过程中,不断更新相应的RNN状态。