通信人家园

标题: 谷歌开源扬声器Diarization AI技术 [查看完整版帖子] [打印本页]

时间: 2018-11-27 10:22

作者: 醉酒撩诗仙 标题: 谷歌开源扬声器Diarization AI技术

近日，谷歌AI研究部门的研究者发表论文《Fully Supervised Speaker Diarization》，该论文开源了他们的扬声器分类技术，它能以92%的准确率识别出每个人声音的专属模式。Google 研究人员的新方法是通过递归神经网络（RNN）模拟说话者的输入，只要开始发言，每个说话者都会建立一个属于他的 RNN 模型，然后在过程中，不断更新相应的RNN状态。

通信人家园 (https://www.txrjy.com/)