通信人家园

标题: 谷歌开源扬声器Diarization AI技术  [查看完整版帖子] [打印本页]

时间:  2018-11-27 10:22
作者: 醉酒撩诗仙     标题: 谷歌开源扬声器Diarization AI技术

近日,谷歌AI研究部门的研究者发表论文《Fully Supervised Speaker Diarization》,该论文开源了他们的扬声器分类技术,它能以92%的准确率识别出每个人声音的专属模式。Google 研究人员的新方法是通过递归神经网络(RNN)模拟说话者的输入,只要开始发言,每个说话者都会建立一个属于他的 RNN 模型,然后在过程中,不断更新相应的RNN状态。







通信人家园 (https://www.txrjy.com/) Powered by C114