AG旗舰厅-官网

040-962815194

在线客服| 微信关注
当前位置: 首页 > 企业新闻

谷歌开发全新监督学习模型区分讲话者声音,准确率达92.4%-AG旗舰厅官网


本文摘要:(公共编号:)新闻将多人声音的声音流分为与每个人相关的同类段落的过程,是声音识别系统的最重要部分。

AG旗舰厅官网

(公共编号:)新闻将多人声音的声音流分为与每个人相关的同类段落的过程,是声音识别系统的最重要部分。通过解决问题谁在说话的问题,区分说话者的能力可以应用于医疗对话和视频字幕等最重要的场景。

这个过程对人类来说非常简单,但对计算机来说几乎不同,为了选择每个人的声音,必须训练先进设备的机械学习算法,监督自学方法训练这些系统非常具有挑战性。谷歌人工智能研究科学家ChongWang在博客文章中表示,他们最近开发了一种叫做只有监督演讲者区分的新模式,该模式试图以更有效的方式使用不受监督的演讲者标签。这里的唯一意味着说话者区分系统中的所有模块,包括统计数据说话者的数量,以免受监督的方式进行训练,从减少可用的标记数据量中获利。

与标准监督区分任务不同,强有力的区分模式必须将新个体与不参加培训的不同语音段相关联。这大大允许了在线和在线区分系统的质量,在线系统一般不会受到更多影响。因为必须动态服务公司的结果。

在NISTSRE2000。在CALLHOME标准测试中,该系统的DER(DiarizationError)低至7.6%,高于以前基于聚合方法的8.8%,基于DNN映射方法的9.9%。此外,该系统基于在线解码,特别是动态应用。

为了加快这个方向的更好的研究,谷歌自由选择了开源核心算法。聚类和交叠式RNN现代演讲者的区别系统一般基于聚类算法,如k平均值或序列聚类。

AG旗舰厅

这些聚类方法没有监督,不能充分利用数据中可用的监督演讲者标签。在线分类算法一般用于具有流动音频输出的动态区分质量。

(记录1:k平均分类是矢量分析方法,最初来自信号处理,是数据挖掘中分类分析的常用方法。k平均分类的目的是将n个观测值分为k个分类,其中各观测值属于最近平均分类,作为分类的原型。(记录2:序列分类技术利用数据相似矩阵的序列(特征值)展开降低维度,以更小的维度分类,以相似矩阵为输出,数据集中在各对点的相似性定量评价中。

谷歌的新模型和罕见的聚类算法的重要区别在于,所有演讲者的映射都是通过参数共享RNN建模的,不同的RNN状态在时域内重叠区分的演讲者。为了理解其工作原理,谷歌制作了以下例子。

其中有绿、朱、粉、蓝四种可能的演讲者,各演讲者以自己的RNN例子(在所有演讲者之间共享的公共初期状态)开始,在等价来自该演讲者的新映射的情况下维持改版RNN状态。在例子中,蓝色演讲者不断更新RNN状态,直到另一个演讲者变黄为止。蓝色几天后,RNN状态将完全恢复。

(这只是右图中语音段y7的可能性之一,如果新的演讲者变绿,就以新的RNN例开始。)将演讲者反应为RNN状态,使模型自学用于RNN参数与不同演讲者与演讲者共享的高级科学知识,确保了更好地标记数据的可用性。

相比之下,罕见的聚类算法始终是独立国家处置每一个分离词,从大量标记数据中获益无穷。所有这些结果都可以通过等价时间标记的演讲者标签(也就是告诉谁什么时候说话),用标准的随机梯度提高算法训练模型,训练的模型可以区分没有听说过的演讲者的新话。另外,用于在线解码,更适合延迟脆弱的应用程序。(记录3:随机梯度上升算法也称为增量梯度上升算法,是优化微目标函数的递归方法,是梯度上升优化的随机近似。

之所以被称为随机,是因为样本是随机自由选择(或混洗)而不是单组(如标准梯度上升),或者根据训练集中在经常出现的顺序自由选择。)未来工作的ConstellationRearch分析师HolgerMueller应对,人类的说话速度比打字速度慢,声音是更自然的输入方法。在喧闹的环境中很难进行语音识别,尤其是当许多人说话时。HolgerMueller说:这个领域的任何进展都会进一步推进语音交互的应用,谷歌这个系统的频繁出现可能会超越用户和智能设备的对话。

尽管已经通过该系统获得了令人印象深刻的性能,但谷歌仍在继续改进该模型,希望综合上下信息,继续实施离线解码,进一步减少DER,使延迟不脆弱的应用更加简单。其次,谷歌需要模拟声学特征,而不是d向量,而是通过终端到终端训练整个演讲者的区别系统。与此同时,ChongWang的团队还要求开源新算法,并获得GitHub,以便其他人参与做出贡献。

AG旗舰厅官网

原始文章允许禁止发布。下一篇文章发表了注意事项。


本文关键词:AG旗舰厅,AG旗舰厅官网

本文来源:AG旗舰厅-www.bfzynz.com

客户案例Customer case
  • 菲佣“内地月薪1.3万”在香港引担忧:AG旗舰厅
  • AG旗舰厅|六大原因解析A股为何大跌
  • 2018年中国企业信用500强榜单 医药行业共有27家企业上榜_AG旗舰厅官网
  • 收评:两市超千股跌停 沪指跌6.15%失守3800点_AG旗舰厅官网
  • 2007年一季度我国主要商业银行不良贷款率为7.02%
  • 2014年一季度携程交通票务、住宿、旅游等财务业绩均大幅上涨
  • 16家上市银行揭秘:平均付息负债成本今年将破3%|AG旗舰厅官网
  • 股市连续暴跌引股权质押强平风险【AG旗舰厅】
  • AG旗舰厅官网_评论:降低银行服务收费不能“只堵不疏”
  • 生活垃圾分类正加速推进 或将打开百亿市场空间