说话人识别论文综述

2023-05-07 18:18:29 68 views

说话人识别论文综述

问：为何PLDA面对神经网络依然坚挺？

答：有最好的模型，只有最合适的模型。我记得以前实验室有个学弟问我“深度学习这么好用，我们只用学深度学习就好了，为啥还要学其他诸如svm、隐马尔科夫、gmm这些传统机器学习模型”。每个特定任务都有对应最合适的模型，就跟找对象一样，萝卜白菜各有所爱。所谓最合适就是这个任务最符合哪个模型的assumption。深度学习也有自己的assumption。如果你的任务是一个线性分类，放着成熟的svm和lr不用，非要搞个dnn，那岂不是得不偿失，不仅得不偿失，dnn是非线性的，你用来拟合一个线性的数据，这个训练过程估计会很艰难吧。现在深度学习太火了，很多人蜂拥而上，觉得深度学习是屠龙刀，啥都可以砍两刀，甚至觉得有了深度学习，其他模型都不用学了。

问：说话人识别是什么？

答：说话人识别是指利用已知的音频、语音信息，确认说话人身份。主要分为说话人确认和说话人辨认：
说话人辨认（Automatic speaker identification）：从一群人中，确认是否有A同学讲的话；
说话人确认（Automatic speaker verification）：确认是否是A同学讲的话。
说话人识别俗称“声纹识别”，是生物识别技术中的一种，和指纹识别、虹膜识别一样，因为这些生物特征具有唯一性和稳定性，所以主要被运用在身份验证场景中。比如公安机关提取到电信诈骗案录音线索后，可以使用声纹识别技术判断是否是在逃人员或再犯人员；智能手机上使用声纹识别技术可以和指纹一样，验证解锁。
国内专门做声纹识别的厂商也很多，比如，SpeakIn。

问：求一篇人工智能行为识别的论文综述：

答：人工智能(Artificial Intelligence) ，英文缩写为AI。它是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门新的技术科学。是计算机科学的一个分支，它企图了解智能的实质，并生产出一种新的能以人类智能相似的方式做出反应的智能机器，该领域的研究包括机器人、语言识别、图像识别、自然语言处理和专家系统等。人工智能是一门极富挑战性的科学，从事这项工作的人必须懂得计算机知识，心理学和哲学。人工智能是包括十分广泛的科学，它由不同的领域组成，如机器学习，计算机视觉等等，总的说来，人工智能研究的一个主要目标是使机器能够胜任一些通常需要人类智能才能完成的复杂工作。
答：那你在网上找找（人工智能与机器人研究）吧~~看看别人的是怎么写的~
答：具/体/要/求/有/吗？

问：平安科技的声纹识别论文被哪个国际顶级会议认可？

答：平安科技声纹算法团队关于说话人聚类研究成果的论文《基于离散可变分自编码的鲁棒的说话人聚类方法》（A ROBUST SPEAKER CLUSTERING METHOD BASED ON DISCRETE TIED VARIATIONAL AUTOENCODER）近日被语音信号处理领域的顶级学术会议ICASSP接收认可。

问：【语音识别】对于同时有不同说话人语音的语音片段，如何实现识别？

答：NRK10语音识别芯片为广州九芯电子自主研发的一款高性能、低成本的离线语音识别芯片，具有语音识别及播报功能，非特定声纹，需要外挂 SPI-Flash，存储词条或者语音播内容。他具有识别率高，工业级性能、简单易用，更新词条方便等优势。广泛应用在智能家居、AI人工智能、玩具等多种领域。
答：多个人同时说话使用机器识别难度太高了。确实很难使用某种方法将不同人的语音分开。

标签:

点击进入下载PDF全文

相关文章