文章摘要:针对现实应用场景中短时语音和混叠有噪音情况下声纹识别准确性低的问题,本文设计了一种改进的基于深度学习的声纹识别算法,提高了声纹识别模型在短时语音和带噪环境下的鲁棒性,并将该模型部署到了嵌入式设备中。本文主要对声纹识别算法的编码层和损失函数进行改进。对于编码层,本文使用了基于差分编码的NeXtVLAD技术,同时对帧级特征中的静态声纹特征和动态声纹特征进行建模。对于损失函数,本文将基于小样本学习框架的余弦-原型损失函数cosine-Prototypical 与附加间隔分类损失函数AM-Softmax 进行融合来训练声纹识别模型,使得模型在特征空间中的同类特征尽可能集聚,异类特征尽可能分离。此外,本文还将声纹识别算法部署在Raspberry Pi平台上,实现了能快速推理的声纹识别系统。实验结果表明:这种改进的声纹识别系统在多种开放场景下,能够实时、准确地完成声纹识别任务,可以达到实际应用的要求。
文章关键词:深度学习,开放场景,短时语音,声纹识别,差分化编码,NeXtVLAD,树莓派,
项目基金:广东省青年创新人才项目(2018GkQNCX005),
论文作者:郭新1 罗程方2 邓爱文2
作者单位:1. 广东交通职业技术学院机电工程学院 2. 华南理工大学自动化科学与工程学院
论文分类号: TN912.34;TP18
相似文献:基于深度学习的小样本声纹识别方法研究.....作者:李靓,孙存威,谢凯,贺建飚,刊载期刊:《计算机工程》融合声纹信息的能量谱图在鸟类识别中的研究.....作者:杨春勇,祁宏达,彭焱秋,尹滨,侯金,舒振宇,陈少平,刊载期刊:《应用声学》
相关文章:激光雷达技术在部件级三维实景的应用.....作者:郭王人工智能在智能制造中的应用.....作者:杨磊大数据人工智能驱动图书馆知识服务和学科建设.....作者:姜爱蓉商业航天背景下的遥感应用产业化.....作者:刘东升Artificial Intelligence: Where Maybe Next Steps? “人工智能热”之后的冷静思考.....作者:Tony QiuComputational Analysis of the Voynich Manuscript 十五世纪伏尼契码的智能解析.....作者:Greg Kondrak深度强化学习系列课程第四讲.....作者:汪荣贵5G赋能,智享未来.....作者:赵海峰
文章来源:水利规划与设计 网址: http://slghysj.400nongye.com/lunwen/itemid-90368.shtml
上一篇: 建筑科学与工程论文_城市大型商业综合体空间特征提取及建成环境分析
下一篇: 农业经济论文_加快建立现代饲草产业体系 推动饲草产业高质量发展