首页

在线投稿

在线选题

学者主页

学术机构

互知阅读

教研活动

开通VIP

登陆

浏览历史> 收藏> 个人中心>

全部

期刊

文献

标题

作者

单位

摘要

关键词

栏目

基金

文献检索

高级检索期刊导航

包含全部检索词

包含精确检索词

包含至少一个检索词

作者

出版物

发表时间

-

一种利用CNN-BiGRU和多头注意力的语音分离技术

王振中 高勇
四川大学

针对基线单通道深度聚类语音分离算法分离准确率低的问题，提出了一种基于卷积神经网络级联双向门控循环网络（Convolutional Neural Network Cascades Bidirectional Gated Recurrent Network,CNN-BiGRU）和多头自注意力机制的深度聚类语音分离算法。该算法首先利用CNN-BiGRU挖掘语音的局部空间信息以及捕获语音信号中的时间特征，以实现时间建模；其次通过多头自注意力机制关注对语音分离更重要的全局特征，同时训练过程中使用一种局部线性可控的激活函数，即改进的双曲正切函数（Etanh）；最后在分离阶段，利用高斯混合聚类算法（Gaussian Mixture Model,GMM）对混合语音信号进行分离。实验结果表明，相比于基线的深度聚类语音分离模型，所提算法在客观指标上有明显提高，主观听感上清晰度和可懂度较好。

【栏　目】信息处理与传输

【分　类】工程技术

【关键词】单通道语音分离深度聚类多头自注意力机制 Etanh激活函数

【出　处】《通信技术》2022年05期第574-580页（共7页）

相关文献

利用问题激活思维——探究初中物理问题教学实效性策略

文渊·中学版

职业院校实施1+X证书的蕴意、难点及对策

文渊·高中版

上官四海：

初中物理高效课堂的构建策略研究

“双减”背景下的教师负担问题及其对策

初中地理课堂教学中开展生态文明观教育的范式研究

爱情婚姻家庭·下旬

提高初中生地理读图能力的策略研究

文渊·高中版

提升群众文化素养有效发展群众文化工作

爱情婚姻家庭·上旬

合作学习在初中音乐课堂的应用探究

文渊·高中版

基于OBE理念的网络数据库课程思政教学改革研究

文渊·高中版

李丹；高小...：

四维盆底超声在初产妇盆底功能障碍性疾病中的应用效果观察

通信技术（2022年05期）

导出/参考文献

[1]王振中，高勇. 一种利用CNN-BiGRU和多头注意力的语音分离技术[J]. 通信技术 . 2022(05): 574-580. 点击复制

点击复制

PDF在线阅读

《一种利用CNN-BiGRU和多头注意力的语音分离技术》

价格：0.00元

微信支付

支付宝支付

国家新闻出版总署

中国期刊协会

中国知网

互知教育

国家图书馆

国家版权局

中国记者网

中国文明网

中国农家书屋网

中国全民阅读网

关于我们版权公告客服中心在线咨询用户建议 PDF在线工具

Copyright © 2021-2024 全科互知 | 赣ICP备2021006197号-4 | 新出网证(赣)字20417号
赣公网安备 36012102000372号 | 赣B2-20210313 | 技术支持：道然科技

sasa

互知学术

sasa

全科互知