无需进行滤波后处理,利用循环推断算法实现歌唱语音分离
无需进行滤波后处理,利用循环推断算法实现歌唱语音分离
近日,来自 Fraunhofer IDMT、Tampere University of Technology 与蒙特利尔大学的 Yoshua Bengio 等人在 arXiv 上提交了一篇论文,提出跳过使用泛化维纳滤波器进行后处理的步骤,转而使用循环推断算法和稀疏变换步骤进行歌唱语音分离,效果优于之前基于深度学习的方法。这篇论文已经提交至 ICASSP 2018。
论文:Monaural Singing Voice Separation with Skip-Filtering Connecti and Recurrent Inference of Time-Frequency Mask
- 论文链接:.0147v1
- on-line demo 地址:/
- GitHub 地址:
摘要:基于深度学习的歌唱语音分离依赖于时频掩码(time-frequency masking)。在很多情况中,掩码过程(masking process)不是一个可学习的函数,也无法封装进深度学习优化中。这造成的结果就是,大部分现有方法依赖于使用泛化维纳滤波器(generalized Wiener filtering)进行后处理。我们的研究提出一种方法,在训练过程中学习和优化源依赖掩码(source-dependent mask),无需上述后处理步骤。我们引入了一种循环推断算法、一种稀疏变换步骤用于改善掩码生成流程,以及一个学得的去噪滤波器。实验结果证明,与之前单声道歌唱语音分离的顶尖方法相比,该方法使信号失真比(signal to distortion ratio)提高了 0.49 dB,信号干扰比(signal interference ratio)提高了 0.0 dB。
图 1:方法图示。
表 1:几种方法的中值信号失真比(SDR)和信号干扰比(SIR)(单位为 dB)。下划线为我们提出的方法。值越高效果越好。
本论文中,Bengio 等人展示了一种用于歌唱语音分离的方法,无需使用泛化维纳滤波器进行后处理。研究人员向跳过滤波的连接 [12] 引入了稀疏变换,效果优于使用泛化维纳滤波器的方法。此外,实验证明引入的循环推断算法(recurrent inference algorithm)在单声道语音分离中取得了顶尖的结果。实验结果证明这些扩展优于之前用于歌唱语音分离的深度学习方法。
#感谢您对电脑配置推荐网 - 最新i3 i5 i7组装电脑配置单推荐报价格的认可,转载请说明来源于"电脑配置推荐网 - 最新i3 i5 i7组装电脑配置单推荐报价格
下一篇:mysql慢查询设置无线
推荐阅读
留言与评论(共有 17 条评论) |
本站网友 离殇情 | 25分钟前 发表 |
研究人员向跳过滤波的连接 [12] 引入了稀疏变换,效果优于使用泛化维纳滤波器的方法 | |
本站网友 严森 | 22分钟前 发表 |
在很多情况中,掩码过程(masking process)不是一个可学习的函数,也无法封装进深度学习优化中 | |
本站网友 眨眼睛 | 18分钟前 发表 |
研究人员向跳过滤波的连接 [12] 引入了稀疏变换,效果优于使用泛化维纳滤波器的方法 | |
本站网友 南二环二手房 | 15分钟前 发表 |
表 1:几种方法的中值信号失真比(SDR)和信号干扰比(SIR)(单位为 dB) | |
本站网友 梅河口酒店 | 20分钟前 发表 |
Tampere University of Technology 与蒙特利尔大学的 Yoshua Bengio 等人在 arXiv 上提交了一篇论文,提出跳过使用泛化维纳滤波器进行后处理的步骤,转而使用循环推断算法和稀疏变换步骤进行歌唱语音分离,效果优于之前基于深度学习的方法 | |
本站网友 脚部经络图 | 21分钟前 发表 |
本站网友 园山风景区 | 22分钟前 发表 |
表 1:几种方法的中值信号失真比(SDR)和信号干扰比(SIR)(单位为 dB) | |
本站网友 牛皮癣广告 | 5分钟前 发表 |
利用循环推断算法实现歌唱语音分离 近日,来自 Fraunhofer IDMT | |
本站网友 最新个人所得税税率 | 29分钟前 发表 |
实验结果证明,与之前单声道歌唱语音分离的顶尖方法相比,该方法使信号失真比(signal to distortion ratio)提高了 0.49 dB,信号干扰比(signal interference ratio)提高了 0.0 dB | |
本站网友 李贵斌 | 4分钟前 发表 |
论文:Monaural Singing Voice Separation with Skip-Filtering Connecti and Recurrent Inference of Time-Frequency Mask 论文链接:.0147v1 on-line demo 地址:/ GitHub 地址: 摘要:基于深度学习的歌唱语音分离依赖于时频掩码(time-frequency masking) | |
本站网友 南昌恒大名都 | 20分钟前 发表 |
本站网友 顺城 | 20分钟前 发表 |
下划线为我们提出的方法 | |
本站网友 初中女生的胸 | 10分钟前 发表 |
实验结果证明这些扩展优于之前用于歌唱语音分离的深度学习方法 | |
本站网友 国际现货黄金开户 | 24分钟前 发表 |
Tampere University of Technology 与蒙特利尔大学的 Yoshua Bengio 等人在 arXiv 上提交了一篇论文,提出跳过使用泛化维纳滤波器进行后处理的步骤,转而使用循环推断算法和稀疏变换步骤进行歌唱语音分离,效果优于之前基于深度学习的方法 | |
本站网友 找装修队 | 11分钟前 发表 |
本站网友 16种降血糖的蔬菜 | 5分钟前 发表 |
值越高效果越好 |