噪聲環(huán)境下基于注意力的時(shí)域語音分離方法
南京郵電大學(xué)學(xué)報(bào)(自然科學(xué)版)
頁數(shù): 9 2024-07-01
摘要: 目前,基于深度學(xué)習(xí)的時(shí)域單通道語音分離模型在無噪聲場景下取得了顯著的成效。然而,在含噪場景下,這些模型的編碼器會(huì)將噪聲特征誤認(rèn)為是源語音特征,影響掩碼估計(jì)的準(zhǔn)確性,導(dǎo)致分離性能不理想。針對此問題,提出一種基于注意力機(jī)制的時(shí)域語音分離模型,來降低噪聲對語音分離任務(wù)的影響。具體地,考慮到時(shí)域編碼器輸出特征的各通道重要性差異,提出在編碼器內(nèi)部嵌入一個(gè)高效通道注意力(Efficient... (共9頁)
開通會(huì)員,享受整站包年服務(wù)