噪聲環(huán)境下基于注意力的時(shí)域語(yǔ)音分離方法
摘要: 目前,基于深度學(xué)習(xí)的時(shí)域單通道語(yǔ)音分離模型在無(wú)噪聲場(chǎng)景下取得了顯著的成效。然而,在含噪場(chǎng)景下,這些模型的編碼器會(huì)將噪聲特征誤認(rèn)為是源語(yǔ)音特征,影響掩碼估計(jì)的準(zhǔn)確性,導(dǎo)致分離性能不理想。針對(duì)此問(wèn)題,提出一種基于注意力機(jī)制的時(shí)域語(yǔ)音分離模型,來(lái)降低噪聲對(duì)語(yǔ)音分離任務(wù)的影響。具體地,考慮到時(shí)域編碼器輸出特征的各通道重要性差異,提出在編碼器內(nèi)部嵌入一個(gè)高效通道注意力(Efficient... (共9頁(yè))
開(kāi)通會(huì)員,享受整站包年服務(wù)