借助語音和面部圖像的雙模態(tài)情感識別
摘要: 為提升情感識別模型的準確率,解決情感特征提取不充分的問題,對語音和面部圖像的雙模態(tài)情感識別進行研究。語音模態(tài)提出一種結合通道-空間注意力機制的多分支卷積神經(jīng)網(wǎng)絡(Multi-branch Convolutional Neural Networks, MCNN)的特征提取模型,在時間、空間和局部特征維度對語音頻譜圖提取情感特征;面部圖像模態(tài)提出一種殘差混合卷積神經(jīng)網(wǎng)絡(Resid... (共11頁)
開通會員,享受整站包年服務