基于LPDMR-NET的鳥鳴聲識別
計算機工程
頁數(shù): 11 2024-10-14
摘要: 為了高效且快速地識別自然環(huán)境中的鳥鳴聲,提出一種基于輕量級逐點深度的多感受野注意力殘差網(wǎng)絡(LPDMR-NET)模型。首先,通過Mel濾波器生成Mel頻譜圖。接著,采用basicblock和downblock連接生成兩層殘差網(wǎng)絡DBNet,堆疊DBNet作為鳥鳴聲識別的主干網(wǎng)絡,以提高訓練速度。然后,利用逐點深度卷積網(wǎng)絡(PDNet)提取頻譜圖特征信息,替代主干網(wǎng)絡下采樣模塊,... (共11頁)
開通會員,享受整站包年服務