基于詞匯增強和對抗訓練的中文命名實體識別
摘要: 針對現(xiàn)有的中文命名實體識別的方法獲取中文詞級別的特征信息效果不理想且模型易受噪音影響而存在不穩(wěn)定的問題,提出一種基于詞匯增強和對抗訓練的中文命名實體識別方法。將輸入文本通過詞匯增強模塊獲取到詞匯向量,將預訓練模型得到的字符級嵌入向量和詞匯向量進行字詞融合;使用字詞融合的嵌入向量通過MOA方式生成對抗樣本;使用BiGRU和CRF分別獲取語義編碼信息并進行解碼得到預測結(jié)果。實驗結(jié)果... (共7頁)
開通會員,享受整站包年服務(wù)