面向真實世界的知識挖掘與知識圖譜補全研究(四):真實世界數(shù)據(jù)標(biāo)注平臺搭建及基于預(yù)訓(xùn)練語言模型的自動化抽取方法探索
摘要: 目的 探索搭建真實世界數(shù)據(jù)標(biāo)注平臺,并比較檢索增強生成式技術(shù)(retrieval augmented generation,RAG)結(jié)合大語言模型,及預(yù)訓(xùn)練語言模型的預(yù)訓(xùn)練-微調(diào)方法的真實世界數(shù)據(jù)提取效果。方法 以真實世界電子病歷數(shù)據(jù)中的膀胱癌病理記錄為例,搭建真實世界數(shù)據(jù)標(biāo)注平臺,并基于平臺標(biāo)注數(shù)據(jù)比較RAG結(jié)合GPT-3.5,及基于BERT、RoBERTa模型的預(yù)訓(xùn)練-微調(diào)... ...
(共8頁)
開通會員,享受整站包年服務(wù)