基于IBTM-TMW的信號設(shè)備故障文本聚類方法
中國鐵道科學(xué)
頁數(shù): 8 2024-11-15
摘要: 針對信號設(shè)備故障文本數(shù)據(jù)存在的長度短、專業(yè)性強及難以智能化再利用等問題,提出基于改進的詞對主題模型和詞向量融合(IBTM-TMW)的信號設(shè)備故障文本聚類方法。首先,為減少數(shù)據(jù)噪音,提升數(shù)據(jù)質(zhì)量,在數(shù)據(jù)預(yù)處理過程中引入自建詞典和保留動名詞處理;其次,在詞對的吉布斯采樣建模過程中引入詞的差異性重要度作為加權(quán)因素,利用改進的詞對主題模型(IBTM)提升文本主題特征的學(xué)習(xí)能力,并將詞頻... (共8頁)
故障診斷主題模型詞向量權(quán)重文本聚類
開通會員,享受整站包年服務(wù)