基于特征選擇與改進(jìn)的Tri-training的半監(jiān)督網(wǎng)絡(luò)流量分類
計(jì)算機(jī)工程與應(yīng)用
頁(yè)數(shù): 11 2024-02-01
摘要: 網(wǎng)絡(luò)流量分類對(duì)網(wǎng)絡(luò)管理意義重大,目前基于機(jī)器學(xué)習(xí)的流量分類方法存在標(biāo)注瓶頸、樣本不平衡的問(wèn)題。針對(duì)這兩個(gè)問(wèn)題,提出一種基于特征選擇與改進(jìn)的Tri-training算法結(jié)合的半監(jiān)督網(wǎng)絡(luò)流量分類模型。根據(jù)最大信息系數(shù)、皮爾遜系數(shù)選擇出與類高度相關(guān)但彼此不相關(guān)的特征,利用改進(jìn)的Relief F選擇出有利于少數(shù)類分類的特征,并將選擇出的特征組合成最優(yōu)特征子集緩解不平衡數(shù)據(jù)對(duì)分類的影響。... (共11頁(yè))