基于雙通道特征融合網(wǎng)絡的語音情感識別
聲學技術
頁數(shù): 8 2024-12-15
摘要: 針對語音情感識別中判別性的情感特征提取難題,結合卷積神經(jīng)網(wǎng)絡和視覺transformer網(wǎng)絡結構,提出一種雙通道特征融合的語音表征方法。使用基于倒瓶頸結構的卷積模塊通道,并引入類transformer訓練策略提取局部頻譜特征,通過改進視覺transformer提取全局序列特征,利用卷積神經(jīng)網(wǎng)絡直接提取整個語譜圖代替分塊部分,更好地提取時序信息,將提取到的特征信息進行融合,能夠獲... (共8頁)
開通會員,享受整站包年服務