當前位置:首頁 > 科技文檔 > 電信技術 > 正文

基于雙通道特征融合網(wǎng)絡的語音情感識別

聲學技術 頁數(shù): 8 2024-12-15
摘要: 針對語音情感識別中判別性的情感特征提取難題,結合卷積神經(jīng)網(wǎng)絡和視覺transformer網(wǎng)絡結構,提出一種雙通道特征融合的語音表征方法。使用基于倒瓶頸結構的卷積模塊通道,并引入類transformer訓練策略提取局部頻譜特征,通過改進視覺transformer提取全局序列特征,利用卷積神經(jīng)網(wǎng)絡直接提取整個語譜圖代替分塊部分,更好地提取時序信息,將提取到的特征信息進行融合,能夠獲... (共8頁)

開通會員,享受整站包年服務