基于雙通道特征融合網(wǎng)絡(luò)的語音情感識別
摘要: 針對語音情感識別中判別性的情感特征提取難題,結(jié)合卷積神經(jīng)網(wǎng)絡(luò)和視覺transformer網(wǎng)絡(luò)結(jié)構(gòu),提出一種雙通道特征融合的語音表征方法。使用基于倒瓶頸結(jié)構(gòu)的卷積模塊通道,并引入類transformer訓(xùn)練策略提取局部頻譜特征,通過改進(jìn)視覺transformer提取全局序列特征,利用卷積神經(jīng)網(wǎng)絡(luò)直接提取整個(gè)語譜圖代替分塊部分,更好地提取時(shí)序信息,將提取到的特征信息進(jìn)行融合,能夠獲... (共8頁)
開通會(huì)員,享受整站包年服務(wù)