摘要
本发明公开了一种结合语音与文本的多情感识别方法、系统、介质及设备,方法包括获取由多个音频段组成的目标音频,并使用语音识别技术转换为对应的多个文本信息;基于音频信息的语音特征获得音频情感识别信息,基于文本信息的文本特征获得文本情感识别信息;使用新的结合方法将这两种识别情感进行结合,获得对应音频段的目标情感信息。该新的结合方法为基于语音识别情感向量与文本识别情感向量,通过对这两种向量内不同情感信息进行不同的组合,再使用这些不同的组合进行情感结合模型的训练。本发明使用语音与文本的识别情感向量,从而保证语音情感分析与文本情感分析部分互相独立,既能够解决两极情感分析问题,也能够应用到多情感分析的场景。
- 单位