摘要

本发明公开了一种语义和知识扩展主题模型的网络媒体事件的类别检测方法,其步骤包括:1、扩展一个有监督主题模型(MedLDA),在一个统一的模型中共同建模网络媒体事件的多模态数据以及标签信息;2、网络媒体事件的多模态数据共享一个主题空间,并通过词性标注技术引入内部语义,通过扩展一个知识模态引入外部语义。本发明通过引入网络媒体事件的内部语义和外部知识,有效挖掘出网络媒体事件中的语义单词,学习到具有可解释性的优质主题,以实现准确高效的规模多模态网络媒体事件类别检测。