摘要
[目的 /意义]科技文献主题识别研究对于把握科技领域的研究重点和热点,揭示领域内的发展态势和演化趋势具有重要意义。传统科技文献主题识别研究多基于科技文献同构信息网络进行研究,难以表达科技文献系统中丰富的对象类型和复杂的语义关系。[方法 /过程]本文利用异构信息网络表达科技文献系统中各类型对象之间丰富的语义关系,并将其转化为高阶张量的形式,利用非负张量分解算法对其进行主题挖掘。[结果 /结论]实验结果表明:基于异构信息网络可以对科技文献进行更深层次的主题识别,非负张量分解算法在处理异构信息网络时方便快捷,可以减少语义信息的丢失。
- 单位