摘要

针对甲骨卜辞数据,提出一种基于对称非负矩阵分解的无监督文本聚类方法,根据卜辞之间的同文关系构建卜辞邻接网络,并将其作为约束信息引入到目标函数中,使得语义上相关的卜辞能够在分解的低维子空间中也互相靠近。引入潜在的卜辞语义网络与利用相似性计算获得的卜辞相似性网络之间的差异,避免将后者直接用作对称非负矩阵分解输入的做法。该模型能够充分挖掘卜辞中潜在的语义信息。试验结果表明,该方法能够快速、有效地对卜辞文本进行主题聚类和辅助甲骨文考释研究。