摘要

随着互联网上数据量的快速增长,数据关联分析显得越来越重要。为适应复杂异构数据的分析,本文基于开放本体识别互联网上文档中的各类实体,并加以标注使之具有语义,得到与主题相关的命名实体识别。随后挖掘命名实体的关联关系,丰富其中的语义。通过研究,命名实体减少了数据挖掘输入数据量的数目,结合Apriori经典算法,可以挖掘出更加感兴趣、有意义的关联规则,使人们在海量数据中挖的阅读更加高效快速、更容易把握主题,并强化了搜索功能。

  • 单位
    天津广播电视大学

全文