摘要
探讨基于实体关系的文本挖掘机制,以文本挖掘为方法,辅以属性抽取、属性关系映射等方式,以上海世博新闻媒体网络版报道为例,对新闻媒体网络版这种非结构化信息进行研究。在属性抽取时结合相似度算法,使属性抽取的准确率得到提高。选取香港、台湾、境外媒体华语版、上海本地媒体对世博会相关报道进行实证分析,基于内容对报道差异进行阐述,并得出结论。研究表明,运用文本挖掘对新闻媒体文本进行分析和评价,可以挖掘出媒体报道的更多内涵,为情报分析提供思路。
-
单位上海海关学院