摘要
目的当前生物文献挖掘工作的重心是改进各挖掘模块性能,以提升挖掘结果的可信度,但有很大比例的挖掘结果其文献证据很少,为此本文提出一个利用Bing搜索引擎从海量Web数据中为文献挖掘得到的生物实体关联对提供补充证据的工具系统。方法利用现有文本挖掘技术从PubMed文献中挖掘一批生物实体关联对,引入Bing Web搜索模块,以生物实体名作为关键词从Web中利用Bing开放搜索API得到一批搜索结果,将这些结果整理成新的数据源,最终从该新的数据源中挖掘得到一批来自Web的补充证据。结果本系统(http://bioinfo. ustc. edu. cn/NetRD)对文献证据较少的生物实体关联对提供了有效的补充证据支持,丰富了文献挖掘结果最终的证据集。结论以Web数据作为补充数据源,能够有效地为文献证据很少的生物实体对提供证据补充,为相关研究者确认两个生物实体之间的关联提供重要参考。
- 单位