摘要
[目的/意义]专题情报研究中,基于不同的构造方式获得满足需求的“高价值密度”“低数据规模”的数据集,是情报研究质量与情报研究结论可靠的前提保障。[方法/过程]以军事装备与技术情报无人系统专题研究为例,采用数据特征抽取、标签统计,数据特征重合率、秩相关系数计算等方法,对专题情报研究常用的精确关键词检索、主题词集检索、限定性文献匹配三种数据集构造方式,通过分析国家、装置、主题等情报要素,考察比较不同数据集在数据分布上的差异性。[结果/结论]实验结果表明,结合具体任务场景(如处于不同研究阶段、满足工业、装备等不同视角研究),通过选择合适的数据集构造方式或在同一构造方式下调整不同检索策略,可以在情报研究的效率和质量之间获得一个更好的平衡。
- 单位