摘要
分析最新国外规范与CTCS系统规范之间的差异,有助于推动CTCS系统需求规范的完善和后续相关规范的修订。本文以ETCS和CTCS两种跨语言的系统需求规范对比为研究对象,提出基于双语LDA的差异性比对方法。利用双语LDA模型,将两种系统需求规范文档映射到同一个需求向量空间,再分别获得两种规范的词语-需求分布以及需求-文档分布。结合TFIDF方法为每类需求和词语分配不同权重,然后利用余弦相似度算法,获取两种规范文档的相似度。选取规范中的部分文档进行实验测试,结果表明:该方法可以计算两种规范之间的相似度,解决了目前人工分析规范间差异性的繁琐问题,可以在实际工作中加以应用。
- 单位