摘要
用大数据方法对自然语言软件需求文档进行分析,基于LDA三层贝叶斯网概率主题模型,将文档建模为多个主题的混合概率分布,将每一个隐含主题建模为多个词的混合概率分布。用Gibbs采样算法估算模型的主题概率分布和词概率分布,将需求文档集合中计算出的文档主题映射为需求视点,用多视点方法分析软件需求,对分解、投影到不同子问题域的视点独立求精,系统需求转化为视点需求,集成多视点构成系统的需求规约。将文档主题的词概率分布映射为需求视点的涉众知识和需求规约知识,为需求知识复用提供了可靠依据,增强了需求分析的科学性和完备性。
- 单位