摘要

开源软件发展迅猛,对于开源项目来说,开源许可证的选择已然成为最为关键性的问题,考虑项目中所用开源组件的许可证兼容问题,稍有不慎就会产生多种多样的风险问题.怎样检测项目所含许可证,如何选择项目的开源许可证,项目内部许可证是否冲突.旨在解决这些问题的基础上,提出一种基于BERT模型实现文本相似度检测,辅以URL检测和AC自动机进行关键字的抓取的综合检测方法,通过多样化检测方式提高检测准确度,最后再采用有向图算法进行许可证推荐.对于许可证的检测方法,通过实验结果表明该方法相比于传统方法有更好的检测效果.对于许可证的推荐方法,实验表明该方法可以有效地检测出兼容性推荐结果.

全文