摘要
业务过程是过程管理的重要研究对象,一个好的过程模型对企业变革、组织赋能、优化运营等具有重要意义。现有的自动化过程模型发现主要通过过程挖掘算法进行获取,但过程挖掘算法的实施主要依赖于业务执行时所产生的事件日志。为打破现有过程挖掘算法在日志缺失时带来的局限性,提出一种新颖的从过程描述中自动化深度生成业务过程模型方法。方法首先对现有命名实体方法进行改进,通过BERT+BiLSTM+CRF来构建命名实体识别模型,提出面向业务过程的活动实体识别方法;其次将语言模型从句子级别扩展到文档级别,提出一种通过递归体系结构有序神经网络(ON-LSTM)来无监督的发现过程描述文档中所蕴含活动实体间潜在的层次结构;最后通过活动实体的层次深度原则,将层次结构树转化为业务过程模型。通过对人工采集与标注的150个真实的SAP产品用户指南文本作为训练数据进行实验,采用K折交叉验证思想,对数据进行多次分组实验。最终活动实体模型的识别的平均准确率为88.5%,业务过程模型生成的平均准确率达到73.2%。通过对40个文本与所对应的过程模型准确率进行统计发现,模型的准确率与活动实体的数量呈反比,在含有6-15个活动实体时所生成的过程模型准确率最高。
- 单位