摘要

本发明公布了一种关系数据库数据起源收集方法,包括:根据SQL数据流起源语义定义数据起源模型;解析SQL语句,生成抽象语法树;遍历抽象语法树,提取出来源表、目标表、逻辑操作算子;根据数据起源模型对所述来源表、目标表、逻辑操作算子进行结构化描述,生成起源信息元数据。本发明可以将SQL脚本中的数据处理逻辑通过数据转换图和属性映射图进行描述,从而为关系数据库系统提供数据起源分析功能和字段影响分析功能,不仅可以实现数据脚本的解析,并且可以根据解析信息实现数据追溯及分析数据之间的影响关系。