摘要
为了帮助药学实现智能化,解决药学领域缺失有效的数据集的困境。本文提出了构建一个中药数据集,同时为应对数据获取过程中存在的障碍,本文提出基于Selenium构建中药数据集。值得提出的是,在数据标注过程中,本文引入一种人在环路(human-in-the-loop)的数据标注方式。本文提出一个包含6112张图片的中药识别数据集,使用这种半自动的标注模式能自动标注多达64%的数据。经过抽样检测,标注错误率仅为1.4%。
-
单位云南医药健康职业学院; 云南经济管理学院