摘要
电子图画书具有较好的阅读便捷性和可获得性,但其阅读信息的冗杂性以及提取的复杂性无形中加大了儿童阅读的难度。在B/S架构体系上引入CNN以实现信息提取,并考虑到敏感性词汇带来的阅读困扰,以信息熵改进下的词权重实现TF-IDF算法的优化,最终完成自动化采集系统的设计。实验结果表明,改进TF-IDF算法能有效避免算法过拟合,信息识别最高准确率为92.14%,单字及词组检索的AUC值为0.958和0.971,系统延迟时间小于1.7 s。该自动化信息识别系统能在有效保证阅读信息的完整性、针对性以及交互性,极大地提高了阅读效率和质量。
-
单位咸阳职业技术学院