医院网站日志挖掘数据预处理的研究

蒙华; 苏静<sup>*</sup>; 李立峰; 翟玉兰

登录

免费注册

赞收藏引用

科研之友

微信

新浪微博

Facebook

分享链接

医院网站日志挖掘数据预处理的研究

作者：蒙华; 苏静^*; 李立峰; 翟玉兰

来源：重庆理工大学学报：自然科学, 2019, 33(08): 144-148.

摘要

数据预处理是数据挖掘工作的基础。以医院网站服务器用户访问日志为例,对日志挖掘的概念以及数据预处理过程进行研究。采用数据库技术和Matlab工具消除初始数据集的冗余度、复杂度,以网站页面和用户关联性为度量,得出可直接作为挖掘算法输入的相似度矩阵。重点研究了医院网站日志的用户识别以及相似度矩阵的页面聚类标准化方法。实验结果表明:该方法极大降低了初始日志数据冗余度和维度,提高了预处理结果准确性,增强了数据挖掘算法输入的信息含量。

单位
广西医科大学; 广西医科大学第一附属医院

收藏分享被引浏览

更新时间：2024-04-11 16:05

相似论文
引用论文
参考文献

产品服务

科研之友科研之友机构版科创云

站内浏览

科研成果科研人员科研机构

服务支持

帮助中心隐私政策服务条款

联系方式

在线客服：【立即咨询】客户热线：400-1616-289 电子邮箱：support@scholarmate.com

微信公众号