摘要
年鉴编制是高校各院系行政办公室重要职能工作之一。需要行政办公室人员对年度所发生的重要事件进行全面、准确地汇总与分类统计。年鉴编写对于记录教学科研成果以及支持决策有较重要作用。但是,存在耗费人力、专业壁垒问题。研究了网站内容自动分析方法,对网站内容进行挖掘,以自动生成年鉴条目。首先,根据高校教学、科研及专业特点,给出了内容评价指标体系的构建结果;设计了网页内容分析方法,并实现网页爬虫,进行网页内容提取;进而,在关键词评价基础上,对提取的网页内容进行分类,并按照时间形成年鉴词条推荐列表。最后,论文通过原型系统的设计,验证了该文所设计方法的可行性。
- 单位