摘要

提出了一种轻量级的Web站内检索系统及相关实现技术,给出了该系统的结构和相关实现细节,包括网页的获取、Web页面的分词和相似度的计算等.可以为指定的Web网站提供服务,根据关键字检索该网站内的相关网页.实验表明该系统性能良好,大大提高了用户信息获取的效率.