在进行特定主题网页信息发现与采集时,网页与主题相关性判断尤为重要,在分析主题词语义概念扩展的基础上,结合主题词在网页不同部分结构中的重要性,设计了语义分析的网页与主题相关度算法,实验分析表明该算法克服了传统词频统计法的弊端,提高了网页与主题相关性判断的准确率。