提出了一种基于句子级对齐的双语语料库的英汉词对齐方法 .它建立在句对的集合表示形式的基础上 ,通过最小求交模型实现词对齐 .使用倒排索引表和集合运算实现高效的最小求交算法 .在对齐过程中引入高频干扰词表以提高召回率 .实验结果表明 ,该方法优于使用共现互信息的词对齐和使用双语词典的词对齐方法