搭配在语言学习、辞典编撰或自然语言处理的应用中有重要价值,搭配的自动获取是自然语言计算的基本研究领域之一。利用对数似然度、卡平方和互信息作为关联强度测度,从Penn Treebank语料库中自动获取搭配候选,以比较3种测度的不同特性。实验结果表明由于3种测度遵从不同的分布假设和倾向,抽取的搭配具有不同的分布特征。