针对中文地名地址的复杂性和多样性,本文提出一种基于角色的中文地址标注方法,既能顾及到不同角色之间的概率,也可以对地址成分中的语素和词、词和短语之间的关系进行分析。通过这种方法建立的标注集作为自然语言标注的扩充,能为后续的地址要素相似性度量提供理论支持,也可以应用在提高地址匹配精度方面。