摘要

众所周知,通过组织构建汉英双语语料库,实现双语语料库在统计的机器翻译系统中的应用,并实现纳-汉之间的双语对照翻译系统,较好地提高翻译的准确性和可读性,进而推动中国文化走出去,对于外国文化我们也可以取其精华,去其糟泊。然而,汉语属于汉藏语系,英语属于欧洲语系,两种语言之间有着很大的不同。一个简单例子汉语是没有空格的,而英语每个单词直接是必须有空格的。就语言体系方面而言,汉英不属于一个体系。所以不论是逻辑,造词,还是结构,都有着很大的不同,这就导致在预料库对齐方面需要用不同的方法,。因此,用于汉英语系的对齐模式,对齐方式明显不能套用适合欧洲语系的对齐方法。不同的语言有着不同的对齐方式。本文旨在用Paraconc demo为我们建立小型汉英平行语料库提供一种对齐方式。