摘要
古诗伴随着中华文化的历史进程不断发展,有着数千年的灿烂历史,古诗将丰富的情感、有内涵的灵魂和生动的形式完美结合,表现出了中华民族语言的力量."自然语言处理是人工智能皇冠上的明珠",用机器生成语言是机器智慧的核心体现,对机器的语言进行测试是图灵测试的重要内容,用机器生成的中国古代诗词已经可以初步通过图灵测试,在普通人面前得以瞒天过海.本文提出了"镜像图灵测试"框架,其主要设计思想是将图灵测试中的测试者由人更换为计算机,要求测试者在图灵测试的同等条件下对被测试的人和计算机进行识别,若测试计算机不能完成对被测试者的识别,则认为被测试的机器通过了镜像图灵测试.本文以机器生成的古诗和诗人创作的古诗为测试对象,以经过LDA主题模型调节的融合自注意力机制和切片LSTM网络的模型为测试机,设计了镜像图灵测试实验.实验将古诗分为写景、抒情以及爱国诗三类,为每类诗歌构建了 8组数据集,共8万句古诗,采用了4种模型对24组数据集进行测试,利用测试机判别诗歌来自诗人还是机器,识别结果可达80%左右,实验结果显示,镜像图灵测试机可以对机器生成的诗歌进行识别,即机器生成的通过了图灵测试的诗歌并没有通过镜像图灵测试,说明了诗歌作为人类语言文明的结晶,是人脑情感最突出的反应,是诗人全身心的投入后的灵魂映射,在一定意义上是图灵可测的,即如果存在图灵可测的不完备性,那么诗歌这个人类语言的精华所在,就是突破这个图灵不完备性的关隘.本文提出的镜像图灵测试框架为后续图灵测试的研究提供了新的思路与方向.
-
单位中国人民大学; 北京大学王选计算机研究所