为了简化用户查阅汽车说明书的流程,设计了针对中文汽车说明书的问答系统(CM-QA),包括以下3个问题:1)如何充分利用文档信息表示文档;2)领域词汇的分词和复述问题;3)正负样本不均衡。为了解决上述问题,结合卷积神经网络和双向长短时记忆网络对文本建模,手工构建领域词的复述词典,并使用字向量替代词向量。最后,尝试将模型转换为基于Pairwise思想的排序模型和扩展正例两种训练策略来解决正负样本不均衡的问题。在800条人工标注的问题上对系统进行了测试,其准确率达到了93.07%。