摘要

<正>清华大学自然语言处理实验室围绕"大规模中文词汇语义分析关键技术及其开源应用"开展研究,以面向应用的中文词汇语义分析为主要研究目标,全方位、系统性地探索了大规模中文词法语义分析所涉及的一系列核心问题,提出了"互联网自然标注资源与大规模人工标注语料库并举的中文词法分析"、"多粒度知识指导的中文词汇语义表示学习"以及"考虑复杂文档结构的中文关键词及主题标签分析"三个层面的核心技术,形成了较为完善的关键技术体系。主要包括: