认知语义学强调词语的日常感知意义的描写,但传统的人工描写方式存在搜集难度大、主观性过强两大困难。本文基于互联网数据,利用知网收录的51020个名词、27901个动词和12252个形容词自动采集词语的认知属性,得到120多万条原始记录。对这些结果按词类进行详细的频率统计和数据分析,构建了6000多词条的汉语常用词语的认知属性库,尝试了夸张和反讽的自动生成。该研究可应用于计算机理解和生成修辞表达、语言教学、词典编纂和机器翻译等领域。