摘要

针对大型葡萄酒消费评论数据,提出语料文本类信息挖掘的量化学习建模方法。分析包括文本表达的提取、理解、组织、概念化、知识服务等与自动文本处理相关的内容;研究一种面向葡萄酒评论文本信息的量化学习模型,并把这个模型表达成受约束的数学规划一般形式,建立基于非参数估计的寻优解法。仿真结果证明,以文本类数据"品酒人描述"为输入、以离散类数据"品酒人评分"为输出标签的量化学习模型,能够给出葡萄酒等级总体分布的准确预报。