摘要

应用多元线性回归模型,利用《新概念》教材的难度递增分布得到其难度指数,从单词、句子、文章三个维度设置了8个评估指标。利用Python进行数据提取,得到评估指标,最后做多元线性回归,得到了一个拟合度很高的英文文本难度估计模型WSA。此外,考虑到不同的文化背景的人对于英语文本的理解难度也是不同的,引入了文化距离的概念。分析其权重,将主观性影响融入了WSA模型中,得到WSAP模型。

全文