摘要

随着商业广告投放数量的高速增长,对广告精准推送能力的要求也随之提高。文章利用关键词提取技术获取文章和广告的中心词汇,尝试计算文章和广告的匹配程度,为广告的智能推荐提供可行方法。运用OCR技术从图片录入广告信息,并使用Python关键词提取库提取文章和广告的关键词,最后根据余弦相似度计算文章和广告的匹配程度,将结果降序排序,输出关联程度最高的3篇广告。OCR技术能以较高的准确率将图片中的文字转换为文本,从而为用户提供了广告图片的输入接口,而关键词提取技术获取了能较好反映文本中心的词汇,最后的广告匹配算法也能从数据库中找到语义最相近的广告。智能广告推荐算法的一种可行方式为:通过OCR技术将广告图片转换为文字并批量录入到数据库中,提取广告关键词以反映其中心思想,再运用文本匹配技术为文章寻找最合适的广告。测试结果表明,关键词提取技术和余弦相似度匹配是广告推荐领域中行之有效的方法。

全文