摘要
近年来,web数据挖掘在软件类教学中变得日益重要。该文以哔哩哔哩弹幕视频网为平台,以Python爬虫为工具,搜集大量弹幕数据并做挖掘分析来间接对视频内容进行评价。首先,根据弹幕在视频中出现的时间分布分析视頻最受关注的部分;然后,结合百度AI自然语言处理中的情感倾向分析工具和MATLAB单因素一元方差分析研究视频开头部分的弹幕特征;其次,利用AI语言情感分析和关键词分析方法研究弹幕的情绪和类别,进而分析视频的内容特征。实验最终结果展示了对热门短视頻的独特评价,对于短视频作者和平台有一定的参考价值。以弹幕为基础的研究方法也为视频内容自动化识别及评价提供了一条新思路。
- 单位