摘要
[目的/意义]旨在为后续弹幕文本分析提供基础数据采集、存储方案,并帮助弹幕研究者更好地理解亚文化弹幕的文本特征。[方法/过程]以亚文化弹幕为对象,分析了Bilibili弹幕视频网站视频与弹幕的存储机制,在此基础上构建基于类型—频道的视频关系网络,设计高效弹幕爬取算法以搭建亚文化历时弹幕语料库,并对语料库中视频、弹幕语料的基本属性进行探析。[结果/结论]在用户倾向上,不同类型的亚文化弹幕均呈现出较为鲜明的亚文化特点;在文本特征上,弹幕作为一种新型短文本评论,有别于微博文本,且不同类型亚文化弹幕体现出不同的文本特征;在时间特性上,弹幕文本数量、主题与视频的发布时间和视频运行时间均存在一定关联,体现了较强的时间特性。
-
单位北京师范大学珠海分校; 北京师范大学; 高等研究院