摘要
本发明公开了一种网络化数据流的标签提取方法,包括:1.根据社交网络中用户节点之间存在的关注关系,构建数据流形式的网络数据块,并获得网络数据块中每个用户节点的邻居列表;2.更新每一个网络数据块中每个用户节点的邻居列表;3.根据每一个网络数据块中用户的微博内容,采用主题建模法抽取出每个用户对应的候选标签列表,4.根据网络数据块中每个用户及其所有邻居用户的候选标签列表,得出每个用户的标签集。本发明在面向大规模的社交网络数据流中,能及时、有效的捕捉到社交用户的兴趣标签,从而能达到用户信息推荐和为公司做决策的目的。
- 单位