摘要

<正>大数据时代,人们在互联网上留下的数据渗透到了日常生活中的各个角落。通过分析、研判海量数据可以"反向映射"出用户的体貌特征、活动轨迹、日常行为、思想情况、关系网络等信息。但是,随着数据量指数级增长、数据内容十分庞杂,以当前计算机的运算能力和提取数据的算法来看,大数据面临着数据容量巨大、类型繁多、价值稀缺等问题。精确化、简单化、结构化提取数据的做法呼之欲出。聚焦夹杂在数据中由