互联网自诞生以来,一直在推动信息技术以及相关产业的快速发展。据International Data Corporation(国际数据公司)发布的《数据时代2025》显示,从2018年起全球每年产生的数据增长到了175ZB,相当于每天产生491EB的数据。在这个信息爆炸的时代,大数据分析技术和人工智能随之产生,如何从复杂的数据信息库中获取我们所需要的信息,如何从这些信息中提炼出直观的数据模型和结论,该文采用Python语言以定向爬取微博为例重点阐释这两个问题。