摘要

本文中的数据主要有四个来源-谷歌应用商店,豌豆荚(第三方应用市场),AMD和Androzoo.这些数据包括约85 000个APK(Android安装包),它们都是来自这些数据源中的恶意数据和良性数据.从这些APK文件中提取静态特征和动态特征,然后在安卓系统中使用监督式的机器学习算法进行恶意软件检测.这篇数据文章还提供了可用于数据分析的Python代码.对于特征提取方面,还结合了通用算法,从而能够选择重要且相关的特征子集.