本发明公开了一种大数据系统性能建模与仿真方法,涉及性能建模和系统仿真等领域。本发明所涉及的主要步骤包括:大数据作业日志采集与分析、软件行为模型和硬件资源响应模型仿真模型库的构建、待预测性能大数据作业行为分析、大数据作业仿真文件的生成和执行、输出大数据作业性能预测结果。本发明所提出的大数据作业性能预测方法,可以使用户在无需运行真实大数据作业的情况下预测计算多种大数据作业在指定集群配置上的运行性能,便于企业和机构提前感知大数据作业的运行成本。