摘要
针对无线传感器网络(WSNs)节点易遭受攻击却不易被评价且识别的问题,提出了一种基于马尔科夫决策过程(MDP)的检测方法。对网络节点建立MDP模型并采用Option方法分层简化;运用Q-Lear-ning优化算法迭代各层节点的Q值直至收敛;最终求解出模型的最优检测策略来确定网络各节点的正常、异常状态,从而达到检测目的。仿真结果表明:Q-Learning优化算法中引入模拟退火技术使贪心策略动态调整并增加一层学习过程后,克服了原算法求解模型时运行效率低,收敛速度慢的问题;所提检测方法与同类型方法相比,获得最优策略的时耗较低且检测率较高,误报率较低。
-
单位自动化学院; 江西理工大学