摘要

区块链应用于车联网(Internet of Vehicles ,IoV)可以有效解决车联网数据安全和隐私等问题。但是,区块链吞吐量低的问题阻碍了其在车联网中的广泛应用。已有的区块链吞吐量优化研究大都存在决策行为空间爆炸的问题,可扩展性较差。针对上述问题,提出了一种基于深度强化学习(Deep Reinforcement Learning,DRL)的区块链车联网吞吐量优化方法,通过选择区块生产者、共识算法、调整区块大小和区块间隔优化区块链的吞吐量,同时保证IoV区块链的去中心化、延迟和安全性。该方法通过引入BDQ(Branching Dueling Q-Network,BDQ)框架将行为空间进行细粒度划分,解决了区块链使用传统深度强化学习方法对吞吐量进行优化时出现的行为空间爆炸问题。仿真结果表明,提出的方法可以有效地提高IoV区块链系统的吞吐量。