流式BMRC:基于算术编码的pcDNA存储方案

作者:崔竞松; 李嘉伟; 王兰兰; 郭迟*; 齐浩
来源:武汉大学学报(理学版), 2023, 69(06): 787-795.
DOI:10.14188/j.1671-8836.2022.0253

摘要

生物学研究表明,DNA蛋白质编码(protein-coding DNA,pcDNA)是一种具有一定的容量但不均匀的信息,受限于多种生物学条件,其存储介质模型不同于传统的计算机二进制存储。现有方案或无法高效利用其存储空间,或计算复杂度偏高。针对上述问题,提出了一种基于算术编码的编码方法——流式BMRC算法,使用重整化技术并通过输出符号的概率分布拟合,实现蛋白质编码DNA中的低复杂度、高效利用信息空间的任意信息存储。分析表明,该算法可以高效利用蛋白质编码DNA在生物学条件限制下的信息容量,且具有线性计算复杂度,技术优势明显。

全文