摘要
生物学研究表明,DNA蛋白质编码(protein-coding DNA,pcDNA)是一种具有一定的容量但不均匀的信息,受限于多种生物学条件,其存储介质模型不同于传统的计算机二进制存储。现有方案或无法高效利用其存储空间,或计算复杂度偏高。针对上述问题,提出了一种基于算术编码的编码方法——流式BMRC算法,使用重整化技术并通过输出符号的概率分布拟合,实现蛋白质编码DNA中的低复杂度、高效利用信息空间的任意信息存储。分析表明,该算法可以高效利用蛋白质编码DNA在生物学条件限制下的信息容量,且具有线性计算复杂度,技术优势明显。
- 单位