摘要
核小体是真核生物染色质的基本单位。核小体的精确定位影响了基因组序列对结合蛋白的可及性、转录、遗传复制和重组。了解核小体在基因组的准确位置对理解真核生物的生命活动过程有重要作用。本文基于核小体的序列和结构特征及统计物理理论,用统计物理模型预测了核小体的定位。利用统计物理和信息论原理计算了酿酒酵母(S.cerevisiae)、人类(H.sapiens)、秀丽隐杆线虫(C.elegans)和黑腹果蝇(D.melanogaster)数据集中序列片段的DNA局部结构的总能量,基于核小体序列与非核小体序列的总能量差异进行分类,通过10倍交叉验证进行了性能评估。结果显示该模型具有较好的识别效能。
- 单位