基于Hadoop的重叠基因对数量的计算方法

刘书田; 江育娥; 林劼<sup>*</sup>

登录

免费注册

赞收藏引用

科研之友

微信

新浪微博

Facebook

分享链接

基于Hadoop的重叠基因对数量的计算方法

作者：刘书田; 江育娥; 林劼^*

来源：福建师范大学学报(自然科学版), 2019, 35(06): 29-39.

摘要

基因组间的相似性可以通过重叠基因对的数量进行度量,基因组数据量的指数增长对重叠基因对数量的计算方法提出了更高的要求,业界迫切需要一种能够处理各种数量级别的基因数据库和待查询基因组的计算工具.本文提出一种基于Hadoop的重叠基因对数量的计算方法——DBits.在较小的数据集上,DBits的计算时间少于业界最常用的方法BITS,而在BITS无法处理的海量数据集上,DBits可以进行有效计算.DBits充分发挥分布式计算在大数据处理中的优势,可用于对数据量较大的基因组进行分析,有效地解决了现有技术中存在的重叠基因对数量计算难的问题.

单位
福建师范大学

收藏分享被引浏览

更新时间：2024-04-10 03:53

相似论文
引用论文
参考文献

产品服务

科研之友科研之友机构版科创云

站内浏览

科研成果科研人员科研机构

服务支持

帮助中心隐私政策服务条款

联系方式

在线客服：【立即咨询】客户热线：400-1616-289 电子邮箱：support@scholarmate.com

微信公众号