摘要
2010年2月16日发表在《公共科学图书馆·综合》(PLoS One)期刊上的一份研究报告称,研究人员对4个基因数据库GenBank、UCSC Genome Browser、DOE Joint Genome Institute数据库和Ensembl数据库中所有非灵长类基因组进行了人类特异性重复序列Alu元件的筛查,在搜索的2027个原始序列基因组中,竟然发现有454个存在人类Alu元件序列的污染,约占总数的22.39%。由此提出网络数据的信任度问题。严格地说,来自网络的所有统计数据必须经过同行确认,同时用正确的元数据告知数据的使用人或信息系统如何正确获取、阅读、处理、分析、解释和表达实际存在的...
-
单位第四军医大学