伊利诺优艾设计网_设计客伊大学香槟分校的研究人员预测,未来十年内,基因组学将产生世界上最大的数据集,这个是真的吗?
李海阳 2021-04-02 01:27
完全可能啊,一方面,人类基因组复杂度非常高,另一优艾设计网_平面设计方面,这个领域的紧迫挑战,数据近年急剧增多。但有专家指出,随着基因组学以指数速度扩展,找到空间来存储和管理所有的数据将是这个行业的一个主要障碍。
冷泉港实验室的Michael Schatz教授认为,数据挑战是当今生物学面临的最重要问题之一。“天文学和粒子物理学的大数据科学家们过去认为基因组学的数据量微不足道。但我们正在追赶,很可能超过他们,”Schatz说。这个数据到底有多大,我们可能都没有概念。从YouTube说起,它每年产生的数据大约在100 PB。1 PB相当于1024 TB,也相当于1024x1024 GB。目前,通过基因组学所产生的所有人类数据大约占了YouTube每年数据产量的四分之一。Schatz说,如果这些数据刻在4 GB的DVD里,那么DVD可以堆到800米高。
然而这个领域才刚刚起步,科学家预计,到2025年,大约有10亿人完成了基因组测序。因此,基因组学所产生的数据量每7个月就会翻一番,未来十年内,基因组学每年所产生的数据大约在2-40 EB(1 EB = 1024 PB)。那么,前面提到的DVD可能要堆到太空了。
这项研究是一个很好的例子,说明了人类遗传学的复杂性如何与宇宙科学的复杂性相媲美。Schatz开了个玩笑,分析人类DNA所用的数据是如此之多,也许以后大家不再说天文数字(astronomical),而是说基因数字(genomical)。
精彩评论