近年来,随着基因测序技术的迅猛发展,其在血液病基因分析、基因诊断等领域的应用日益广泛。血液学已成为现代生命科学技术发展最为活跃的领域之一。中国在这一领域的研究,通过持续的技术创新,已然跻身世界前列。
基因测序,作为一种新型基因检测技术,在血液病的诊断与治疗过程中发挥着举足轻重的作用。这一技术也面临着巨大的挑战:随着基因序列数据的指数级增长,数据处理和计算的任务量也随之剧增。为了应对这一挑战,江苏省血液研究所(以下简称血研所)采用了浪潮分布式存储AS13000搭建血液病检测平台,为前端的基因检测业务提供了强有力的支撑。
血研所主要研究方向包括血栓与止血、恶性血液病和造血干细胞移植。此次搭建的科研平台主攻血液病的基因检测场景。基因测序能够从血液或唾液中分析测定基因全序列,预测罹患多种疾病的可能性。这一过程中产生的海量数据对存储系统提出了更高的要求。血研所作为国内领先的研究机构,需要处理大量的样品数据,对数据的持续读取性能、安全性有着极高的要求。预计未来每年的数据增长量将达到100TB左右。
浪潮分布式存储AS13000系列是血研所的重要合作伙伴。它满足了基因测序过程中的海量空间、高IO并发性能、业务连续性等需求,满足了血研所临床与科研的需求。AS13000通过智能条带化技术,实现了单个文件跨节点分布,提高了数据并发访问性能。随着数据规模的不断增长,AS13000还可以通过整合SSD资源作为高速数据缓冲区,进一步提升系统IO性能。
基因测序业务需要7x24小时持续运行,业务中断将导致重大的损失。连续性是基因测序的根本生产力保证。浪潮分布式存储在设计方面保证了所有关键系统服务的分布式运行,避免了单点故障,消除了系统瓶颈。其纠删码策略在保障空间利用率的也确保了数据不丢失,保障了基因测序业务的连续运行。
江苏省血液研究所的血液病生物样本库经过多年的发展,已经建成了包括生物样本库、临床数据库和质量控制实验室的血液病生物资源库。这个资源库涵盖了样本及信息收集、储存、利用的全环节,是国内规模较大的血液疾病生物资源库之一。血研所将继续坚持科研与临床相结合的理念,借助先进的基因测序技术,努力建设成为具有国际一流水平的血液病临床诊疗和转化研究中心,为血液学领域的发展做出新的更大的贡献。