华为云深度赋能基因行业助力基因测序快速发展

近年来,基因测序技术在基础研究和临床应用等领域都得到了广泛的应用,随着技术的不断发展和测序市场的不断规范化,中国基因测序市场增速明显,进入快速发展期,已成为全球NGS(next-generation sequencing)市场的大本营之一。2007-2017年,中国基因测序行业市场规模增速高于全球整体水平,年均复合增速高达47.5%;2017年市场规模突破了70亿元。据中商产业研究院推测,2022年这一数字将突破150亿元。随着应用于基因测序的技术日渐成熟,未来十年将是基因组商业模式成熟的“黄金十年”。

随着大数据与生命科学的不断融合,生命科学产业正在发生剧变,“精准医疗”变为现实,基因测序产生的海量数据的处理成为新的挑战,逐步上云成为数字生命时代势在必行的举措。

华大基因科技服务测序过很多复杂基因组,单一规格的计算资源无法满足业务需求,云计算提供的可供灵活选择的计算资源是最好的选择。

2018年,华为云推出了全球首家基因容器服务GCS(GeneContainer Service),基因容器服务是业界首个基于Kubernetes平台,结合Docker容器技术打造的基因测序云服务,基于轻量级的容器技术,结合大数据、深度学习算法,为测序厂商提供了灵活可定制的测序流程、秒级可伸缩的高可靠资源和便捷一站式用户体验,让基因测序数据的计算更省、更快、更轻松。华大基因使用华为云技术后运行周期大大减少。

当前,基因测序的工作重心已经从序列读取转向数据处理,基因数据分析和解读是关系到基因测序发展和精准医疗应用的关键环节。但是,目前基因测序的数据分析也存在很多难点,例如:算力无法弹性匹配、主机运行效率难以提升、海量数据存储共享实现困难等,在一定程度上阻碍了临床应用的发展。

通过华为云与华大基因的合作案例,我们可以清晰的看出,华为云可以减少运行周期,提高计算效率和数据储存能力,缩短报告周期,保障海量数据的计算、存储和分析等,带给基因测序行业更多可能,为基因测序行业插上新的翅膀,将算力发挥到极致,可以更快、更多的进行生物信息分析,拓展应用领域,助力精准医疗更快的发展。

基因数据量规模不断扩大,大量数据分散在不同的国家、城市、医院,缺乏统一性。这样分散、游离状态的数据不利于大数据指导下的精准医疗研究。数据统合和共享是阻碍基因测序数据临床转化的一个难点。

以华大基因与华为云的合作为例,双方发挥各自优势,华大基因的核心业务系统迁移上云,堪称是云计算在行业内应用落地、技术真正服务于社会的典范。

云计算正是解决基因检测行业痛点的强大工具,随着5G时代的来临,云计算将在保障海量数据的计算、存储和分析的同时,带给基因测序行业更多可能。

华为云基因测序解决方案架构/来源:华为云官网

线下集群架构不支持高通量的计算(多任务并行),超算测试过之后也无法解决高通量计算问题(主要问题是测序软件针对云计算的优化)。面对这个问题,华为云利用基因容器技术,对客户常用的软件进行了优化,为华大基因提供了云端基因测序解决方案,支持DNA、RNA、液态活检等主流生物基因测序场景。

华为云携手华大基因助力行业发展

目前的数据缺乏标准化,在很多情况下,即便是同一家医院,由于生物测序设备、软件甚至流程不同,数据形式都会大相径庭。“当我们把这种数据放在一起,会出现系统性的偏差。”业内从业者表示,“标准化所指的不仅是分子数据,也包括患者的个体信息、用药和愈后随访。这些数据信息的统一和一定程度的共享,需要得到解决。”

云技术在基因测序行业中扮演怎样的角色?

对于基因测序行业来说,有着最好的发展机遇,但也面临着巨大的挑战,这个挑战就是如何做到测序更快、分析更快,更重要的是技术创新更快,通过结合云技术、人工智能、5G等新技术将为行业带来了全新动力。只有这样,企业才能在竞争中脱颖而出,整个行业也才能适应精准医疗的发展速度,以科技造福未来。

现阶段,基因测序的应用还是主要集中在无创产前检测和肿瘤诊断治疗两个领域,在临床方面并未广泛应用,随着应用的更加广泛,对密集计算和海量数据处理能力也有更高的要求。

云计算助力基因测序快速发展和技术创新

把脉基因行业痛点,算力才是关键

针对基因测序行业,华为云专门为客户定制了多种高度整合的基因测序解决方案。相对行业中传统使用的HPC高性能计算集群,基因容器服务有着明显的领先优势:资源调度更灵活,计算可以按需伸缩,任务流程方便自定义,容器更易维护升级等。

在基因检测领域,对于采集的基因样本进行数据分析和处理需要大量的计算资源。基因测序公司需要庞大的算力支持;生命科学的研究竞赛,很多时候已经变成了一场算力的比拼,大的科研成果通常是基于庞大的数据。现在的产前检测、肿瘤检测等医疗检测也会消耗大量的算力。以上这些基因测序对算力的需求都是波动的,往往Q4的消耗最大而Q1最少,同时对于不同生物的基因组,需要的算力也不同,这就会牵扯到计算集群的扩缩容,传统的线下计算集群是做不到快速的扩缩容的,这就是使用云计算的便利性。