3月27日,由国家基因库和华大区块链共同开发的新型冠状病毒基因组分析平台在国家基因库生命大数据平台(CNGBdb)正式上线。
该分析平台是我国首个基于区块链和安全多方计算技术搭建而成的平台,允许用户在不公布己方数据的前提下,联合其他科研人员协同分析并共享结果。其正式上线意味着生命科学大数据的安全共享和开发利用上了一个新台阶。
新型冠状病毒基因组分析平台
病毒基因组数据实时分析
有利于快速评估、应对新发传染病疫情
包含新型冠状病毒肺炎(COVID-19)在内的新发传染病,因其发病突然、不易控制、难以预测/防范等特点,传播迅速且可能造成严重危害。目前,我国新型冠状病毒肺炎疫情防控取得阶段性成果,但在全球疫情不断升级的情况下,防控任务依然艰巨。
最终战胜疫情,关键要靠科技。利用新一代信息科学技术(云计算、区块链、AI等),能够进一步推动病毒基因组数据安全共享,实时追踪病毒演化、监测新型突变,为评估疫情风险、启动公共卫生应对措施及制定医疗对策提供更为全面、有效的数据支撑。
CNGBdb&华大区块链协同创新
促进新冠病毒基因组数据安全共享
为助力新冠病毒研究,CNGBdb联合华大区块链,基于Nextstrain分析和可视化工具开发上线了针对新冠病毒基因组的安全多方计算工具——“新型冠状病毒基因组分析平台”。该工具可实现如下功能:
1. 全面、实时的病毒演化树
病毒演化树图谱
该工具展示了现有公开数据集(来自GISAID、NCBI、CNGBdb等)的演化树分析结果,包括样本序列演化关系、地理位置、采样时间等,可实时追踪病毒流行病学情况、预测未来毒株演化。此外,还能帮助用户大大节约维护、更新数据集的时间成本。
2.保障用户数据和计算过程的安全
安全多方计算示意图
该工具支持单方、多方两种计算模式。采用单方计算,用户可以单独针对自有数据进行计算,或者与平台现有的公开数据合并计算,以预测毒株的演化;采用安全多方计算技术,用户能够以“虽彼此不可见,但可共享使用”(即“可用不可见”)的方式,与其他科研人员协同分析。同时结合区块链技术,保证所有数据和计算过程均可回溯且不可篡改,并记录数据使用次数,以体现用户数据的贡献度,促进新冠病毒基因组数据的安全共享。
用户数据贡献度展示图
新型冠状病毒基因组分析平台是国家基因库与华大区块链结合自身优势协同创新的“抗疫利器”,将进一步促进新冠病毒基因组数据及相关演化分析结果的实时共享,为疫情防治提供有力支撑。该平台后续还将上线隐私安全计算模块,进一步保障多方用户协同计算过程中的数据安全性。
关于华大区块链
华大区块链团队是中国区块链技术和产业发展论坛理事会成员,参与两项国家标准制定,并主导多项团标和地标制定,曾荣获由美国国立卫生研究院(National Institutes of Health)举办的2019届iDASH(基因数据隐私和安全大赛)大赛奖。
关于CNGBdb
深圳国家基因库(CNGB)是由国家四部委批复建设的、我国首座存、读、写一体化的国家级综合性生物遗传资源基因库,其搭建的国家基因库生命大数据平台(CNGBdb)已成为国内最大的生命科学大数据中心之一。本次疫情中,CNGBdb作为GISAID的中国首个正式授权平台,为用户提供一站式数据访问服务。
引用:
1. 张晓芳, 刁天喜, 翟晓洁, et al. 军队应对新发传染病疫情策略研究[J]. 解放军医药杂志, 2011, 23(2):70-73.
2. 世界卫生组织官网
3. “求是网”公众号:《在战胜疫情中发挥科学技术的关键利器作用》
4. “BGI华大”公众号:《华大区块链技术斩获国际基因数据隐私安全计算大奖》
5. “深圳国家基因库”公众号:《深圳国家基因库成为全球共享流感数据倡议组织(GISAID)的中国首个正式授权机构》