随着2019划上句号,本世纪第三个十年开启。在各大期刊和媒体的盘点中,过去这一年,生命科学突破不断、成就满满。这离不开科研人员的攻艰克难,也离不开资源平台的鼎力支撑。
这一年,国家基因库(简称“国库”,www.cngb.org)继续开放平台、共享资源,以“存、读、写”,促研、学、产,为我国生命科技探索保驾护航。辞旧迎新之际,让我们回首来路,盘一盘国库这一年的成长、收获与成果。
▲图:国家基因库
一、寄望新年,载梦前行
国家基因库主任王韧新年寄语:
2019年,在深圳国家基因库理事会的指导下,国家基因库在支撑生命科学研究与生物行业发展方面发挥了重要作用,不断提升了国库基础设施能力和科技水平,进一步拓展了对外开放共享和支撑服务。
2020年,国家基因库将继续发挥公益性、开放性、支撑性和引领性,积极响应“十三五”号召,推动核心技术创新突破,以支撑科研、赋能产业为己任,提高支撑服务水平,深化开放共享,为我国的生命科技发展及粤港澳大湾区建设发挥作用。
二、与时俱进,铸造高地
为铸造中国生命科技战略新高地
这一年,国库实力再度刷新:
千万级样本存储能力
88PB数据存储能力
691万亿次/秒计算能力
24Pb/年数据产出能力
千万碱基/年高效合成能力
在此基础上,支撑大量科研成果发表
自运营以来,被SCI收录的文章累计达409篇
2019新增193篇,含26篇CNNS
积极参与国际、国内相关标准制定
已发布实施的达31项,2019新增7项
包含我国生物样本库建设领域首项国标
生命大数据平台(CNGBdb)
归档数据总量逾1.5PB
对外共享生物样本信息47.7万份
服务的用户来自237家机构
支撑百余篇论文发表于60多家国际期刊
(注:数据统计截至2019年12月31日)
三、前沿部署,自主自强
数字的稳步增长,源于技术根基的不断夯实。国库坚持超前部署和创新引领,以前沿的技术应用平台、自主可控的核心工具,持续提升支撑服务水平:
在建设生命科学数据汇交标准体系的同时,国家基因库生命大数据平台(CNGBdb,db.cngb.org)结合知识图谱、自然语言处理等技术推出AI搜索引擎,并将基于多项安全技术将自身打造成“生命科学可信共享平台”,建设安全可靠的数据共享环境。
▲图:国家基因库生命大数据平台(CNGBdb)
这一年,国库搭建了先进的单细胞测序平台,实现了千万级单细胞产出能力,助力打破对国外设备和技术的依赖,同时为单细胞领域的基础研究和医学研究提供了强有力的技术支撑。
国库引入了精准基因组测序技术,可从头组装二倍体染色体,将基因组测序真正带入“全高清”时代,提供更加全面、准确的遗传信息。
面对复杂多变的外部形势,国库大规模部署国产化测序设施,并与国内合作伙伴携手完成基于国产自研芯片的WGS生信分析流程部署。核心工具自主可控,将大幅加强国库抵御外部不可控风险的能力。
四、支撑项目,全面发力
在“一带一路”和粤港澳大湾区发展战略的指导下,国库以资源、数据为能源,以技术、设施为引擎,在未来农业、医疗健康、生物多样性、合成生物学等多个领域发力,为国际大型、国家级、省级重大科研项目输送动力。
1. 农业:促进精准育种,助力害虫防控
百业农为本,民以食为天。在国库的平台支持下,科研人员对种质资源或相关害虫的遗传信息进行读取、挖掘和组学研究,为改良作物品种、防控病虫害、提高作物产量和质量、改善相关区域的民生贡献力量。
1)鹰嘴豆重测序项目:
与国际半干旱热带作物研究所(ICRISAT)等机构合作,已完成9000株不同鹰嘴豆品种的全基因组重测序,对培育高产、抗逆品种,提升发展中国家农业生产力具有重要意义。
2)草地贪夜蛾参考基因组构建
支撑完成全球首个草地贪夜蛾高质量染色体级别基因组的构建,为精准防控该外来入侵害虫提供了极具价值的科学依据。基因组数据已通过CNGBdb面向全球科学家公开。
3)“大豆回家”公益专项计划
已完成3500份野生大豆的种质资源数字化,启动600个种质资源杂交组合的测序与分析,助力全球科学家培育适应环境变化和人口增长的新作物。
2. 医疗健康:助推精准医疗发展,促进传统医药现代化
组学大数据是精准医疗的基石。国库以强大的平台实力支撑医学和药物领域的多组学研究,建设相关数据资源的共享平台,促进国际、国内精准医疗事业发展。
1)单细胞大数据脑科学研究项目
该项目利用单细胞多组学测序技术,绘制非人灵长类动物的脑部基因图谱,并建立可供外部访问的数据库。已完成累计约40万食蟹猴单细胞转录组和表观组学数据的产出。
2)大型自然人群队列示范研究
国库支撑这一由中国医学院牵头的国家重点研发计划,为人群队列项目建设提供规范化、本土化指导依据,促进高质量样本资源采集和利用。已发布团体标准1项,参与编撰专著1部,获软件著作权1项。
3)万种药用植物数据库(10KMP)
与广西药用植物园合作搭建,现已录入近千种药用植物的组学数据。将助推药用植物向有效成分明确、疗效可靠、质量稳定的中药新药方向转变,辅助新药设计。
3. 生物多样性保育:进行遗传资源数字化,推动生物多样性保育
作为“现代诺亚方舟”,国库在保藏生物遗传资源的同时,联合国内外多个科研机构,以数字化的方式,对生物的遗传信息进行永久保存和系统挖掘,以“基因科技+大数据”的力量,推动生物多样性保育。
1)反刍动物基因组计划
该项目由西北工业大学等单位牵头,开拓了研究重大生命现象的新途径,项目成果“反刍动物基因组进化及其对人类健康的启示”入选2019年度“中国生命科学十大进展”。于2019年6月在顶级学术期刊《科学》上以封面文章形式发表了系列研究成果。
2)瑞丽珍稀植物园数字化项目
国库与云南德宏州瑞丽市林业局共同开展,对园中采集的761份植物样本进行高深度测序,完成世界首个生态型植物园基因组数字化研究,产出的54TB组学数据在CNGBdb对外开放共享。
3)千种植物转录组计划(1KP)
由全球近200名植物科学家组成的1KP国际联盟,历时9年,发布了1,178种植物转录组测序成果。基于项目成果搭建的1KP数据库通过CNGBdb对外开放共享。
4. 合成生物学:基于高通量DNA合成能力,支撑合成生物学前沿探索
合成生物学技术,被誉为继DNA双螺旋发现、人类基因组计划之后的生命科学第三次革命。作为开放共享的合成生物学技术支撑与创新平台,国库为该领域的前沿探索及技术应用提供重要助力。
1)真核微生物基因组的人工设计与合成
该项目为国家重点研发计划项目—“合成生物学”重点专项,将为揭示真核微生物基因组的设计规律、建立基因组合成新技术奠定基础,2019年获批。国库将为项目提供高通量DNA合成支撑。
2)DNA存储技术与应用开发
该项目为深圳合成生物学创新研究院专项项目,为推动DNA存储技术发展、开发潜在的基于DNA存储的加密解密技术提供技术基础及支撑,为基因信息存储注入新概念。国库为项目提供DNA合成和软件开发支撑。
5. 伦理与合规:参与国家重点项目,推进指南、纲领建设
科学技术是一柄双刃剑,其发展与应用需要伦理、法规的指引与约束。为引领科研与产业的健康、长足发展,国库参与多个国家级重点项目,与多个参与单位协作,针对合成生物学、生物样本资源等进行伦理研究、公众教育,为制定完善配套的伦理指南和治理纲领贡献力量。
1)《合成生物学伦理、政策法规框架研究》
该项目隶属于科技部2018年“合成生物学”重点专项,将推动成立国家级合成生物学伦理指导委员会和国家级科普教育基地,为合成生物学国家重点研发计划的持续实施提供伦理论证、政策建议,并联合国际组织共同发布《合成生物学伦理宣言》。国库主要参与子课题四:合成生物科技政策、科学传播、公众参与的系统平台构建。
2)《大数据时代生物样本库的哲学研究》
该项目为2019年度国家社会科学基金重大项目,国库负责整理、分析生物样本库基本概况及管理现状,以及生物样本库在样本和数据开放共享方面的伦理、法律、管理问题,并形成工作指南。
“资源、平台,创新不止;开放、共享,脚步不停。”这是国库人对过往的总结,也是对未来的决心。
2020,万象更新,使命依旧。生命科学前沿依然风起云涌、百舸争流,国家基因库也将继续明灯引航、劲风助帆。
关于国家基因库:
2011年,深圳国家基因库(China National GeneBank,CNGB)由国家发展改革委员会、财政部、工业和信息化部、卫生健康委员会(原卫生部)四部委批复建设,并在以国家发展改革委员会和深圳市政府为联合理事长单位的理事会指导下,由深圳华大生命科学研究院(原深圳华大基因研究院)承建。
深圳国家基因库是世界领先的国家级综合性基因库,具备遗传资源的“存、读、写”能力,即存储生物资源和基因数据、对遗传信息进行读取及合成运用,并以此为基础搭建起挖掘基因资源,支撑生命科学研究与生物产业创新发展的公益性、开放性、引领性、战略性科技平台。