昆明植物所在植物馆藏标本基因组浅层测序研究方法方面获进展
来源:《植物方法》 时间:2018/06/25

 

 

世界上约 3400 个植物标本馆,目前收集标本数量总计超过三亿五千万份(http://sweetgum.nybg.org/science/ih/)。这些标本馆几乎收集了当地分布的所有物种,加起来大体上覆盖世界上已知植物物种。馆藏标本经过分类鉴定,蕴含着丰富的物种信息,其中模式标本更是每个物种科学名词(学名)的直接承载者。由于植物材料特性、干燥条件、储藏时间等因素的影响,标本 DNA 高度降解,DNA 提取浓度低,且易受外源 DNA 污染。这给标本 DNA 的提取、目的片段的 PCR 扩增和 Sanger 测序带来了较大困难。尽管标本存在较大潜在研究和应用价值,但是标本遗传信息获取技术明显滞后。

中国科学院昆明植物研究所中国西南野生生物种质资源库植物多样性与基因组学团队李德铢研究组和分子生物学实验中心多年来一直致力于植物 DNA 条形码与基因组学研究。新一代测序技术(Next Generation Sequencing)为标本遗传信息的获取带来了新的契机,因为新一代测序技术正是以 100-400 bp 的短片段分子为建库模板。同时,基因组浅层测序(Genome Skimming)通过二代测序技术获得全基因组较低测序深度基因组数据,借助于生物信息学手段,可得到叶绿体全基因组、线粒体全部或者部分基因组,以及核基因组中高度重复区域(如 rDNA)等序列数据。最近,该团队曾春霞在分子生物学实验中心团队的支持下,与爱丁堡皇家植物园合作,综合考虑标本的完整性、稀缺性和不可替代性,尝试选择 500 pg 的起始 DNA(文献报道多以 ng μg 为起始量),通过文库构建流程的优化,成功获得标本的叶绿体全基因组和 rDNA 序列数据,用于 DNA 条形码 2.0 和系统发育基因组学研究。

研究发现,以 500 pg 为起始量,通过模板分子不打断;不做片段选择;不少于 8 PCR 循环富集 barcode 文库,可以作为低质量样品文库构建的标准流程。对 25 份标本(采集时间为 1934-2007 年不等)进行测试,23 份标本可以获得完整或几近完整的叶绿体基因组序列,21 份标本可以获得 rDNA 序列。目前,分子生物学实验中心已经形成低质量样品文库构建的标准与技术规范,以及数据组装和拼接规范。基于标本获取叶绿体全基因组和 rDNA 序列数据的技术,应用前景广泛,包括:(1)可用于 DNA 高度降解的各类植物制品(如木材、树皮、粉末、中草药、饮片等),以及植物根系、动物消化物等的物种鉴定;(2)将模式标本的遗传信息整合到现有分类框架中;(3)从标本获得现已无法采集甚至野外灭绝物种的遗传信息;(4)获取标本遗传信息用于评估环境变化等导致的遗传多样性丧失或变化。

研究成果以 Genome skimming herbarium specimens for DNA barcoding and phylogenomics 为题发表于植物学研究方法的国际期刊 Plant Methods 上。该研究得到了科技基础性工作专项重点项目(2013FY112600)、中科院重大科技基础设施开放研究项目(2017-LSF-GBOWS-02)和中科院战略生物资源服务网络计划生物多样性保护策略项目(ZSSD-011)的资助。(来源:中国科学院昆明植物研究所)

 

Genome skimming herbarium specimens for DNA barcoding and phylogenomics

 

Abstract  Background: The world’s herbaria contain millions of specimens, collected and named by thousands of researchers, over hundreds of years. However, this treasure has remained largely inaccessible to genetic studies, because of both generally limited success of DNA extraction and the challenges associated with PCR-amplifying highly degraded DNA. In today’s next-generation sequencing world, opportunities and prospects for historical DNA have changed dramati? cally, as most NGS methods are actually designed for taking short fragmented DNA molecules as templates. Results: As a practical test of routine recovery of rDNA and plastid genome sequences from herbarium specimens, we sequenced 25 herbarium specimens up to 80 years old from 16 diferent Angiosperm families. Paired-end reads were generated, yielding successful plastid genome assemblies for 23 species and nuclear rDNAs for 24 species, respectively. These data showed that genome skimming can be used to generate genomic information from herbar? ium specimens as old as 80 years and using as little as 500 pg of degraded starting DNA. Conclusions: The routine plastome sequencing from herbarium specimens is feasible and cost-efective (com? pare with Sanger sequencing or plastome-enrichment approaches), and can be performed with limited sample destruction.

 

原文链接:https://www.zhiwutong.com/file/2018/20180614100733575.pdf

 

附件: