微生物组学真正的新技术在哪里呢?
来源:生物通
时间:2016/05/24
“国家微生物组计划”是奥巴马政府继脑计划、精确医学、抗癌“登月”之后推出的又一个重大国家科研计划,无疑为目前火热的微生物组研究又加了一把火。但这一项目想要顺利开展并不容易,微生物的数量庞大,种类繁多,微生物组样品中宿主DNA占了绝大部分,要进行收集分析难上加难,那么真正的新技术在哪里呢?
一、样品收集与保存
来自芝加哥大学的微生物生态学家 Jack Gilbert曾表示,“微生物多样化多到可怕,而且复杂。任何特殊处理都会改变其组成部分。”即使是微生物菌群最小的变化或者相对丰度改变,也会极大的干扰群体比对,因此样品收集和储存方法引起的变化越小越好。
1.样品均质化
原始样品的保真性从收集样品的那一刻就开始了。第一步需要确保的是获得的是一个均匀的样品,2015年,一组研究人员完成了一项人肠道微生物组的研究,他们将液氮粪便样品通过研钵及研杵捣碎,使之成为粉末状小样品,然后转移到试管中,−80°C储存。比较于之前的方法,这种制备样品的方法能减少微生物组成上出现的可变性。
而土壤样品具有更加复杂的组分,因此科学家们建议将土壤样品放到搅拌机中,充分搅碎颗粒物。他们也建议在初次收集样品后再进行多次等分分装,因为多次反复冻融会破坏核酸,这一点其实很多实验室研究人员都知道。比如研究人员可以采用无菌一次性活检钳(biopsy punch)从一个更大的原始样品中收集几乎相同大小的冻存粪便颗粒,然后直接将这些颗粒放入含有核酸裂解液中的提取管中。这种方法就是对原始样品进行等分,但可以为科学家们节约整整一次冻融重复循环。
此外,2014年,美国福赛思研究所、麻省综合医院(MGH)和哈佛大学公共卫生学院等处的科学家,开发出一种新的方法,收集用于基因组和转录组分析的唾液与粪便。该方法不需要专业人员和设施,同时还能保持样品的完整性。
研究人员设计了固定剂的选择和取样流程(如下图)。可让8名受试者在家里收集微生物样品,然后将其运至实验室进行多种类型的分子分析。尽管采用不同的取样方法,微生物种类、基因和基因转录组成,在所有样品中都是一致的。随后对这些样品进行的分析表明,测量的人类微生物组的功能潜力和功能活性之间存在着有趣的异同点。在这项研究中是目前为止,结合表型分类学、宏基因组学和宏转录组数据谱,进行的第一个人类微生物组研究。结果详细描述了肠道菌群基因组潜能和基因表达之间的关系,验证了在受试者收集和运输的样品中开展宏转录组研究的可行性。
2.需要低温冻存保存剂吗?选择哪一种?
对于样品的保存,低温冻存保护可能有助于样品的保存。在比较储存样品和新鲜样品中的微生物组成之前,可以采用一种快速的方法,来评估保护剂的作用,那就是检测一下样品DNA的量,如果DNA量不足,那么你采用的方法也许并不适用于这种微生物的保存。
RNAlater最初是作为一种RNA保存剂,由Qiagen和Thermo Fisher等厂家开发出来的(前者当地价格为:50mL的78美元,250mL的324美元;后者当地价格为100mL的125美元,500mL的386美元),现在可以用于保存DNA。
RNAlater是特殊的样品储存液,只要在采样后立即将新鲜样品浸入这种液体试剂,RNlater可以迅速渗透到组织或其他生物样本中,稳定并保护RNA完整而不被降解,确保下游分析得到的数据真实反应样品的表达信息。
人类微生物组计划(Human Microbiome Project)的参与研究人员,来自哈佛大学的计算生物学家Curtis Huttenhower与他的同事们发现在样品收集后,如果没有冰箱,那么可以加入这种保护剂使用。
不过一些用户也报告了RNAlater的缺陷,虽然RNAlater不可燃,因此可以用于样品运输,但是这种保护剂会降低Bacteroidetes 和 Ruminococcaceae 两种细菌新鲜提取后的菌群数量。另外就是如果想获得样品高RNA产量,那么就必须先将其去除。Ganz表示,“RNAlater会妨碍样品正常形成颗粒沉淀,因此在去除RNAlater之后,还必须磷酸盐缓冲液进行清洗。”
此外,Woods Hole海洋研究所海洋生物化学家Mak Saito也指出,RNAlater还有一个问题,那就是其高盐含量,因此在一些实验中会令样品清洗成为问题。Saito曾采用这种溶液保存海洋微生物组中的蛋白组成。
对于一些类型的实验样品来说,如果加入低温冻存保护剂就会大幅度改变微生物组成,这样做划不来,比如土壤样品。而对粪便样品而言,有时低温冻存也许并不合适,比如说,用于治疗艰难梭菌感染的样品能在室温下保存长达6个小时,而且还不会引起治疗疗效发生显著变化。
二、测序技术
高通量基因测序技术无疑是微生物组研究的一大依靠,但是对于纷繁复杂的微生物组来说,测序技术工具还需不断的开发改进,去年年底,斯坦福大学的研究人员首次开发出了一种新测序技术,用于分析人类肠道微生物组,克服了短读取测序的技术限制。
他们将Illumina长读取技术(TruSeq Synthetic Long-Reads)与计算工具结合起来,克服了短读取测序的技术限制,获得了一名男性肠道微生物组的清晰图谱。
目前通常是通过短读取测序获得一小段一小段的信息,为了改善这一问题,研究人员采用新方法,将较大的基因组片段装订在一起。首先用复杂的算法先将小片段组装成10,000-base片段,再将10,000-base片段组装成更长的片段,然后拼出整个基因组。研究指出,将Illumina长读取技术与短读取测序相结合,能够更加精确和全面的分析宏基因组样本,更容易在人、动物、植物、水和土壤中建立致病菌菌株的进化史。
但是目前一些科学家也提出,DNA提取试剂盒、化学试剂和实验室环境中的杂菌很容易造成污染,影响微生物组分析的结果。
研究人员发现,没有污染的话对照样本应该只有一种菌,但有时却出现了270种不同的细菌。与高生物量的样本相比(粪便样本),来自血液或肺部的低生物量样本尤其容易受到污染。
为此,研究人员建议研究者们在研究低生物量样本时采取一些额外的步骤。比如使用阴性对照鉴定可能污染样本的杂菌,进行过滤或富集以增大初始材料中的生物量,在样本收集的时候尽量降低污染的可能。
三、信息分析工具
在分离和测序细菌核酸之后,我们需要从数据中提取有效的信息,这并不是一件容易的事儿。微生物组研究者一般有两个选择:16S rDNA测序和宏基因组测序。16S rDNA测序可以展现样本中的微生物种类和丰度,反映微生物多样性的大规模改变。而宏基因组测序可以揭示微生物群体的代谢潜能,帮助人们组装不同微生物的基因组。
16S rRNA分析最常用的工具是开源的QIIME和Mothur。当然市面上也有商业化的程序包,比如Thermo Fisher公司的Ion 16S Metagenomics Kit。这是一个基于网页和云端的免费程序包。过去的微生物组研究主要使用16S rDNA测序。随着测序成本的直线下降,针对整个菌群的宏基因组测序越来越受到青睐,因为这一技术能够提供更全面的基因组和功能信息。
哈佛大学公共卫生学院的Eric Franzosa为宏基因组数据分析开发了HUMAnN2。第一代HUMAnN主要是根据宏基因组或者宏转录组数据,分析微生物通路在群体中是否存在。也就是说,给HUMAnN提供微生物群落的DNA或RNA序列,它就会告诉你这个群体能够执行什么样的分子功能。HUMAnN2在HUMAnN的基础上进行了拓展,将微生物与特定活性关联起来。
MetaPath也是一个用于宏基因组数据分析的重要工具。该工具由马里兰大学的副教授Mihai Pop开发,可以根据宏基因组数据分析特定群体在不同条件下的代谢变化。举例来说,Pop的研究团队对胖人和瘦人进行微生物组研究,通过MetaPath鉴定了脂肪酸生物合成通路的差异。
宏基因组研究通常是从环境中收集微生物和病毒样品,然后将这些样本破碎,把它们的基因组DNA降解成片段,最后通过测序仪进行分析。宏基因组分析比一般的基因组分析需要更多的借助计算机技术,因为宏基因组分析处理的是不同基因组的混合物,而不是单纯的同质微生物种群。宏基因组分析产生的数据比一般基因组分析多得多,这是这一研究领域面临的一大挑战。
常用的一些工具,如MEGAN5主要用于MEtaGenome ANalyzer,最初是在2007年开发出来,用于识别长毛猛犸象骨中DNA测序研究的微生物污染。MEGAN5是发布的最新版本,除了可以帮助进行分类分析,也可以快速比较多个数据集,区分宏基因组中基因的功能,此外还提供元数据metadata支持和数据可视化的新途径。
此外,近期Nature Methods杂志发布了一个名为TruSPADES的强大工具,可以大大提升研究者们测序宏基因组的能力。这种算法能将Illumina测序仪生成的300bp短读取,合并成大约1万bp的基因组片段(Synthetic Long Reads)。如果说用短读取相当于语句,那么长片段就是整章文字。显而易见,把整章文字还原成一本书要容易得多。
TruSPADES主要是先给100-300bp的短读取装上条码,然后通过de brujin 图把这些片段组装起来,生成Synthetic Long Reads。这种低成本的方法可以更好的确定相连片段,获得更长更准确的长测序片段。
虽然微生物组热潮铺天盖地,但是一些科学家认为这其实掩盖了其中的风险。回顾之前的种种“组学”热我们可以看到,技术进步赋予了人们分析基因组、蛋白质组、代谢组的能力,于是便有大量研究将这些分子的状态与人体健康联系起来。然而,这些研究的后续工作往往后继无力,情况反而越来越复杂。
u 问题反思
此前Nature杂志曾经刊文,对微生物组热潮进行了反思。文章指出,在接受一项新结论之前,我们应该首先提出五个问题:
1.研究有没有检测到有意义的差异?
微生物组图谱主要依赖16S rRNA分析,能提供门、属、种的信息,但这种分类还不够细。举例来说,有研究鉴定了与糖尿病有关的微生物组,是细菌不同门之间呈特定比例,这未免太过于宽泛。这相当于是认为100只鸟和25只蜗牛组成的鸟舍等同于有8条鱼和2只乌贼的水箱,只因为鸟舍和水箱里的脊椎动物和软体动物之比都是4:1。另外,就算是同一个属的微生物,所含基因也往往大相径庭。
如今的技术其实可以做到更细致的分类,我们可以通过破译“代谢网络”来理解微生物组进行的生化反应,并在此基础上鉴定对健康有影响的基因组合。不过这就要求研究者对整个网络有一个透彻的了解。
2.研究是否明确了因果关系?
在鉴定疾病相关微生物组时,我们需要确定这种关系到底是不是因果关系,因为这种特别的微生物组有时可能只是个副产物。
2012年有一项研究发现,住在养老院里的老人微生物组与住在社区里的老人不同,而且这种差异与体质强弱。作者在考虑了多种因素后指出,饮食能够改变微生物组进而影响健康状况。这种结论的确与数据相符,但研究者却没能反向证明这样的因果关系。因为可能影响微生物组的因素很多,比如免疫系统比较不活跃,消化能力较弱等等。
3.作用机制是什么?
我们都知道,相关性并不等同于因果关系。不过存在相关性,多半意味着某种因果关系的存在,这需要我们努力去发掘。
现在,研究者们可以通过设计,精确限定微生物组中的成分,建立缺乏某一类微生物的菌群,或者利用“芯片上的器官”测定微生物组的生化活性。这样的方法能够帮助我们确定,某一种微生物组对人体健康的影响。
4.研究是否足以反映真实情况?
不过,就算微生物组在实验中能够影响健康,也可能并不是造成患者症状的主要原因。
举例来说,微生物组研究往往使用无菌小鼠,以便引入实验性的菌群。但是这些小鼠并不能代表动物的天然状态,缺乏微生物组的它们其实并不健康。因此,实验结果并不一定符合动物的天然应答。另外,小鼠的生活环境与人类差异很大,有关微生物组的实验结果也许并不能很好的用于人类。
5.结果是否可能有别的解释?
我们有充分的理由相信,细菌正在通过多种途径对我们施加影响。但是也有许多其他因素(可能更重要)在起作用,比如饮食。在把某种微生物组与疾病关联起来之前,明智的做法是,把所有可能的因素都纳入考虑。
参考文献:
1.Methods for Improving Human Gut Microbiome Data by Reducing Variability through Sample Processing and Storage of Stool
2.Relating the metatranscriptome and metagenome of the human gut
3.Examination of Microbial Proteome Preservation Techniques Applicable to Autonomous Environmental Sample Collection
4.TruSPAdes: barcode assembly of TruSeq synthetic long reads
5.Synthetic long-read sequencing reveals intraspecies diversity in the human microbiome
6.Reagent and laboratory contamination can critically impact sequence-based microbiome analyses
原文链接:http://www.ebiotrade.com/newsf/read.asp?page=2016516173449736