目前的下一代基因测序(NGS)市场,Illumina继续独占鳌头。自从推出HiSeq X测序平台以来,大幅度降低了基因测序的成本,即使是研究级全基因组测序的成本一直稳定在1000美元左右。至此以后,这一水平的唯一竞争对手——华大基因的Revolocity测序仪也显得吃力。这也引起了许多研究人员猜测,长此以往会导致这一领域缺乏竞争力,导致NGS的发展(至少在短链阅读研究上)十分缓慢。但令人欣慰的是,NGS在其他领域的应用发展也十分迅速。
近日,Genetic Engineering & Biotechnology News对这些领域做了一次盘点。
1.长链阅读技术
NGS在长链阅读领域有巨大的进展,揭示了基因组合转录的复杂性。在基因组的分析过程中,主要的问题是处理重复序列的DNA。如果序列重复的长度要长于基本阅读的长度,那么实现参考基因组的唯一映射就会变得很困难,甚至是不可能。
无独有偶,基因转录的分析过程也面临同样的挑战。“大多数基因包含了多个外显子,以至于mRNA的长度比阅读范围的长度要长。”Personalized Healthcare 的Brenton Gravely博士表示:“因此,利用长链阅读来准确无误的了解特定样品中存在哪一种异构体,是不太可能的。”
Oxford Nanopore是一家备受关注基因测序公司。去年春天,Oxford Nanopore率先推出了基于纳米孔技术的测序仪MinION。尽管 后来Oxford Nanopore推迟了正式发布的时间,但公司已经确实将它的技术推广到大众。目前,超过1000家研究团队使用是MinION测序仪。
在最初版本发布一年之内,通过对酶化学和纳米孔设计的一系列改进,MinION的生产量从不足1亿增长至超过10亿。从质量,产量和成本来看,MinION与Illumina还存在一定差距,但 Oxford Nanopore 的仪器却在两方面占有优势:阅读长度和可移动性。
在使用者的报告中反馈出,成千数万次阅读中的平均长度超过了10万。DNA的输入质量和预备存储似乎是限制阅读长度的唯一真正的因素。也就是说,如果满足了输入质量和预备存储,就能够延长阅读长度。
同时,MinION还是一款可手持的测序仪,甚至可以在野外完成数据收集,不需要将处理后的样品带回实验室再进行分析。一开始,数据质量远远低于Illumina,但经过改进,数据质量已经大幅提高。最新的R9 主打快捷模式,在理想环境下,测试的精度已经上升到95%。
太平洋生物是长链阅读测序的领导者,近年也是成果颇丰。去年美国人类遗传学会上,公司公布了一个新的平台—Sequel。这个平台是与罗氏合作开发的成果,相比之前的RS II,在各个方面都有提升。
与RS II相比,Sequel的输出率更大,所占空间不到之前2/3,成本也只需要之前的一半。一直以来,太平洋生物科学公司都希望平台能够充分利用,解决化学和供应问题,特别是对可消费的SMRT(single molecule, real time)细胞。目前,这两个问题似乎都得以解决,公司正在等待第一批客户生成的数据反馈。
除了以上两家,行业内有影响力的还有GemCode的10X Genomics,可以从底层短链阅读数据生成连接。尽管这项技术还存在一些瑕疵,比如对于长于底层短链阅读的重复片段作用不大。但目前平台运作良好,今年早些时候还与Illumina 签订了联合营销协议,如果 Illumina的Moleculo synthetic长链阅读技术衰退,则协议开始生效。
尽管有所进步,但长链阅读技术,特别是基因转录测序,仍有问题仍急需解决。“而其中一个问题就是目前这些平台的吞吐量,但更大的问题是,逆转录酶的间断性还不够。”Gravely博士解释道:“在RNA直接测序中,性能优越的逆转录酶可以带来很大的改变。”
令转录研究人员兴奋的是,Oxford Nanopore在最近发表的一篇论文中表明,他们正着手推出利用MinION 直接测序RNA的商业试剂盒。
2.单细胞基因组学
另一个应用就是单细胞基因组学。到目前为止,所有NGS项目(只有极少数例外)都是在混合细胞中进行的,即从上千乃至上万个细胞中对单个细胞进行测序。如果所有的细胞都是完全均匀的,那么所有细胞可作为一般情况下的体细胞基因组,这并不是一个问题。然而,许多应用程序中,并不是所有的细胞都是完全均匀的,需要集中汇集挑选关键信息。
例如,肿瘤活检就极富异质性,包含了体细胞和癌细胞。不仅如此,即使是同一个肿瘤的癌细胞也可能有不同的基因组。汇聚多个细胞,就会产生一个混合的基因组库,加大了解释和分析的难度。目前的研究水平,只有小部分的细胞变化是可以忽略不计的。
一开始,研究人员采取的策略是尝试在活检组织内部的几个不同的地方,分别采取几个单细胞进行测量。如果积累了足够多的个体测量,那么就可以建立一个全面的肿瘤基因组视图。
另一个方法就是单细胞途径。转录组是高度可变的细胞,将细胞聚集起来可以掩盖基因表达模式的潜在变异。
“就在几年前,上百个单细胞的转录学分析可能花费大量的时间和资源。”基因组学科学家Richard Shen最近离开了Illumina跳槽到RS技术公司,他提到:“现在,随着简单易用的NGS文库技术的发展,大大降低了开发成本,分析上千个单细胞不仅成为现实,而且所分析得到的数据在许多应用中也显示了价值。”
对于单细胞库的制备,许多平台都可以实现:Fluidigm的C1,可以同时处理800个细胞;Chromium的10X Genomics,更是可同时处理多达48000个细胞。这样的处理能力,并不是每个研究人员的目的,Gravely 指出:“一些平台或者自制设备的吞吐量是非常让人兴奋的,我们所希望看到的是叠加效果,比如像holy grai这样的单细胞长链阅读测序仪。”
3.癌症液体活检
同样吸引人注意应用就是癌症诊断的液体活检。某种程度上,NGS在肿瘤活检领域的应用在正越来越普及。Foundation医学的FoundationOne测试就是最好的例子。一个由315种相关癌症基因的标记组合成的单一测试面板。这些基本面板测试取代了传统的单一基因测试。
癌症诊断也在从肿瘤组织活检向液体活检偏移。不同于从肿瘤上切片提取DNA,癌症液体活检从循环肿瘤细胞(CTCs)或者患者血液中游离细胞中提取游离DNA(cfDNA)。就目前来看,由于提供了许多解刨和细胞结构的信息,肿瘤组织活检暂时不会消失,但是许多液体活检的研究人员表示,液体活检具有更多功能性。
“从癌症筛查的角度来看,液体活检更具有吸引力,因为他们不但更简单准确,而且可以进行癌症之前的常规检查。”Freenome联合创始人兼首席执行官 Gabriel Otte表示:“从预防和确诊病人的检测来看,液体活检同样具有优势,尤其是那些超过30%因为各种原因不适合侵入性活检的病例。”
作为一个热门的新领域,一些新兴企业正迅速成长,更多的大公司正在革新以占取庞大且不断增长的市场。
早在2014年,Guardant Health声称他们是第一个走向市场的液体活检企业。这一诊断被称为Guardant360。Freenome采取了不同的手段,通过测试癌症全基因组来实现癌症诊断。“我们依靠我们的深度学习。”Otte表示:“为了做出准确的癌症检测,我们根据最相关的特定区域对做出了特定的分区。”
Illumina的测序技术已经被大多数公司利用,在这场竞技中,也推出自己的液体活检公司—Grail。也许是为了避免与自己的客户出现直接竞争,Illumina表示将主要围绕前期筛选,这个没有其他公司关注,且更具挑战性的任务。
4.纵向研究
随着液体活检的出现,监测研究性试验中肿瘤患者的反映,以及适当的样品跟踪已经变得越来越重要。这一过程,至少需要分析3种样品:肿瘤组织,正常组织和循环游离DNA。
当测序在的目标较大,比如对全基因组进行排序时,遗传指纹是可以被确定的,以至于在数据分析过程中样本可以进行适当的匹配。然而,Swift Biosciences生物学家Drew McUsic博士表示,当测序目标较小时,遗传指纹不能产生。
“直到现在,研究人员仍利用单核苷酸的多样性与LIMS系统排列配对来正确跟踪样本。”McUsic博士指出:“这些方法依赖于对多个样本的正确标记,以及数据文件与材料的精确匹配。”
为了寻找更精确的样本识别方法,Swift生物科技开发了一款Accel-Amplicon? Sample_ID 面板。遗传指纹由104个外显子和性别特异性扩增子提供,作为低比例spike-in(待测样品中加入标准样,以检测你在实验操作过程中的样品损失),添加到任意一个Swift增扩平台,例如 Accel-Amplicon 56G Oncology Panel v2。McUsic博士还补充到:“从浅显的生殖测序到到深度覆盖性体细胞突变检测都可以使用这样的技术。”
该技术不仅提供了一个有效的,单管检测分析肿瘤标本的体细胞突变,同时在相同的测序文件内产生基因指纹。他继续说道,随着越来越多的项目被设计应用到跟踪肿瘤患者的反应率,在这些纵向研究将选择合适的标本跟踪工具将显得越来越重要。
目前来看,Illumina将继续占有市场主导地位以及短链阅读的高通量,但其他公司也在其他领域寻求进步。Oxford Nanopore宣布了许多即将展开的研究,包括高通量的纳米孔测序仪PromethION。该公司声称,他的吞吐量将能够与Illumina的 HiSeq X竞争。公司还就 两台自动化样品仪器VolTRAX和 Zumbador展开讨论,保证未来DNA测序的全方位简化。
太平洋生物的 Sequel 平台也有望被迅速采用。它可能带来测序成本的降低,升值可能赶超Illumina。可以肯定的是,随着使用的简化和成本的减少,NGS临床使用的障碍将得到改善。
选自:动脉网-周梦亚