原标题:二代测序技术在实体肿瘤诊疗中的应用及研究进展
随着分子生物学的飞速发展,分子诊断技术已经大范围的应用于遗传性疾病诊断、感染性病原体筛查、肿瘤突变基因检测,伴随诊断和预后评估等领域,特别是在肿瘤的诊断和治疗中逐渐起到越来越重要的作用。目前应用于临床肿瘤分子诊断的技术主要包含了流式细胞术(flow cyto metry,FCM)[1]、荧光原位杂交(fluorescence in-situ hybridization,FISH)[2]、聚合酶链反应(polymerase chain reaction,PCR)[3-4]、微阵列芯片[5]和基因测序技术[6-8]。FCM主要通过单个细胞或生物微颗粒的定量分析考察其生物学性质以检测肿瘤或是癌前病变的发生,FISH、PCR和微阵列芯片技术,主要是通过一定的方式抓取已知的片段序列以确定目标的有或无,这几种技术的重点在于“检”,而基因测序技术是采取特定的手段将还有遗传信息的核酸一个一个测出来,其重点在于“测”,目前应用场景范围最大的就是二代测序(next-generation sequencing,NGS)。现就NGS在实体肿瘤诊疗中的应用及研究进展综述如下。
从1985年首次提出人类基因组计划,1990年该计划正式启动开始,至2003年正式完成时,科学家们运用一代测序技术经过十几年的努力,耗资30亿美元,终于完成了第一个人类的全基因组测序工作[9]。随着测序技术的持续不断的发展,二代测序技术逐渐走向临床,至2015年时,完成个人全基因组测序只需要1 500美元[10]。而随着Illumina公司推出的Novaseq,让个人的测序费用更是降到了1 000美元以下,且测序时间也缩短至1 d左右。更准、更便宜、更快的特征逐步让NGS实现了肿瘤的临床诊断和治疗检测的可能性。
肿瘤NGS的检测类型最重要的包含全基因组测序(whole-genome sequencing,WGS)、外显子组测序(whole-exome sequencing,WES)和目标区域测序(target region sequencing,TRS)。WGS是对人类全基因组约3亿个碱基进行测序的方法,WES是对人类基因组DNA上所有蛋白质编码序列的碱基(外显子组碱基序列为全基因组序列的1%~2%)进行测序的方法,这两种方法不但检测费用高,而且得到的数据量均比较庞大,后续分析的过程也很复杂,特别是WGS的方式,目前在临床检测中还仍然难以实现。TRS的方式主要是通过获取目标基因区域的DNA片段,再通过NGS技术进行测序的方法,主要针对检测的目标区域,测序范围大幅度缩小,检测时间和费用也相应减少,是目前肿瘤NGS临检的主要手段。
2.1 检测样本的选择及采集 实体肿瘤NGS的样本类型大致上可以分为组织、血浆和各种恶性渗出液。组织样本是检测的重要类型,主要包含了石蜡包埋组织和新鲜组织两大类,检测前需要病理医师对组织样本进行病理诊断,评测样本有无出血、坏死情况或病变细胞的总量和比例等。Frampton等[11]研究指出,在肿瘤组织标本NGS检测时,肿瘤细胞含量的比例建议达到20%以上,这样做的目的是为了尽最大可能避免检测结果出现假阴性的可能。
以循环肿瘤DNA(circulating tumor DNA,ctDNA)为目标的样本也是当今实体肿瘤NGS检测的主要来源。ctDNA可以反映肿瘤细胞中的基因突变、重排、扩增等遗传缺陷信息。ctDNA来源于肿瘤细胞的凋亡、坏死或代谢产生的DNA片段,属于循环游离DNA(circulating cell-free DNA,cfDNA)的一部分[12-13]。恶性渗出液(脑脊液或胸腹水)能够最终靠穿刺的方法获取,通过检测可对患者分型、药物选择、预后及疾病动态进展评估进行管理。而血浆中的ctDNA可直接通过获取血液分离出来,由于ctDNA在血液中的半衰期短,不但可以实时反映实体肿瘤的动态变化[14],而且还能克服组织检测中肿瘤异质性的缺陷[15],因此,检测ctDNA慢慢的变成了新型液态活检的生物标志物[16]。
2.2 靶向NGS实验操作部分
2.2.1 核酸的提取 核酸的获取是NGS检测的关键环节之一,主要方法有苯酚氯仿抽提法、离心柱法和磁珠法。①苯酚氯仿抽提法[17-19]:苯酚氯仿提取核酸的原理是基于苯酚能够最终靠反复抽提的方式使蛋白质变性,利用十二烷基磺酸钠裂解细胞膜,在蛋白酶K和乙二胺四乙酸的作用下消化蛋白质或多肽或小肽分子,核蛋白经过变性降解后,DNA可从核蛋白中游离出来,然后利用萃取的原理,并经多次洗涤后获得纯化核酸;苯酚氯仿抽提法的优点是提取的试剂价格较为便宜,主要缺点是使用的苯酚、氯仿等试剂毒性较大,污染较严重,并且核酸的回收率也较低,损失量较大,很难进行微量化的操作,在实际应用中基本上被淘汰。②离心柱法[20-22]:离心柱法提取核酸的原理是先利用有吸附作用的官能基团将核酸固定在离心柱的膜上,然后通过结合不同的裂解试剂和洗涤试剂,反复操作以达到核酸与杂质分离的目的,从而获得纯化的核酸;离心柱法的优点是比传统的苯酚氯仿抽提法获得的核酸纯度高,而且能进行微量操作,价格也较为低廉,操作相对简单,在科研和临床检测中应用较广。③磁珠法[23-25]:磁珠法提取核酸的原理是磁珠表面有对核酸有吸附作用的特定活性官能基团,通过不同的裂解液、结合液和洗涤液在特定的条件下能够与目的物质进行特异性结合,同时利用磁珠自身的磁性,在外磁场的作用下可以方便地实现定向移动与富集,进而达到获得纯化核酸的目的;磁珠法主要优点是安全无毒、操作较为简单,并且磁珠与核酸的特异性结合使得提取的核酸纯度高、浓度大,能够实现自动化、高通量操作,是未来发展的新趋势之一,最大缺点是价格相对较贵。
2.2.2 NGS文库的构建 到目前为止,WGS和WES的建库方法主要应用于科研,而肿瘤NGS临床检测中主要使用的方法还是TRS。临检应用的商业化试剂盒较多,TRS的方法主要有两大类型:一种是以超多重PCR为主要建库方式的试剂盒,这类试剂盒主要是运用一系列特异的引物获得PCR扩增版的测序文库,然后上机测序,代表性的产品就是Life Technology的Ion AmpliSeq和安捷伦的HaloPlex;另一种是基于特异性探针的杂交捕获试剂盒,这种方式的主要先通过超声法或酶处理等片段化基因组序列,然后通过RNA或DNA探针杂交抓取目标片段,再进行PCR扩增构建相应的文库,代表性产品就是安捷伦的SureSelect、罗氏的NimbleGen′s SeqCap及Illumina的Nextera[26]。
杂交法和多重PCR法各有优劣:杂交捕获法获得的文库复杂度更高,但是却难以处理重复和高GC含量的基因组区域;而多重PCR法则更适合5 Mb以下的靶标区域。目前也有研究团队发现杂交法可能会遗漏7%~10%的蛋白编码序列,并建立了将HaloPlex(多重PCR的方法)和SureSelect(杂交的方法)结合起来应用的新方法[27]。
2.2.3 NGS上机测序[28] NGS短读长测序方法有2种:基于边连接边测序(sequencing by ligation,SBL)的原理和基于边合成边测序(sequencing by synthesis,SBS)的原理。实际上,SBL的方法是通过带有荧光基团的探针与DNA片段杂交,同时探针还能与邻近的寡核糖核酸连接,然后通过荧光基团的发射波长判断碱基;而SBS的方法通常利用的是聚合酶连接的反应,在链的延伸过程中通过插入荧光基团而读取碱基。
在大多数的SBL和SBS方法中,为了增加信号和背景信号的区分度,模板的克隆技术实现了一定区域内可以识别成千上万个DNA分子。乳液PCR是通过油包水的环境将需要克隆的DNA模板扩增至上百万个;固相桥式扩增和固相的模板移位的方法是直接通过固体介质,利用正向和反向引物放大DNA模板的方法;DNA纳米球的方法是唯一一个在溶液中完成DNA模板富集的技术。
在NGS肿瘤检测领域,目前使用比例最大的2个阵营就是Illumina公司的Miniseq、Miseq和Nextseq系列以及Life公司的PGM和S5系列,这些测序仪的原理均是基于SBS的方式,测序长度范围主要为75~600 bp。基于life公司测序平台的核心技术是通过半导体技术构建了化学与数字信息之间的传导,不需要用光学检测和扫描系统,配套使用过的化学试剂也无需标记荧光,该测序平台用于精准临床诊断的最大优势就是测序速度快,运行时间为2~7 h。限制其应用的明显缺点就是不支持双向测序,数据通量较低,选择范围为50 Mb至15 Gb之间。相对的,Illumina公司的技术平台利用其循环可逆终止反应和双端测序的专利优势,不但提供了多款可供选择测序的平台,可选择的试剂盒通量范围也较大,主流读长为2×150 bp长,选用Miseq的试剂盒最长能够达到2×300 bp,数据通量选择范围从1.6~120 Gb不等。其测序通量较大,读长较长成为NGS肿瘤检测的主流应用机器之一。
2.3 生物信息的分析及遗传信息的解读[29-44] 肿瘤NGS的生物学分析大致上可以分为数据质量控制、比对拼接、二级分析发现变异基因及综合分析几部分。数据的质量控制是生物信息分析的第一步。在高通量测序的过程中,不可避免地会出现低质量读数和污染读数等质量标准较低的读长(这种数据称为Raw Data),这种数据会影响接下来的分析结果。因此,首先应对测序下机的数据用质量控制软件剔除不合格的读长,一般肿瘤NGS检测要求的数据均为Q30的高质量数据。
质控后的数据包含了数百万个不同读长(这种数据称为Clean Data),第二步有必要进行的分析就是将这些读长(格式一般为FASTQ)分别映射到人类的基因组参考序列(格式一般为FASTA)。常用的软件主要是Bowtie、BWA和BWA-MEM。根据回帖到参考基因组上的比对文件(通常为BAM或SAM文件),利用不同的二级分析工具,对每一个位点记性变异鉴定,进一步挖掘数据的点突变、插入/缺失、融合、扩增及微卫星不稳定性等不同的变异类型,鉴定后的变异位点可以用IGV等工具进行可视化查看。此外,还能够最终靠数据库对突变基因位点进行功能注释。
经过过去十几年的发展,NGS技术检测DNA序列费用的迅速降低促进常规临床检测的可能,并已经大范围的应用于实体瘤、恶性血液病、遗传性疾病,我国NGS检测相关的监管政策也逐渐得到完善和发展。2014年以前,我国基因测序行业处于无监管状态。2014年2月,中国食品药品监督管理总局和国家卫生和计划生育委员会(简称“卫计委”)叫停了临床NGS检测试验,同时发布了NGS的临床检测的监管要求。2014年4月,卫计委推出了试点项目,并向NGS实验室授予许可资质。2015年开始,卫计委临检中心在全国范围内每年组织开展室间质评工作,以评估NGS技术检测体细胞突变的有效性。
在经历了“无监管→叫停→监管”的局面后,我国NGS诊断监管政策得到了不断完善。2015年8月,卫计委出台了《肿瘤个体化治疗检测技术指南(试行)》,首次提出实现肿瘤个体化用药基因检测标准化和规范化的目标。2016年4月,中国抗癌协会率先发布了《二代测序(NGS)技术应用于临床肿瘤精准医学诊断的共识》,同年8月,中国食品药品检定研究院发布了《第二代测序技术检测试剂质量评价通用技术指导原则》,这在提高肿瘤NGS检测准入门槛的同时,开始逐步为临床肿瘤驱动基因分析提供相关指导性建议,并逐步规范临床实践。2017年3月,中华病理学杂志发表《临床分子病理实验室二代基因测序检测专家共识》[45],该共识从实验室总体要求、NGS分析样本、基因panel、NGS检测流程中的质量标准、生物信息分析等几个方面阐述了专家共识,更进一步明确了肿瘤NGS检测中的注意要点。
实体肿瘤NGS的临床检测服务发展迅猛,市场价值百科极其巨大,但是广阔前景的背后却同时面临着一些巨大的挑战和风险,值得格外的重视和警惕。
4.1 提高生物信息学的处理精度,加强遗传信息的解读能力既是重点也是难点 作为肿瘤NGS的检测过程中另一块重要环节,生物信息数据的处理和遗传信息的解读往往要求更高,对临床分子病理诊断的判读影响更大。在数据处理的算法方面,生物信息分析的工具更偏重于科研领域,临床数据分析的精准度方面还需要进一步的提高。在遗传信息的解读方面,即使获取了患者精准的基因检测情况,还需要根据最新的临床研究结果,对其进行正确解读。由于科学家们对肿瘤的认知仍然还处于不断研究探索的阶段,深入挖掘和验证各种新的突变和药物靶点,收集和积累一系列临床数据库是未来肿瘤NGS检测的重点和难点之一。有必要注意一下的是,在临床数据解读方面,我国临床解读数据库发展相对还比较缓慢,主要的一些参考依据还是依托于NCCN临床实践指南等相关资料,故需要进一步完善中国人群肿瘤疾病临床数据库,逐步的提升医学解读团队的水平。
4.2 ctDNA的检测目前仍存在争议,值得进一步验证 凭借无创、快速、全面的特点,ctDNA的检测近年来备受关注,但是这种液体活检的方式检测肿瘤的准确性却被一些研究提出了质疑[46]。2018年,美国临床肿瘤学会和美国病理学家协会共同发表了一项联合综述,通过统计2007~2017年发表的77篇相关研究,针对实体肿瘤ctDNA检测的临床有效性和实用性讨论指出:①ctDNA检测对某些类型晚期癌症的临床有效性和实用性已被证实,但目前大多数ctDNA检测还缺乏足够的临床试验数据表明其临床有效性和实用性;②研究发现ctDNA的检测结果与肿瘤组织样本的检测结果存在不完全一致的现象;③目前还没有足够的临床有效性和实用性方面的证据证明ctDNA检测适用于早期癌症的伴随诊断和监测;④目前还没有临床试验数据证据表明ctDNA可用于癌症普筛[47]。
以上论证表明,ctDNA检测在一定范围内有用,其发展前途也极其广阔,但如何加强ctDNA临床诊断研究,规范ctDNA检测操作,明确其临床诊断意义尚任重而道远,需要广大科研工作者和相关机构共同努力。
4.3 与传统的分子检测不同,NGS检测的监管也面临诸多挑战 由于NGS检测的诸多特点,监管机构需要新的方法以确保分析和临床的有效性,原因如下:①与传统的方法利用单个或一定量因素诊断单个或一些疾病不同,NGS检测能够识别人类基因组中的大量变体,故有效分析每一个变体几乎是不切实际的,虽然评价具有代表性的突变类型或许是一种有效的方法可证明NGS平台的性能,但尚需要时间建立不同临床领域NGS检测的评价新指标;②NGS检测的结果中不仅包含了有临床意义的突变,也包含了大量意义尚不明确的突变,这就要求不同突变的临床验证应有不同的要求;③NGS检测的预期用途针对的是特定的患者群体、药物或疾病,但目前治疗试剂的选择主要基于NGS靶向分析所得的具体分子结果而不是癌症类型,随着临床研究的加快速度进行发展,必须重新考虑审批流程以扩大获批试剂的预期应用。
目前开展NGS检测的实验室主要依据是《医疗机构临床基因扩增检验实验室管理办法》,但由于NGS的临床检测比传统分子检测更复杂,故迫切需要制定新的监管标准。
基因突变的积累是导致肿瘤发生发展的根源,而目前寻找癌症突变基因最有效的方式就是基因测序。随着分子生物学的飞速发展,NGS测序技术慢慢的变成了肿瘤的诊断的主流手段。根据NGS检测的基因突变信息以及数据解读报告,临床医生可以为患者制定最合适的个体化精准治疗方案,虽然NGS测序技术在实体肿瘤的诊断中还存在一些问题,但是其展示出来的应用前景和市场价值百科是巨大的,相信在科研工作者和临检人员的共同努力下,实体肿瘤的NGS临床诊断必定慢慢的变好。
参考文献略
责任编辑: