二代测序技术在过去二十年中发展迅速并逐渐普及,TCR检测的灵敏度和TCR发现工具性能得到极大提升。二代测序主要包括DNA/RNA提取、文库构建、上机测序、数据输出这几个流程。其中,DNA/RNA文库构建是二代测序技术的重要环节。
T细胞受体(T cell receptor,TCR)是T细胞表面负责特异性识别与MHC(主要组织相容性复合体)结合的抗原肽的蛋白。当TCR与抗原肽和MHC结合时,T淋巴细胞通过信号转导被激活,启动免疫应答。人类基因组中有4个TCR基因:两个编码轻链TCR:TRA基因编码TCRα,TRG基因编码TCRγ;两个编码重链TCR:TRB基因编码TCRβ,TRD基因编码TCRδ;重链TCR和轻链TCR形成异源二聚体,组成完整的TCR。在人类中存在两种TCR:TCRαβ和TCRγδ,其中95%的T细胞表达TCRαβ。成熟的重链TCR基因由可变区(V)、多变区(D)、连接区(J)和恒定区(C)四部分基因片段组成(VDJC),轻链TCR则缺少D区(VJC)。重链和轻链TCR都具有3个互补决定区(CDR),CDR在抗原识别中起主要作用:CDR1和CDR2相对保守,负责识别MHC;CDR3是与抗原直接接触的TCR区域,CDR3由一部分V、全部D和J以及V-D、D-J之间连接区编码,因此CDR3变化程度最高。由于V(65~100种)、D(2种)、J(13种)基因片段本身具有多样性,此外,在重排的过程中,VD及D-J的连接区经常有非模板的核苷酸随机插入或删除,进一步增加了CDR3区的多样性,理论上会形成2×1019种TCRαβ。
由于在一个个体内几乎不会出现两个完全相同的V(D)J体细胞重排,所以TCR序列可作为T细胞克隆的独特识别标志。TCR这种特性可用于评估(1)抗原驱动的T细胞克隆扩增和反应(图1a和d)(2)纵向监测T细胞反应的克隆动态和异质性(图1b和c)(3)在单个细胞中联合评价TCR和细胞表型能够提供T细胞分化通路和T细胞选择的相关信息(图1b)。这些信息不仅有助于理解免疫相关疾病的病因学,也可用于设计治疗靶点。
▲ 图1. 利用TCR多组学测序方法刻画T细胞动态
利用高通量测序技术进行TCR库分析,可以实现在一次实验中同时分析数以百万计的T细胞(图1a)。这些方法通常采用以下两种扩增策略中的一种:(1)多重PCR(2)5’互补端快速扩增(5’RACE)。
多重PCR
由于TCR V基因巨大的多样性,一对引物不足以捕获所有的TCR转录本,所以出现了多重PCR反应。多重PCR方法使用一组与已知V基因互补的正向引物和一组与J或C区域互补的反向引物。在这种引物扩增策略中,首先从T细胞中分离gDNA或RNA,然后采用上述引物对进行多轮PCR扩增,这些引物同时含有用于后续高通量测序的通用序列。Robins等采用这种方法进行深度CDR3β测序发现,TCR库呈现出特定V-J重排偏好。同时发现,不同个体之间初始CDR3β的重合程度远高于平均水平。这些结果表明TCR库并非随机产生的,而存在对某种重排的偏好,这可能是由于在胸腺发育过程中经历了共同抗原的缘故。
此种依赖于多重PCR扩增的方法会引入测序偏好和错误,从而无法获得TCR多样性的真实情况。目前有几种策略用于减小这种偏好,例如,由于cDNA转录本已经是经过剪切的,所以使用mRNA可以采用更少的反向引物以靶向C区域,从而降低了来自多重J引物PCR扩增的偏好性。相反,采用gDNA测序能够避免反转录,从而降低在cDNA合成过程中引入错误的可能。此外,采用合成TCR分子靶向多重引物可以在多重PCR前后定量模板,从而优化引物浓度并校正扩增偏好。
5’ RACE
第二种TCR测序方法是基于5’RACE,这种方法需要使用具有末端转移酶活性的逆转录酶反转录RNA,从而在cDNA的3’端加入非模板C寡核苷酸,用于下游的cDNA扩增,非模板C寡核苷酸叫做模板转换寡核苷酸(Template switch oligo,TSO)。在第一链合成过程中,当到达 RNA 模板的 5’末端时,逆转录酶的末端转移酶活性会在新合成的 cDNA 链的3’末端添加一些额外的核苷酸。这些碱基充当模板转换 (TS) 寡核苷酸锚定位点。在 TS 寡核苷酸和附加的脱氧胞苷片段之间进行碱基配对后,逆转录酶“转换”模板链,从细胞 RNA 到 TS 寡核苷酸,并继续复制到 TS 寡核苷酸的5’端。这种方法可以得到包含完整5’端的cDNA,这意味着可以保留完整的V基因序列。5’RACE法需要较少的PCR扩增,与多重PCR法相比可以降低扩增偏好,然而这些方法仍然会存在来自PCR、模板转换以及测序的错误。
TCR扩增方法的错误矫正策略
由于上述TCR测序策略可能存在的偏好和错误,引入独特分子标签(UMIs)可以有效矫正这些错误。UMIs是一系列随机DNA序列,在cDNA合成过程中被加入cDNA中并标记唯一一条cDNA分子。这种策略有两个优势:(1)通过计数每种UMI的数目可以得到样本中TCR序列的原始分布,这有助于更精确的定量TCR克隆频率;(2)通过将具有相同UMI的reads聚集在一起可以有效矫正PCR和测序错误,从而可以推断出真实的TCR序列。由于TCRs序列之间的差异仅有几个核苷酸,这种矫正步骤可以区分真实的TCR变异和错误导致的假性多样性,所以可以更准确地评估TCR库多样性。然而,获得准确度的代价是较低的灵敏度,因为低频克隆可能由于每个UMI覆盖的read不足而被过滤掉。目前已经开发出对每个核苷酸进行错误矫正的算法,这可以更精确地测量TCR库中的克隆型频率。
TCR靶向测序方法的比较
由于TCR库测序方法不同,所以在分析测序结果时应考虑以下几个因素:首先,是采用DNA还是RNA,这决定了可以适用哪种测序方法。上述两种方法均可用于RNA,然而,如果RNA质量欠佳,则gDNA多重扩增法则可能是更好的选择。其次,TCR测序的目的也会影响测序方法的选择。例如,RNA测序结果无法直接与细胞数目相关联。所以,如果研究目标是定量某个T细胞群的克隆扩增,则gDNA法是更好的选择,因为每个细胞只有一个TCR基因组拷贝。类似地,由于多重PCR使用靶向V基因不同区域的多组引物,所以基本无法获取跨越整个V(D)J区域的全长TCR序列,这种方法足以分析具有最高变异程度的CDR3区,然而,如果拟回答的生物学问题需要评价CDR1和CDR2等其他区域,则5’RACE法更为合适。
此外,两种TCR测序方法每一步的技术特点也会对TCR库结果和后续解释产生巨大影响。在近期一项对多重PCR和5’RACE进行TCR测序的方法学比较研究中,Barennes等在相同的T细胞群体样本中,评价了9种TCR测序流程以比较其可重现性、可重复性以及灵敏度。他们检测到方法特异性组库特征在不同重复间,存在高度一致性,这意味着每种方法会产生特定的偏好。通过比较采用流式细胞术得到的TRB使用结果,他们观察到,相比于基于gDNA的多重PCR或5’RACE法,基于RNA的多重PCR方法呈现出特定V基因更偏的测序结果,这可能反映了RNA转录本丰度差异引起的扩增偏好。无论采用何种方法,获得真实反映生物学免疫组库的测序结果很大程度上取决于起始核酸量,尤其是在检测罕见TCR序列方面。如果一项研究的目标是获取最大TCR多样性或检测罕见克隆型,则应优先考虑选择采用非UMI的5’RACE法,因为这种方法比基于UMI的方法灵敏度更高,尤其是对于TCRα链。相反,如果目标是构建TCR库的代表性克隆结构或者是在扩增水平基础上识别感兴趣的TCRs,则带UMI的5’RACE法也许更合适,因为这种方法更忠实地保留TCR克隆型频率,尽管需要几个重复或者更高的测序深度以捕获低频克隆。
ImmuHub®是由艾沐蒽开发的一套灵活度极高的 TCR 和 BCR 二代测序平台。可根据不同样本类型和研究需求为客户提供个性化的文库构建和测序模式,其中包括 RNA+5’RACE,RNA+多重 PCR 和 DNA+多重 PCR 方法,并配合世界领先的生物信息学算法提供可视化数据分析。艾沐蒽通常使用RNA+5’RACE和DNA+多重 PCR文库构建方法,推荐使用RNA+5’RACE文库构建方法(图2、图3)。
▲ 图2. ImmuHub®技术方法与优势
▲ 图3. ImmuHub®技术路线
在RNA+5’RACE文库构建方法中,艾沐蒽引入UMB(Unique Molecular Barcode,独立分子条形码)进行文库构建。每个样本检测中,在原始RNA模板扩增前加入的UMB种类可高达1700万种,这可对后续PCR反应或测序过程中的错误进行有效纠正,还原真实的数据,完全杜绝PCR错误和测序错误,从而提高准确率。模拟无PCR化测序,还原PCR之前的真实分子数量。
▲ 图4. 基于UMB的纠错
什么是ImmuHub®技术?
点击阅读原文,了解更多有关ImmuHub®
参考文献:
[1] Pai JA, Satpathy AT. High-throughput and single-cell T cell receptor sequencing technologies. Nat Methods. 2021;18(8):881-892. doi:10.1038/s41592-021-01201-8
杭州艾沐蒽生物科技有限公司由美国芝加哥大学科研团队回国创办,是一家专注于通过解码适应性免疫系统来改变疾病的诊断和治疗,并致力于推进免疫驱动医学领域发展的国家高新技术企业。艾沐蒽站在适应性免疫系统研究的最前沿,自主研发的免疫医学平台可揭示和翻译适应性免疫系统的遗传密码,并能应用于癌症、自身免疫性疾病、传染性疾病等免疫介导性疾病的诊断、监测和治疗中。