揭秘结直肠癌:T细胞、肠道微生物、体细胞突变的微妙关系

结直肠癌相关的T细胞受体库异常与肠道微生物组转移和体细胞突变有关

发表期刊:Gut microbes

发表时间:2023年10月

影响因子:12.2

研究方法:

收集了107名结直肠癌患者和30名健康对照者的血液样本进行TCR测序。②收集了97名结直肠癌患者和30名健康对照者的粪便样本进行宏基因组学研。③对79例结直肠癌患者的肿瘤组织和邻近组织进行了靶外显子组测序。④统计分析

研究背景

01

      结直肠癌(CRC)是全球最常诊断的三大癌症之一。然而这种全球性恶性肿瘤发生和发展的潜在机制尚未完全阐明。人类肠道中存在有近1.5公斤的微生物群,某些病毒和/或细菌可能与人类癌症有关。结直肠癌的发生发展与异常的免疫微环境直接相关,淋巴细胞库可以通过互补决定区3(CDR3)分析进行监测,之前研究表明,实体肿瘤患者的外周血中有T细胞增殖。CDR3是TCR两条链上关键区域,负责特异性识别和结合抗原肽,每个T细胞都有独特的CDR3序列。每个个体的TCR库不同,TCR Vβ和Jβ基因的用法不同。也有报道称,TCR库的多样性指数与某些疾病(包括癌症和病毒感染)的预后相关。

      在过去的十年中,大规模的测序研究已经奠定CRC的遗传基础。这些研究揭示了参与CRC发病机制的关键通路,包括RAS、WNT、TGF-β、TP53、PI3K和DNA错配修复通路。鉴定体细胞突变是了解结直肠癌分子机制和开发新疗法的关键。然而,只有一小部分患者从这些靶向治疗中获得长期益处,这就提出了肿瘤免疫微环境(如肿瘤浸润淋巴细胞)和衍生T细胞受体(TCR)库是否是造成这种差异的原因。因此,有必要确定新的靶点。

     越来越多的证据表明,具核梭菌(F. nucleatum)与结直肠癌发生之间存在潜在的联系。众所周知,梭杆菌( Fusobacterium)可以驱动肿瘤前微环境的形成,这种微环境具有高度的化学耐药和免疫抑制作用。在这里,作者进行了宏基因组学、高通量TCR测序和目标外显子组测序,以评估CRC患者和健康对照(HC)样本中的微生物、TCR和体细胞突变。

研究结果

02

结直肠癌患者和健康个体在CDR3区域的Vβ和Jβ基因使用上存在差异

      作者通过高通量测序技术分析了30名健康供者和107名结直肠癌患者外周血样本中表达的TCRβ谱(表1)。

      每个健康供体或CRC患者在TCR多样性方面具有不同的特征。健康供体的TCR多样性相对较高,这可以从均匀分布的TCR Vβ-Jβ基因使用组合中看出(图1a显示了六个具有代表性的基因库);通过偏置的TCR Vβ-Jβ基因使用组合可以看出,结直肠癌患者的TCR多样性相对较低(图1b)。在48个功能性人类Vβ基因中,TRBV2的用法,TRBV3-1, TRBV5-1, TRBV5-4, TRBV5-5, TRBV5-6, TRBV6-1, TRBV6-5, TRBV6-6, TRBV7-6, TRBV7-7, TRBV7-8, TRBV7-9, TRBV10-1, TRBV10-2, TRBV11-1, TRBV11-2, TRBV12-3, TRBV12-4, TRBV15和TRBV29-1 CRC患者明显高于健康供者;健康供者中TRBV4-1、TRBV4-2、TRBV6-4、TRBV7-3、TRBV9、TRBV10-3、TRBV11-3、TRBV13、TRBV16、TRBV18、TRBV19、TRBV20-1、TRBV24-1、TRBV28、TRBV30的使用率显著高于结直肠癌患者(图1c)。对于功能性Jβ基因,TRBJ1-4在结直肠癌患者中的使用显著高于健康供者(图1d)。

图1

结直肠癌患者和健康供者TCR谱特异性序列特征

      本研究中,将TCR克隆的频率在样本中总读取量的0.5%以上定义为高扩增克隆(HEC)。比较CRC组和HC组之间的HEC数量,CRC组的HEC比率明显高于HC组(图2a)。这表明CRC患者的CDR3序列与HCs相比具有明显较多的克隆片段。作者通过使用TCR库重叠来评估两种不同样本的相似性,TCR库重叠定义为共享TCRβ序列的测序reads总数除以测序reads总数,范围为0 ~ 1。CRC组的TCR库重叠明显高于HC组(图2b),这表明CRC患者与HC组相比具有相对较低的TCR多样性。TCRβ CDR3在健康供体和结直肠癌患者中的长度分布相似,在12个氨基酸处达到峰值(图2c)。但CRC患者的CDR3 aa长度为6、18和22比HC组少。

      随后,作者剔除HC组中出现的序列,并根据频率对剩余的CRC特异性CDR3序列进行排序(图2d)。直方图中为前50位的CRC特异性CDR3序列,表中为前10位的CRC特异性CDR3序列。为了进一步研究CRC和HC中CDR3序列的差异,取lg值创建总热图。发现大多数CRC和HC个体具有不同的CDR3序列,只有少数共同的序列(图2e)。

图2

结直肠癌患者的肠道微生物与HC个体有显著差异

      肠道微生物可以调节宿主免疫的关键位置。TCR测序分析可能是提示CRC患者肠道环境的发生显著变化,因此检测了肠道微生物组特征。通过收集了97例CRC患者和30例HC个体的粪便,并通过计量动力学技术检测了这些微生物(表2)。

      堆叠柱状图显示了CRC患者和HC个体中物种相对丰度前十位(图3a)。CRC组的Shannon指数显著高于对照组(图3b)。采用非度量多维尺度(nMDS)比较结直肠癌患者和肝癌患者之间的β距离。结果显示CRC组和HC组在nMDS1维度和nMDS2维度上存在显著差异(图3c)。LEfSe的高维比较进一步表明,在CRC患者中F.nucleatumE.coliBacteroides thetaiotaomicronPorphyromonasOdoribacter splanchnicus,Prevotella,Vicia cryptic virus(VCV)和Dasheen mosaic virus (DsMV),而Lachnospiraceae,F. prausnitziiR. intestinalis 在HC个体中明显更丰富(图3d-e)。EggNOG数据库是国际公认的专业同源聚类基因群注释数据库,包括原始的COG/KOG功能分类和基于分类学的功能注释。目前,该数据库(v4.5.1)包含190,000个同源分类群,涵盖2,031个物种。最丰富的KEGG同源物富集在碳水化合物代谢、氨基酸代谢、全局和概述图、膜转运和信号转导等途径中(图3f)。根据eggNOG/COG 注释,最丰富的NOG和最富集的GO项也是一个代谢过程。根据GO注释,生物过程类别中NOGs最丰富的是代谢过程、细胞过程和单个生物体;细胞成分类别中的细胞、细胞部分和膜;分子功能类别的催化活性和结合(图3g)。在前30个富集的GO功能中,主要富集的GO功能与生物过程(如异柠檬酸代谢过程、半乳糖酸代谢过程、d-半乳糖酸代谢过程和l-赖氨酸分解为乙酰辅酶a的过程)和分子功能(如切酶ABC活性、半乳糖酸分解代谢过程和d-半乳糖酸分解代谢过程)有关(图3h)。

图3

CRC相关的体细胞突变与TCR和肠道微生物有关

      为了探究基因变化是否介导结直肠癌患者微生物和免疫的巨大变化,并是否产生结直肠癌发生的相干信号,作者对79例结直肠癌患者癌组织和癌旁组织中的16个基因进行了全外显子组测序(表3)。

      每个样本中每个基因的突变信息以瀑布图表示,其中底部带有注释的各种颜色代表不同的突变类型(图4a)。在队列中,16个靶基因的体细胞突变比例由高到低依次为APC、KRAS、PIK3CA、GPT2、MSH2、MLH1、TP53、CTNNB1、AKT1、MMP2、NRAS、CD274、STK11、CTLA4、PARK7和SNCA。综上所述,这些突变进一步按照不同的类别进行分类,其中错义突变所占比例最大(图4b),单核苷酸多态性的发生频率高于插入或缺失(图4b), C>T是CRC中最常见的单核苷酸变异(SNV)(图4b)。此外,作者统计了每个样本中改变的碱基数量,并在箱形图中使用不同颜色说明突变类型(图4b)。在结直肠癌中排名前十的突变基因包括APC(52%)、PIK3CA(28%)、MLH1(20%)、CTNNB1(18%)、KRAS(32%)、GPT2(21%)、AKT1(14%)、TP53(20%)、MMP2(14%)和MSH2(21%)(图4b)。作者还发现F. nucleatum与GPT2呈显著正相关(P=0.004), F. prausntzii与PIK3CA呈显著负相关(P=0.0119)(图4c)。GPT2与ASSIGGSSYNEQF(COR=0.45 p=0.0011)、ASSGETQY (COR=0.35 p=0.014)、ASSFNEQF (COR=0.35 p=0.014)显著相关。PIK3CA与ASSIGGSSYNEQF(COR=0.45 p=0.0011)、ASSGETQY (COR =0.35 p=0.014)、ASSFNEQF (COR=0.45 p=0.0011)也有显著相关性(图4d)。揭示了胶原蛋GPT2、PIK3CA的结构。

图4

建立基于肠道微生物群和TCR库区分CRC患者和HC个体的预测分类器

      生物标志物的筛选和获取作为最直接、最快速、最有效的诊断手段,在疾病预防、早期诊断、个体化治疗和预后评价等方面发挥着重要作用。通过合并微生物群和TCR信息表,共发现103份样本(73名结直肠癌患者和30名健康个体)同时包含TCR数据和微生物数据。然后,作者使用Wilcoxon秩和检验分析TCR数据与物种数据(物种水平)的差异,以P<0.05为阈值。使用算法从不同物种和TCR数据中选择合适的标记进行建模。使用随机森林(RF)算法对特征的重要性进行排序。

     通过对不同数量的特征进行建模,发现当选择以下15个特征时, 模型效果最好:     ‘ASSPSRQGTAEAF’,  ‘ATSDLAGDTDTQY’, ‘F.prausnitzii’,‘RPQGVPHSYNEQF’,‘SAKRREWQGRRGYT’,‘AWSPISGFENIQY’,‘ASSQERLTGVSPLH’,‘SVVVMLNYNEQF’, ‘R.intestinalis’,‘ASSQESTGNQPQH’,‘DsMV’,‘ASSHPREREDNYEQF’,‘ASSSGHYEQY’,‘SARGLAGNEQF’and ‘F. nucleatum以上15个指标的特征重要性排序系数值如图5a所示。由于样本数量相对较少,作者直接对训练模型的参数进行优化,并通过十倍交叉验证来检验模型的效果,以提高模型的准确性。选择随机森林算法构建的射频模型接收机工作特征(ROC)曲线如图5b、c所示。最终模型的效果可以通过曲线下面积(AUC)来评价。作者的CV AUC为0.92,训练AUC为0.99,训练准确率为0.95(图5b,c)。精度或AUC越高,效果越好。为了进行外部验证,通过收集了一个新的独立验证队列,包含46个样本,包括26例CRC患者和20例健康对照组(表4)。训练后的随机森林模型对验证的AUC 队列值为0.90(图5d)。

      根据CRC患者的TNM分期,I期和II期被认为是早期CRC, III期和IV期被认为是晚期CRC。生物标志物对健康个体早期CRC的诊断效果较好。训练和测试的AUC分别为98.99%和97.5%(图5e,f)。这些生物标志物也能很好地从健康个体中诊断晚期结直肠癌。训练和测试的AUC分别为99.22%和97.92%(图5g,h)。但生物标志物在区分结直肠癌的不同阶段表现稍差。训练和测试的AUC分别为87.5%和83.33%(图5i,j)。

图5

F. nucleatum-阳性和F. nucleatum-阴性结直肠癌患者外周血TCRβ表达谱的不同特征

      在研究中,来自LEfSe的高维比较表明,F. nucleatum在CRC患者中的代表性过高(图3e)。作者还发现F. nucleatum与GPT2呈显著正相关(P=0.004)(图4e)。此外,F. nucleatum是基于微生物组和TCR库的随机森林分类器的15个特征之一(图5a-c)。通过qPCR检测了大肠结直肠癌患者肠道肿瘤组织中F. nucleatum 的表达。为了确定F. nucleatum特异性TCR库特征,作者比较了F. nucleatum-阳性CRC患者(n = 22)和F. nucleatum-阴性CRC患者(n = 85)的TRBV和TRBJ基因的表达水平。TRBV7-3的使用在HC组高于CRC组,在F. nucleatum-阴性CRC组显著高于F. nucleatum-阳性CRC组;TRBV14在F. nucleatum-阳性CRC患者中的使用明显高于F. nucleatum-阴性CRC患者(图6a)对于功能性Jβ基因,TRBJ1-4和TRBJ2-2在F. nucleatum-阳性CRC患者中的使用显著高于F. nucleatum-阴性CRC患者(图6b)。TRBJ1-4的表达在CRC患者和F. nucleatum-阳性患者中均持续增加。TCRβ CDR3在F. nucleatum-阴性和F. nucleatum-阳性CRC患者中的长度分布相似,在12-氨基酸时达到峰值(图6c)。然而,与F. nucleatum-阴性的结直肠癌患者相比,F. nucleatum-阳性的患者的17个氨基酸的长度增加,18个氨基酸的长度减少。F. nucleatum-阳性结直肠癌患者和结直肠癌患者中18个氨基酸减少。

      F. nucleatum-阳性的CRC患者与HC个体的CDR3克隆比例比较,差异有统计学意义(图6d)。F. nucleatum-阳性CRC患者、F. nucleatum-阴性CRC患者和HC个体间HEC数比较,差异有统计学意义(图6e)。这表明,与F. nucleatum-阴性CRC患者相比,F. nucleatum-阳性CRC患者的CDR3序列的大克隆片段明显增加。这一特征与CRC与HC的差异是一致的。热图显示,大多数HC个体、F. nucleatum-阳性CRC患者和F. nucleatum-阴性CRC患者的CDR3序列不同,只有少数常见序列(图6f)。

图6

结论

03

      研究中大队列多组学数据表明,在结直肠癌的发展过程中,TCR的克隆性、微生物组和遗传学发生了变化验证了微生物组、TCR和靶基因之间的相关性,并成功鉴定了CRC患者和HC个体的几种微生物和TCR生物标志物。目前,这是第一个报道基于微生物组和TCR的随机森林分类器用于区分CRC患者和HC个体的研究。研究揭示了TCR、肠道微生物组和体细胞突变影响CRC的生物标志物,这可能会改变临床实践

      越来越多的证据表明,基于深度测序的T细胞库可以作为癌症患者免疫反应的生物标志物。基于TCR基因测序来评估淋巴细胞浸润的新技术提供了克隆信息和丰度。CRC组与HC组HEC比较,CRC组HEC比值明显高于HC组。高克隆性表明只存在少量丰度的克隆,低克隆性表明存在多个丰度相似的克隆。研究结果表明,CRC患者的CDR3序列具有较高的克隆性,而TCR多样性较HC个体差。此外,CRC患者和HC个体在氨基酸序列、Vβ和Jβ基因、CDR3长度等方面存在显著差异。

      总之,研究了结直肠癌靶基因体细胞突变与TCR克隆性和微生物生物标志物的相关性最后,构建了宏基因组和TCR测序诊断标记来区分CRC患者和HC个体。F. nucleatum-阴性CRC患者相比,F. nucleatum-阳性CRC患者的CDR3序列显示出大克隆片段的显著增加。本研究首次构建了基于微生物组和TCR的随机森林分类器,用于区分CRC患者和HC个体。由于CRC-预测随机森林分类器具有强大的识别能力和预测能力,研究结果突出了将微生物组和TCR研究与治疗管理联系起来的可能性。

参考文献

Cao Y, Wang J, Hou W, Ding Y, Zhu Y, Zheng J, Huang Q, Cao Z, Xie R, Wei Q, Qin H. Colorectal cancer-associated T cell receptor repertoire abnormalities are linked to gut microbiome shifts and somatic cell mutations. Gut Microbes. 2023 Dec;15(2):2263934. doi: 10.1080/19490976.2023.2263934. Epub 2023 Oct 5. PMID: 37795995; PMCID: PMC10557533.

什么是ImmuHub®技术?

关于艾沐蒽

杭州艾沐蒽生物科技有限公司成立于2016年,是国际前沿的专注于免疫驱动医学技术的国家高新技术企业。创始人团队来自美国芝加哥大学,在2010年开始使用免疫组基因高通量测序技术开展各种疾病相关研究,于2016年通过自主研发,全国首家推出NGS-MRD血液肿瘤微小残留病(MRD)检测Seq-MRD®,并授权泛生子(纳斯达克代码:GTH)使用。同时,公司拥有Immun-Traq®肿瘤治疗伴随诊断、Immun-Cheq® |T细胞免疫测评以及ImmuHub®免疫组测序科研服务产品,并布局有基于AI机器学习算法的T-classifier®肿瘤早筛、单细胞测序、TCR-T和抗体发现等平台管线。公司构建几十项发明专利和软件著作权为核心的自主知识产权体系,为医院临床、生命科学研究、新药开发等提供解决方案和产品。艾沐蒽专注于通过解码适应性免疫系统来改变疾病的诊断和治疗,并致力于推进免疫驱动医学领域发展。