添加链接
link之家
链接快照平台
  • 输入网页链接,自动生成快照
  • 标签化管理网页链接


新抗原在T细胞识别肿瘤细胞中起关键作用;然而,只有一小部分新抗原真正引发了T细胞反应,而且关于哪些新抗原被哪些T细胞受体(TCR)识别的线索很少。 这里建立了一个名为pMHC-TCR结合预测网络(pMTnet)的基于迁移学习的模型,以预测由MHC I类呈递的新抗原和TCR结合特异性。 pMTnet通过一系列分析得到了全面验证,并比以前的工作取得了很大的进步。通过将pMTnet应用于人类肿瘤基因组学数据,发现新抗原通常比自身抗原更具免疫原性,但人类内源性逆转录病毒E(一种在肾癌中重新激活的特殊自身抗原)比新抗原更具免疫原性。进一步发现,具有更多克隆扩增T细胞的患者对躯干而不是亚克隆新抗原表现出更好的亲和力,对黑色素瘤和肺癌的免疫治疗的预后和治疗反应更有利,但在肾癌中则不然。预测TCR-新抗原/抗原配对是现代免疫学中最艰巨的挑战之一。然而, 这里仅使用TCR序列(CDR3β)、抗原序列和MHC I类等位基因实现了配对的准确预测,揭示了对人类肿瘤中TCR和主要组织相容性复合物之间相互作用的独特见解,使用pMTnet作为发现工具 。


新抗原是由肿瘤细胞表面的MHC蛋白呈递的短肽,由体细胞突变基因转录和翻译。 新抗原通过与TCR的相互作用作为细胞毒性T细胞的靶标,因此是免疫编辑的关键参与者 。免疫疗法虽然改变了癌症患者,但仅使一小部分患者受益。重要的是,这些免疫疗法突出了新抗原在检查点抑制剂诱导的免疫反应中的作用。因此,对新抗原/抗原和TCR之间相互作用的准确和全面表征对于了解癌症进展、预后和对免疫疗法的反应性至关重要。

关于新抗原和抗原生物学的最基本和未解决的问题之一是缺乏对尽管在细胞表面表达和呈递为什么并非所有新抗原都会引发T细胞反应(免疫原性)。关于TCR与MHC分子(pMHC)呈递的免疫原性新抗原的结合特异性知之甚少。 将pMHC连接到TCR序列的能力对于监测免疫系统和肿瘤之间的相互作用很重要,对于增强各种免疫疗法的设计或实施至关重要 。例如,新抗原疫苗候选者的选择可以通过患者循环中预先存在的相容TCR来告知。因此, 已经开发了许多实验方法:例如四聚体分析、四聚体相关T细胞受体测序和T-scan,来检测TCR和pMHC之间的配对 。然而,这些方法耗时、技术上具有挑战性且成本高昂。此外,每种技术都有其局限性。检查了多项涉及此类技术的研究,发现其验证率低至1%;然而,由于许多因素,这可能被低估了,包括在患者采样的T细胞库中匹配TCR的罕见性。这些缺陷要求开发最先进的生物信息学算法来预测新抗原的TCR结合特异性,这将大大减少识别配对的时间和成本,并将极大地补充实验方法。

在这项工作中,使用迁移学习(深度学习的一个新分支)来训练一个名为pMTnet的模型,该模型可以预测I类pMHC的TCR结合特异性。使用大量独立验证数据系统地验证了pMTnet,并展示了在以前的工作中取得的进步。将pMTnet应用于人类肿瘤测序数据,并对免疫原性的来源、预后和对免疫疗法的治疗反应进行了一系列新的观察 。 总体而言,pMTnet解决了长期存在的TCR-pMHC配对预测问题,揭示了全基因组规模的生物学见解,并可作为构建预测免疫治疗反应的生物标志物的基础。


深度学习TCR-抗原结合特异性

从概念上讲,采用分阶段的方法来划分学习目标,将抗原的TCR结合特异性(pMHC)分为三个步骤,以降低预测任务的难度。 首先,使用长短期记忆(LSTM)网络训练了pMHC(仅限I类)的数字嵌入,以便抗原和MHC的蛋白质序列可以用数字表示 。 其次,使用堆叠的自动编码器训练了TCR序列的嵌入,它再次对TCR序列的文本字符串进行了数字编码。这两个步骤创建了可用于数学运算的数字向量,并为最终配对预测奠定了基础 。 最后,在这两个嵌入之上创建了一个深度神经网络,以一种具有生物学意义的方式结合来自TCR、抗原肽序列和MHC等位基因。采用微调来最终确定TCR和pMHC之间配对的预测模型 。

为了在数字上嵌入TCR,专注于TCRβ链的CDR3区域,这是抗原识别特异性的关键决定因素。首先使用Atchley因子编码氨基酸符号,它使用五个数字来全面表示每个氨基酸的物理化学性质。然后,构建了一个堆叠自动编码器 (图1a) 来学习TCR的短数字嵌入,其中Atchley版本的TCR作为243,747个独特的人类TCRβ CDR3序列的输入。自动编码器能够通过无监督的分解重构过程捕获复杂输入的关键特征,并以短数字向量的形式嵌入输入的捕获特征。虽然只使用了CDR3β序列,但这些CDR3由V、D和J基因组成,从而可以将它们的特征间接注入嵌入中。通过比较输入TCR和重建的TCR来验证这个自动编码器。分析表明,可以通过CDR3嵌入以高度一致的方式重建CDR3 (图1b) ,证明了这种自动编码器被成功训练。 原始TCR CDR3 Atchley矩阵和重建矩阵之间的Pearson相关性通常大于0.95 。这个TCR自动编码器的有效性也得到了最近的【Mapping the functional landscape of T cell receptor repertoires by single-T cell transcriptomics. Nat. Methods 18, 92–99 (2021).】的支持,其中在这个自动编码器上建立了一个称为Tessa的统计模型,成功地从单细胞测序数据解释了TCR库的功能重要性。

对于pMHC的嵌入,首先使用深度LSTM神经网络 (图1c) 重新实现了netMHCpan模型,以便netMHCpan模型的内部层可用于与该模型的其他部分集成。该模型的输入是MHC序列(仅限I类)和抗原蛋白序列。在这个训练阶段的输出是抗原是否与MHC分子结合。尽管这个输出专门用于预测抗原和MHC结合,但它之前的层应该包含有关pMHC复合物整体结构的重要信息。 用于训练netMHCpan的相同数据用于重新训练该模型;这些数据包括172,422次肽-MHC结合亲和力测量,涵盖来自人类的130种I类MHC 。独立测试数据集中预测的结合概率和真实结合强度的Pearson相关性达到0.781 (图1d) ,与原始netMHCpan的Pearson相关性0.76。对于学习TCR和pMHC之间配对的下一阶段,在最终输出层之前提取了一个数字向量作为pMHC的数字嵌入。

最后,利用训练有素的TCR和pMHC的数字向量编码来学习它们之间的配对。基于这两个子模型的输出构建了一个全连接的深度学习网络,最后一层有一个神经元用于预测配对 (图1e) 。基于这个集成模型,创新地采用了差异学习模式,在该模型中,该模型被输入一个真正的TCR和pMHC结合对,以及在每个训练周期中具有相同pMHC的另一个负对。从一系列研究(N=13,388)和4个Chromium单细胞免疫分析解决方案数据集(N=19,219)中收集了总共32,607对TCR-pMHC结合。一些数据库提供了用来过滤记录的质量指标,以仅保留高置信度的配对。例如,在VDJdb数据库中,只包含带有VDJ的记录。在TCRGP中也是如此;重复记录被删除。通过随机不匹配这32,607对的TCR和pMHC创建了十倍的负对。训练进行了150个时期 (图1f) 。将最终模型pMTnet命名为pMHC-TCR结合预测网络。在差异训练之后,预测输出也以比较的方式生成。pMTnet输出一个介于0和1之间的连续变量,反映TCR和pMHC之间预测的结合强度的百分位Rank,相对于同一pMHC的10,000个随机采样的TCR(作为背景分布)池。 使用较小的Rank来表示更强的绑定,类似于netMHCpan 。重要的是,由于总是将抗原和MHC捆绑在一起,并让模型专注于辨别结合或非结合TCR,因此所有验证都是特定于区分TCR结合特异性,而不是抗原-MHC结合或整体免疫原性。

● 图1:深入学习新抗原的TCR结合特异性 。a、用于学习TCR嵌入的堆叠式自动编码器的结构。b、原始的和重建的TCR几乎是相同的。显示了原始TCR(氨基酸序列)、Atchley因子编码的TCR(数的Atchley矩阵)、重构的TCR(以重构的Atchley矩阵的形式)和重构的TCR序列(通过最接近的欧几里德距离确定的氨基酸符号)。c、重新实现的netMHCpan模型的结构。d、通过实验获得的数据,内部(红色)和独立(绿色)验证(新)抗原与由pMHC嵌入模型产生的MHC蛋白之间的预测结合。Pearson相关性随训练周期(Epoch)的增加而增加。e、最终的pMTnet模型的结构。f、pMTnet在训练时间内的损失函数,以Epoch为单位。显示了在训练队列中拆分的内部验证子集(红色)和独立验证队列(绿色)上的性能。


pMTnet在独立的实验数据

中预测TCR-pMHC配对

使用从独立研究中收集的大量已知TCR-pMHC结合对进行了一系列验证分析。 首先收集了619个经过实验验证的TCR-pMHC结合对。与主要从VDJdb等数据库批量导出和高通量实验构建的训练队列相比,构成测试队列的结合对大多受到原始报告的严格逐个审查 。在此验证分析和以下所有验证分析中,训练数据集中出现的TCR-pMHC对被删除,因此测试集完全独立于训练集。随机不匹配产生了十倍以上的负对。使用了两个指标,接收器操作特征(ROC)的曲线下面积(AUC)和精确召回(PR)。该队列中ROC的AUC达到0.827,AUC达到0.566 (图2a) 。为了测试pMTnet是否真正学习了决定绑定的特征,或者只是记住了配对案例,研究了与训练TCR具有不同相似度的TCR的预测性能 (图2b,左组) 。为了计算相似度,根据TCR嵌入计算了每个测试TCR到所有训练TCR的欧几里得距离的最小值。ROC和PR的AUC显示为测试TCR的子集,在每个cutoff点上具有最小距离,并且pMTnet的性能相对于TCR差异水平的增加相对稳健。对pMHC进行了相同的分析并进行了类似的观察 (图2b,右组) 。

还将pMTnet的性能与开发用于预测TCR/表位配对的其他软件进行了比较,包括netTCR、TCRex和TCRGP 。与pMTnet不同,这三个都受到可用于预测的表位/MHC/TCR类型的限制。例如,netTCR仅适用于HLA-A*02:01等位基因、短于10个氨基酸的表位和短于10个氨基酸的CDR3。 当在满足这三个软件包标准的相同表位/MHC/TCR上进行测试时,pMTnet显示出比每一个都有很大的改进 。还验证了pMTnet来自VDJdb和Gee等人在训练期间未使用的附加高质量配对数据,并表明pMTnet的ROC下的区域在它们上达到了>0.8并且表现优于竞争软件。

接下来,通过结合对T细胞的预期影响来验证TCR和pMHC之间的结合预测,即具有更高pMHC亲和力的T细胞应该得到更多的克隆性扩增。10× Genomics Chromium Single Cell Immune Profiling平台可生成单细胞5‘文库和富含V(D)J的文库,并与高度复合的pMHC多聚体试剂相结合。一个T细胞的TCR和每个被测试的pMHC之间的抗原特异性是通过计算该细胞中该特定pMHC的条形码测序的数量来描述的。检查了4个单细胞数据集,这些数据集描述了来自4个健康捐赠者的44个pMHC对CD8+T细胞的抗原特异性。对于每个TCR克隆,记录了所有44个pMHC中预测结合强度最强的pMHC。发现,T细胞克隆型的克隆大小和预测Rank与所获得的统计学意义呈负相关 (图2c) 。换句话说, 具有预测的pMHC结合强度更强的TCR的T细胞也比其他没有强结合的T细胞扩增得更多 。优势比试验用高亲和力结合抗原对扩增的T细胞克隆型进行了浓缩,这一点更清楚地表明了这一点。相反,观察到一些克隆大小较小的TCR与pMHC的预测结合Rank较小,这可能是由于TCR与pMHC之间结合的随机性质造成的,也可能是不断涌入的尚未发生扩增的新克隆所致。

进一步分析了pMTnet是否能够区分肽序列的精细细节对TCR结合特异性的影响。从之前的研究中获得了186对pMHC-TCR。具有单一氨基酸取代的LPEP多肽类似物被测试对3个不同CDR3β的不同TCR的特异性:在所有94个类似物中,36个被确定为较强的结合(<100pM的多肽需要诱导T细胞的细胞毒裂解),其他被认为是较弱的结合。丙氨酸取代的MART-1多肽被测试与TCRMEL5和ILA1的亲和力:70个多肽中有15个与TCRs相互作用(平衡解离常数(Kd)<500mM)。在【Immunogenicity of somatic mutations in human gastrointestinal cancers】中,所有22个模拟多肽中有11个通过干扰素-γ ELISPOT验证激活了T细胞;pMTnet产生了预测,对于每个肽类似物(在与MHC的络合物中),确实预测结合较强的类似物比它们的类似物有更强的结合强度( 图2d ;AUC=0.726)。

● 图2:验证pMTnet 。a、对于619个实验验证的TCR-pMHC结合对和10倍以上的随机洗牌负对,显示了预测结合Rank(越小意味着结合越强)的ROC和PR的AUC。b、示出了用于嵌入的30维主成分的不同欧几里德距离cutoff点的ROC和PR曲线的AUC,其中cutoff点用于子集化619测试队列的TCR(左侧组)和pMHC(右侧组)。AUC以浅蓝色和绿色显示。由这些分界线选择的619个测试队列中选定的TCR和pMHC的比例由红色标号显示。c、TCR克隆型的扩增与其与10× Genomics Chromium Single Cell Immune Profiling数据库中pMHC的结合强度有关;该数据集在验证阶段使用的部分完全独立于在培训阶段使用的部分。y轴显示每个克隆类型在整个TCRs池中的百分比。用Spearman相关检验计算P值。d、经实验验证与目标TCR有更强亲和力的多肽类似物,通过pMTnet预测有更强的亲和力。ROC曲线图显示了与预测相关的结果。

进一步验证了pMTnet在前瞻性实验数据中的有效性。对一名既往流感、EB病毒(EBV)和人类巨细胞病毒(HCMV)感染的献血者进行了批量TCR测序和HLA等位基因分型 。这些实验是在血液和这位捐赠者肺肿瘤的体外扩增的T细胞中进行的。分析了大量的TCR测序数据,并预测了TCRs与4种病毒pMHC的结合,包括 M型流感病毒(GILGFVFTL)、甲型流感病毒(FMYSDFHFI)、EBV BMLF1 (GLCTLVAML)和HCMVpp65 (NLVPMVATV) 。发现在血细胞和体外扩增的T细胞中, 被预测与这些多肽有更强结合(较小Rank)的TCR显示出比其他TCR (图3a) 更高的克隆比例。 计算了高度扩增的TCR与更强的预测结合的富集率,其中更高的优势比表示更高的正向富集率。观察到血液和扩增的T细胞中都有更强的浓缩,同时对预测的结合Rank进行了排列,并观察到更小的优势比 (图3b) 。然后,用每个病毒多肽处理扩增的T细胞,并用成对的TCR-seq进行单细胞RNA测序(scRNA-seq);还进行了载体治疗。鉴定了在每个治疗组和载体治疗组中捕获的TCRs,并使用pMTnet预测TCRs与每个肽的结合。从每个实验中选择了最高TCR(pMTnet预测Rank<2%),并首先检测了这些最高结合TCR克隆型的T细胞的基因表达。通过将T细胞与预测的顶部结合TCR和其他T细胞进行比较,观察到差异表达的基因丰富在对T细胞的增殖、迁移、生存和细胞毒性至关重要的途径(GLCTLVAML的结果如 图3c 所示)。还计算了这些最高结合TCR克隆类型的克隆大小,发现这些TCR克隆类型中的大多数在治疗组中表现出比载体组更大的克隆比例( 图3d ;克隆大小比>1)。

● 图3:pMTnet预测的前瞻性验证 。a、在血细胞(左)和体外扩增的T细胞(右)中,预计结合Rank较小的TCR CDR3克隆大小较高。x轴显示了与4种病毒pMHC中任何一个的最小结合Rank,而y轴显示了每个样本中每个TCR CDR3克隆型的克隆比例。b、高度扩增的T细胞的优势比,血液/扩增的T细胞的结合Rank较小。提取了克隆比例>0.1%且预测Rank<2%(HB)的CDR3数量、克隆比例<0.1%且预测Rank>2%(Ls)的CDR3数量、克隆比例>0.1%且预测Rank>2%(LB)的CDR3数量、克隆比例<0.1%且预测Rank<2%(Hs)的CDR3数量。优势比计算为(HB*Ls)/(LB*Hs)。为了进行对照,进行了预测Rank的排列,并再次计算了优势比。c、预测与病毒pMHC结合的T细胞(以EBV BMLF1为例,Rank cutoff=0.1)和未结合的T细胞中差异表达的基因富集T细胞功能所必需的途径。Circos图的右侧显示了差异表达的基因,它们在左侧的颜色相同的相应途径中富集。d、病毒pMHC-治疗组与载体治疗组的克隆比例。红色水平线(Ratio=1)表示没有变化。


结构分析支持预测的TCR-pMHC相互作用

进行了计算机突变分析,以寻找CDR3残基的结构证据,其突变导致TCR和pMHC之间的预测结合发生显著变化。 对于每个CDR3残基,将其数字嵌入突变为全零向量(置零)。这与生物物理学研究中的丙氨酸扫描技术相似但不同。首先对619个测试队列的所有TCR进行了残基突变,并记录了野生型TCR和突变TCR之间预测的结合Rank的差异。 将每个TCR CDR3分成6个等长的片段 (图4a) ,并且正如预期的那样,CDR3中间片段中的残基突出并与pMHC更紧密接触,更有可能导致预测的结合发生更大的变化与外部段相比时的亲和力(第3或第4段与任何其他段之间的t检验P值<0.00001) 。此外,从免疫表位数据库队列中提取了总共13个TCR-pMHC对,蛋白质数据库(PDB)中提供了三维晶体结构,其预测的结合亲和力Rank小于2%。根据结构,根据CDR3残基是否与4Å内的pMHC残基形成任何直接接触对它们进行分组。发现接触残基比非接触残基更可能导致预测的pMHC结合强度发生更大的变化( 图4b ;P值=0.036)。还进行了丙氨酸扫描,发现了类似的趋势(第3或第4段与任何其他段之间的t检验P值<0.0001, 图4c )。对于零位扫描,丙氨酸扫描没有那么显著,这可能是因为在丙氨酸扫描中,所有丙氨酸在突变后被推定为没有作用;然而,用其他具有大侧链的残基取代一个丙氨酸可能会影响蛋白质复合体的整体结构完整性,这实际上可能导致结合亲和力的变化。在图4a-c中,显示了排名百分位数的变化(改变为更强或更弱的结合);然而,对排名百分位数变化方向的检查表明,计算机中的突变主要导致更弱的结合。

在图4d中,显示了生成的TCR-pMHC结构(PDB ID:5HHM)的示例。总体而言,发现R98和S99在零位扫描 (图4d,上图 )和ALA-9扫描( 图4d,下图 )后预测的Rank差异最大,这是位于CDR3中间的残基,与pMHC接触最多。另外两个序列变化相对较大的氨基酸可以用它们在CDR3环的形成和稳定中的关键作用来解释。还观察到S95与Q103与E102和Y104的侧链形成的小环形成链内接触。

● 图4:结构分析支持预测的TCR-pMHC相互作用 。a、CDR3中间片段的残基更有可能引起预测的结合亲和力的较大变化。将每个TCR CDR3分成6个等长的片段,并绘制了所有研究的CDR3的每个片段中预测的残基结合Rank的标准化变化。一个肽的每个氨基酸的Rank变化的绝对值被该肽的Rank变化的最大绝对值标准化。b、与直接接触的残基比非接触的残基更有可能引起预测的pMHC结合强度的更大变化。根据三维晶体结构,CDR3残基根据它们是否与pMHC残基形成任何直接接触而被分类。P值的计算采用单向Wilcoxon符号秩次检验。c、与在a和b中执行的分析相同,但使用丙氨酸扫描。对于a-c的框图,框边界表示四分位数范围,延伸到最极端的数据点,该点不超过四分位数范围的1.5倍,框中间的线表示中位数。d、预测了一个示例TCR-pMHC结构(PDB ID:5HHM)的CDR3中氨基酸残基的Rank变化。上图显示了调零的结果,下图显示了丙氨酸扫描的结果。e、5HHM的三维结构。蓝色:TCRβ链的CDR3;黄色:TCRα链;浅色:TCRβ链的其他区域;洋红色:抗原;绿色:HLA。


人类肿瘤中TCR-pMHC相互作用的特征

为了进一步验证pMTnet并证明pMTnet作为识别发现工具的价值,描述了几种免疫原性最强的肿瘤类型中TCR和pMHC的相互作用,在这些肿瘤类型中,肿瘤抗原呈递机制更有可能处于激活状态。分析了癌症基因组图谱(TCGA)的基因组数据和过去发表的肾细胞癌(RCC)内部数据。TCGA患者包括肺腺癌患者(LUAD)、肺鳞癌患者(LUSC)、肾透明细胞癌患者、黑素瘤患者(SKCM)。

研究了几类可能影响肿瘤微环境中T细胞群的抗原。可能影响T细胞保留和扩增的第一类抗原是肿瘤新抗原。另一类抗原是肿瘤自身抗原(也称为肿瘤相关抗原) ,例如碳酸酐酶IX。特别是在肾癌中,发现了一类特殊的自身抗原——人类内源性逆转录病毒E(HERV-E)的再激活,它编码了几种已通过实验验证的免疫原性肽。其他T细胞的浸润可能是由于先前的病毒感染,或者它们可能只是旁观者。长期以来,该领域一直在争论这些因素中的哪一个在塑造肿瘤中T细胞库方面最有效。为了回答这个问题,从基因组数据(方法)中确定了候选新抗原和自身抗原。对于RCC,分析了这种非常明确的HERV-E的表达。该管道还检查了所有其他HERV,显示其他HERV的肿瘤与正常表达比率远小于HERV-E,并且缺乏关于这些HERV是否编码免疫原性肽的报道。 在每个患者样本中,将每个TCR分配给一个具有最低预测结合Rank的抗原(新抗原和自身抗原) ,并且还满足该结合Rank必须低于一系列结合Rank中的每一个的标准。0%和2%之间的cutoff值(否则,此TCR将被取消分配)。

对于每个患者样本,计算了每类抗原预计至少与一种TCR(定义为免疫原性抗原)结合的新抗原或自身抗原的百分比。 图5a 显示了一例慢性肾细胞癌患者的总抗原和免疫原数。然后,对于所有癌症类型的患者,计算了每个患者的新抗原、自身抗原(不包括HERV-E)和HERV-E(仅限肾癌)的免疫原性比例,并计算所有患者的平均比例。观察到, 新抗原通常比自身抗原更具免疫原性 (图5b) 。这是合适的,因为与自身抗原不同,新抗原是T细胞在发育过程中从未遇到过的突变多肽;然而,观察到,在肾癌中,HERV-E抗原比新抗原和其他自身抗原更有可能具有免疫原性,证实了过去关于HERV-E在诱导肾癌免疫反应中的重要性的报道。

接下来,研究了TCR-pMHC相互作用对T细胞克隆性增殖的影响。对于每个患者,比较了预测与任何新抗原和自身抗原结合的TCR的克隆部分,以及其他非结合T细胞的克隆部分。使用一个实例患者 (图5c) ,显示了该患者中可以或不能与任何抗原结合的TCRs的平均克隆率(结合Rank cutoff为1%)。该患者的结合性T细胞的平均克隆率高于非结合性T细胞。对于4种癌症类型中的每一种,计算出结合T细胞的平均克隆比例较高的患者数量,除以非结合T细胞的患者的平均克隆比例较高的患者数量。观察到,与其他T细胞相比,越来越多的患者表现出其抗原靶向T细胞的克隆性扩增 (图5d) ,用越来越小的Rank百分位数(更强的亲和力)来定义抗原-TCR配对。与图2c和图3一致,这一结果也表明更多的免疫原性肿瘤抗原会在人类肿瘤中诱导更强的T细胞克隆性扩增。

最后, 测试了错义突变和移码突变产生的新抗原的TCR结合亲和力 。移码突变通常产生全新的表位,与正常人类蛋白质组的表位不相似,而错义新抗原与正常表位有一个错配。因此, 移码新抗原在诱导强反应性T细胞/TCRs方面可能更有效 。移码突变产生的新抗原与TCR的结合率(平均Rank=0.81%)明显强于错义突变产生的新抗原(平均Rank=0.92%) (P=8.1×10^-9)。

● 图5:人类肿瘤中TCR-pMHC相互作用的特征 。a、一例慢性肾细胞癌患者不同类别的免疫原性和非免疫原性抗原的数量(cutoff=1%)。下面的表格显示了该患者的免疫原性百分比计算过程,该计算过程适用于图4b中的每个患者。b、免疫原性新抗原(蓝色)、自身抗原(黄色;不包括HERV-E)和HERV-E多肽(红色)在每个患者队列中的平均百分比。对预测的配对强度应用一系列结合cutoff点,并在每个cutoff点上计算每个患者的免疫原性百分比,并在每个队列中求出平均值。c、在一例患者中发现了结合和非结合TCR的T细胞受体克隆部分。结合指的是TCR与任何新抗原、自身抗原或HERV-E的结合预测,结合Rank cutoff为1%。框边界表示四分位数范围,框中间的线表示中值。d、具有较高平均克隆比例的结合T细胞的患者数量与具有较大平均克隆比例的非结合T细胞的患者数量的比率。这一比率是通过一系列结合Rank cutoff值来计算的。虚线表示1的比率,即结合性TCR更多克隆性扩增的患者数量;n,非结合性TCR更多克隆性扩增的患者数量。


总结

这些工作能够预测I类pMHC的TCR结合特异性,只需给定TCR序列、(新)抗原序列和MHC类型。这是由几个创新的算法设计实现的,包括转移学习,在不配对信息的情况下利用大量相关的TCR和pMHC数据,以及允许pMTnet专注于区分绑定和非绑定TCR的差异训练 。尽管TCR与表位直接相互作用,但MHC蛋白限制了表位锚定位置的空间位置,从而进一步限制了表位的可能构象,并影响了表位与TCR的相互作用。这导致将MHC蛋白序列整合到pMTnet中。 基于这些工作,表明pMTnet的性能远远超过其他软件 ,如netTCR。一些方法,如GLIPH和TCRdist已经开发出将在给定样本中描述的TCR序列分组成簇,其中每一簇TCR被认为是针对单个表位的;然而,在没有先验知识的情况下,这种方法仍然不能准确地确定新抗原或抗原的确切序列。

此外,pMTnet现在还实现了一套全基因组分析,揭示了有趣的生物学发现。对新抗原和自身抗原(包括HERV-E)的免疫原性潜力提供了大规模和公正的估计。在两名HLA-A∗02:01纯合子的结直肠癌患者中进行了酵母展示筛选,鉴定出4个TCR及其多肽靶点。惊讶的是,4个受体中有3个识别未突变的自身抗原。在有限数量的患者中的观察一致,在几个大型队列中证实了自身抗原确实具有免疫原性潜力,尽管新抗原仍然更有可能具有免疫原性。但HERV是肾癌中一种特殊的自身抗原,似乎比新抗原具有更强的免疫原性。

证明了利用pMTnet来加强对癌症患者的监测的潜力,例如生成用于免疫治疗治疗反应的预后工具和预测工具 。 发现在抗PD-1治疗后,癌症患者的T细胞发生了克隆性替换。pMTnet可以使其在时间和成本方面更具可行性,以密切监测患者在免疫治疗后的TCR谱系,并实时做出最具信息量的治疗决策 。 pMTnet还可以用于设计TCR-T或新抗原疫苗疗法,其中pMTnet可以生成用于工程的候选TCR或新抗原的缩小范围。 发现新抗原免疫原性有效性评分(NIES)对检查点抑制剂的治疗有预后和预测性,尽管在肾癌中不是,可能是由于HERV的重新激活和它的低突变负荷。

当前研究的一个警告是,在训练数据集中,某些表位及其克隆扩展的配对TCR的表示存在偏见,这可能会导致问题。训练数据集集合有许多共同的表位,比如那些来自CMV的经过充分研究的表位。 未来,预计该领域将积累更多的训练TCR-pMHC配对数据,特别是考虑到T-scan和10× Immune Profiling等高通量技术的出现 。这些数据将更准确地代表训练pMTnet的可能表位,并将有助于推动该领域的向前发展。

总体而言, 这里证明了在给定TCR、抗原和MHC序列的情况下,TCR和pMHC之间的配对是机器可学习的,这为进一步研究产生更高精度的TCR-抗原预测模型奠定了基础 。 期待pMTnet推动肿瘤免疫基因组学研究,并在个性化医疗的当前时代加强免疫疗法的设计和实施。


参考文献:

Zhang, S.-Q. et al. High-throughput determination of the antigen specificities of T cell receptors in single cells. Nat. Biotechnol. 36, 1156–1159 (2018).

Huth, A., Liang, X., Krebs, S., Blum, H. & Moosmann, A. Antigen-specific TCR signatures of cytomegalovirus infection. J. Immunol. 202, 979–990 (2019).

Joglekar, A. V. et al. T cell antigen discovery via signaling and antigen-presenting bifunctional receptors. Nat. Methods 16, 191–198 (2019).

Bagaev, D. V. et al. VDJdb in 2019: database extension, new analysis infrastructure and a T-cell receptor motif compendium. Nucl. Acids Res. 48, D1057–D1062 (2020).

Zhang, W. et al. PIRD: pan immune repertoire database. Bioinformatics 36, 897–903 (2020).

Jurtz, V. I. et al. NetTCR: sequence-based prediction of TCR binding to peptide–MHC complexes using convolutional neural networks. (2018).

Gielis, S. et al. Detection of enriched T cell epitope specificity in full T cell receptor sequence repertoires. Front. Immunol. 10, 2820 (2019).

Jokinen, E., Heinonen, M., Huuhtanen, J., Mustjoki, S. & Lähdesmäki, H. TCRGP: determining epitope specificity of T cell receptors. (2019).

Gee, M. H. et al. Antigen identification for orphan T Cell receptors expressed on tumor-infiltrating lymphocytes. Cell 172, 549–563.e16 (2018).

Lu, T., Zhang, Z., Zhu, J. et al. Deep learning-based prediction of the T cell receptor–antigen binding specificity. Nat Mach Intell 3, 864–875 (2021).


1 0 0 % 专 注 细 胞 免 疫 治 疗 的 品 牌 会 议 , 深 度 聚 焦 免 疫 细 胞 疗 法 商 业 化 与 产 业 发 展 , 特 设 实 体 瘤 、 通 用 C A R T 、 N K 疗 法 专 题 论 坛 , 携 手 6 0 + 免 疫 疗 法 领 袖 , 分 享 最 新 临 床 进 展 与 难 点 解 析 , 商 讨 细 胞 免 疫 疗 法 行 业 新 趋 势

I - C A R 2 0 2 2



完 整 议 程 揭 幕

上 下 滑 动 查 看 完 整 议 程

报 名 即 将 截 止

扫 码 立 即 咨 询

联 系 电 话 : 1 7 8 1 1 9 6 4 7 2 8 ( 同 微 信 )

邮 箱 : m a r k e t i n g @ t r u e s a w . c o m