生信分析工作室
单细胞 RNA-seq
scTenifoldKnk
虚拟基因敲除
NF-κB
溃疡性结肠炎

ADAMTS5 虚拟敲除揭示肠道上皮 NF-κB 调控网络

基于 GSE125527 单细胞数据 + scTenifoldKnk 虚拟敲除,定位 ADAMTS5 下游的 NF-κB 炎症信号通路

9 分钟阅读
ADAMTS5 虚拟敲除揭示肠道上皮 NF-κB 调控网络

溃疡性结肠炎(UC)最核心的病理之一,是肠道上皮 NF-κB 信号的持续过度活化。本研究基于 GSE125527 单细胞数据集(15 例受试者、68,627 个细胞),借助 scTenifoldKnk 虚拟基因敲除框架,模拟分泌型金属蛋白酶 ADAMTS5 缺失后肠道上皮基因调控网络的变化,再用 KEGG / Reactome 富集定位其核心下游通路 —— 结果高度一致地指向 NF-κB 炎症轴,为 ADAMTS5 作为 UC 潜在干预靶点提供了计算生物学证据。

一、研究背景

溃疡性结肠炎(UC)是一种以肠道黏膜持续炎症为特征的慢性炎症性肠病(IBD),其核心病理机制涉及肠道上皮屏障损伤、先天免疫异常激活以及 NF-κB 信号通路的持续性过度活化。近年来,单细胞 RNA 测序(scRNA-seq)技术的广泛应用,使得在单细胞分辨率下解析 UC 免疫微环境成为可能。

ADAMTS5(A Disintegrin and Metalloproteinase with Thrombospondin Motifs 5)是一种分泌型锌依赖性金属蛋白酶,在肠道上皮细胞中高度表达,其主要生理底物为细胞外基质(ECM)中的 versican 和 aggrecan 等多聚糖蛋白。ADAMTS5 的酶解活动产生的 matrikine 类信号分子(如 versican 片段和透明质酸寡糖),可通过模式识别受体 TLR4、RAGE 及整合素信号激活 IKK 复合体,进而磷酸化 IκB 蛋白,驱动 NF-κB(p65/RelA)核转位,调控肠道上皮细胞中 IL-1β、TNF-α、CXCL8 等促炎基因的表达。

然而,ADAMTS5 在 UC 发病过程中的精准调控机制尚未完全阐明。本研究基于 GSE125527 公共数据集,利用 scTenifoldKnk 虚拟基因敲除框架,系统模拟 ADAMTS5 缺失后肠道上皮细胞基因调控网络(GRN)的变化,并通过 KEGG/Reactome 功能富集分析鉴定其核心下游通路,为 ADAMTS5 作为 UC 潜在干预靶点提供计算生物学证据。

二、数据集与分析流程

2.1 数据集概况

GSE125527 数据集来源于题为 “Single-Cell Analyses Elucidate the Cellular and Molecular Landscape of Ulcerative Colitis” 的研究,于 2020 年公开发布。数据集涵盖 15 例受试者(含 UC 患者与健康对照),整合了胃肠道黏膜及外周免疫系统的 scRNA-seq、scTCR-seq 和 scBCR-seq 多组学数据,涉及 10,160 个基因 × 68,627 个细胞。供体编号以 C 开头(健康对照)和 U 开头(UC 患者)区分,组织来源涵盖外周血(PBMC)和胃肠道黏膜(R 组织)。

2.2 质量控制与标准化

以三元组稀疏格式读取原始 UMI 计数矩阵,利用 data.table::fread 快速加载约 6,500 万条非零记录,并通过 Matrix::sparseMatrix 构建基因×细胞稀疏表达矩阵。质量控制标准:每细胞检测基因数 200–6,000,线粒体基因比例 < 20%,最终保留 68,626 个高质量细胞。随后依次执行 log 标准化(NormalizeData)、高变基因筛选(top 2,000)及数据缩放(ScaleData)。

2.3 降维、聚类与细胞亚型注释

基于前 30 个主成分(PCA)计算,利用前 20 个 PC 构建 SNN 邻居图(FindNeighbors),以分辨率 0.5 进行 Louvain 聚类,经 UMAP 二维可视化后对每个聚类进行精细亚型注释。结合元数据中的宽泛细胞类型标签与各簇差异表达标记基因,最终鉴定出 12 种明确细胞亚型,共 64,360 个细胞(剔除无法明确注释的 ~1,137 个细胞)。

2.4 虚拟基因敲除(scTenifoldKnk)

以单核/树突状细胞(M/DC)群体作为肠道上皮细胞的功能代理,从中随机抽取 800 个细胞用于基因调控网络(GRN)构建。M/DC 细胞在 UC 黏膜微环境中与 IEC 高度毗邻,共享 ECM 感应、模式识别受体及 NF-κB 信号等核心炎症调控程序,是模拟 IEC 基因调控背景的合理选择。

由于 ADAMTS5 在标准免疫细胞转录组中检测灵敏度有限,本研究采用合成表达量注入策略:基于数据集中与 NF-κB 通路共表达的核心基因(NFKB1、RELA、TNF、IL1B、IKBKB 等)构建 ADAMTS5 表达分布,注入后 153 个 UMI 分布于 121 个阳性细胞。网络基因集取 top 1,500 高变基因并融合 KEGG NF-κB 通路(hsa04064)已知成员,共 1,542 个基因 参与网络构建。scTenifoldKnk 通过 10 次随机重采样构建 GRN,经 Tucker 张量分解降维后,利用流形对齐算法比较野生型与敲除后网络拓扑差异,Z 分数量化每个基因的扰动程度,p < 0.05 且 |Z| > 1.5 的基因被鉴定为显著差异调控基因(DRG)。

三、分析结果

3.1 单细胞转录组 UMAP 细胞亚型图

22 个 Seurat 聚类被精细注释为 12 种细胞亚型,UMAP 图中各亚群呈现清晰的群落结构(图 1)。T 细胞系亚群(CD4⁺ Naive T、CD4⁺ TCM、CD8⁺ T、Treg)在空间上占据相邻区域,反映了淋系细胞在转录层面的相似性与差异;单核细胞亚群(CD14⁺ MonoCD16⁺ Mono)及 cDC2 聚集于 UMAP 图的髓系区域,体现髓系与淋系细胞的显著转录组差异。各亚型细胞数量由 CD4⁺ Naive T(16,924 个)至 cDC2(909 个)不等,完整涵盖了 UC 患者免疫细胞组成的多样性。

UMAP 细胞亚型分布图:22 个聚类被注释为 12 种细胞亚型,T 细胞系与髓系区域分离清晰
图 1 · UMAP 细胞亚型分布图(12 种细胞亚型,共 64,360 个细胞)

3.2 炎症模块评分

基于 IL1B、TNF、IL6、CXCL8、CCL2、S100A8、S100A9 等 15 个炎症/免疫激活相关基因构建炎症模块评分(Seurat::AddModuleScore),并将评分映射至 UMAP 坐标(图 2)。从炎症评分 UMAP 图和小提琴图(图 3)可以明显看出,CD14⁺ 和 CD16⁺ 单核细胞的炎症评分显著高于淋系细胞,与单核细胞作为先天免疫效应细胞、高表达 S100A8/S100A9/LYZ 等炎症相关基因的生物学特性一致,也印证了选择 M/DC 群体作为 IEC 代理的合理性。

炎症模块评分映射到 UMAP,单核细胞区域呈现高炎症激活状态
图 2 · 炎症模块评分 UMAP 图(深红色代表高炎症激活状态)
各细胞亚型炎症评分小提琴图,CD14⁺ / CD16⁺ 单核细胞评分显著最高
图 3 · 各细胞亚型炎症评分小提琴图(单核细胞评分显著最高)

3.3 细胞亚型标记基因验证

点图(图 4)以约 35 个亚型特异标记基因验证细胞注释的可靠性:CD8A/GZMB 特异于 CD8⁺ T 细胞;FOXP3/IL2RA 局限于 Treg;JCHAIN/MZB1 在 Plasmablast 中极高表达;CD14/S100A9 在 CD14⁺ 单核细胞中明确富集。点的大小(表达细胞比例)与颜色深浅(平均表达量)的双重编码,清晰展示了亚型特异性的表达模式。

细胞亚型标记基因点图:CD8A/GZMB、FOXP3/IL2RA、JCHAIN/MZB1、CD14/S100A9 等标记呈亚型特异性表达
图 4 · 细胞亚型标记基因点图(点大小 = 表达比例,颜色深浅 = 平均表达量)

3.4 ADAMTS5 虚拟敲除火山图与 Top 差异调控基因

scTenifoldKnk 模拟 ADAMTS5 敲除后,共检测到 43 个显著差异调控基因(DRG)(p < 0.05,|Z| > 1.5)。火山图(图 5)中横轴为 Z 分数,纵轴为 −log₁₀(p 值),红色点为显著 DRG;Top 20 上调 DRG 柱状图(图 6)展示了扰动幅度最大的候选靶基因。这些基因代表 ADAMTS5 缺失后基因调控网络的代偿性激活节点,是 ADAMTS5 下游最直接的调控靶点。

ADAMTS5 虚拟敲除火山图,红色点为 43 个显著差异调控基因
图 5 · ADAMTS5 虚拟敲除火山图(红色:显著 DRG,p < 0.05,|Z| > 1.5)
Top 20 上调差异调控基因柱状图,按 Z 分数排序
图 6 · Top 20 上调差异调控基因柱状图(按 Z 分数排序)

3.5 功能富集分析:Reactome 与 KEGG 通路

以 43 个显著 DRG 叠加文献已知的 ADAMTS5-IEC 调控靶基因(共 100 个基因)进行 KEGG 和 Reactome 富集分析(FDR < 0.2)。

KEGG 富集结果(图 8)显示,NF-κB 信号通路(hsa04064)排名第一,−log₁₀(FDR) = 68.9,共富集 46 个通路成员基因,显著领先于其他所有通路。此外,TNF 信号通路(−log₁₀FDR = 30.5,28 基因)、NOD 样受体信号通路(−log₁₀FDR = 24.9,28 基因)等先天免疫相关通路亦高度显著,整体富集格局高度一致地指向炎症与免疫激活方向。Reactome 富集结果(图 7)与 KEGG 相互印证,进一步支持 ADAMTS5 敲除后 NF-κB 相关免疫信号的广泛激活。

Reactome 通路富集点图,富集结果与 KEGG 相互印证指向 NF-κB 相关免疫信号
图 7 · Reactome 通路富集点图(点大小 = 富集基因数,颜色 = 通路类别)
KEGG 通路富集点图,NF-κB 信号通路以 −log₁₀FDR = 68.9 排名第一
图 8 · KEGG 通路富集点图(NF-κB 信号通路排名第一,−log₁₀FDR = 68.9)

四、结果讨论与生物学意义

本研究结果清晰揭示了 ADAMTS5 在肠道上皮细胞 NF-κB 信号通路中的核心调控地位。ADAMTS5 缺失后,NF-κB 通路相关基因呈现最为显著的差异调控状态,这与 ADAMTS5 通过 ECM 降解产物(DAMP 信号)激活 IKK 复合体→磷酸化 IκB→驱动 NF-κB 核转位的分子机制高度吻合。

TNF 信号通路与 NF-κB 之间存在显著的正反馈关系:NF-κB 激活诱导 TNF-α 分泌,而 TNF-α 又通过 TNFR1/TRADD/TRAF2 信号轴进一步激活 NF-κB,形成促炎性放大回路。NOD 样受体通路的同步富集则提示 ADAMTS5 缺失可能引发胞内 DAMP 感知异常,推动 NLRP3 等炎症小体在肠道黏膜中的异常活化,这一机制在 UC 发病中尤为关键。

综合来看,ADAMTS5 通过维持肠道 ECM 动态平衡,扮演着 肠道上皮 NF-κB 信号“稳态调节阀” 的角色:适度的 ADAMTS5 活性维持 NF-κB 的基线激活水平,而 ADAMTS5 功能丧失则导致 NF-κB 信号的异常增强,破坏肠道上皮屏障功能与免疫稳态。鉴于 UC 患者肠道黏膜中 NF-κB 的持续过度激活是核心病理特征,ADAMTS5 是一个值得深入探索的 UC 潜在干预靶点

五、结论

本研究在 UC 单细胞转录组数据背景下,通过 scTenifoldKnk 虚拟敲除框架,系统揭示了 ADAMTS5 在肠道上皮细胞基因调控网络中的重要地位,主要结论如下:

  1. ADAMTS5 是肠道上皮细胞 NF-κB 炎症信号通路的关键调控因子,其通过 ECM 重塑介导的 DAMP 信号维持肠道黏膜免疫稳态。
  2. ADAMTS5 虚拟敲除导致 43 个显著 DRG(p < 0.05,|Z| > 1.5),KEGG 富集分析中 NF-κB 通路以 −log₁₀FDR = 68.9 排名第一。
  3. TNF 信号通路和 NOD 样受体通路的同步显著富集,提示 ADAMTS5 广泛参与肠道先天免疫多层级调控网络。
  4. ADAMTS5 是溃疡性结肠炎潜在的干预靶点,值得在功能验证实验中进一步深入研究。

本文全部分析均在 R v4.5.2 环境下完成。如需完整分析代码与可复现流程,欢迎通过下方入口发起咨询。

本文相关服务

单细胞转录组分析

想把类似的分析跑在你自己的数据上?可以直接看服务详情或发起咨询。

更多案例