5+铁死亡+WGCNA+机器学习,热门方向的纯生信思路分析也能拿5+

生信风暴 2023-12-20 10:44:09

今天给同学们分享一篇生信文章“Identification of Key Ferroptosis-Related Genes in the Peripheral Blood of Patients with Relapsing-Remitting Multiple Sclerosis and Its Diagnostic Value”,这篇文章发表在Int J Mol Sci期刊上,影响因子为5.6。

结果解读:

检测RRMS中差异表达的与铁死亡相关的基因

在这项研究中,作者系统地调查了FRGs与RRMS之间的关联(图1)。首先,作者发现了1646个在RRMS样本和健康对照样本之间差异表达的基因(DEGs)。然后,作者将得到的数据与259个FRGs进行了交集分析。最后,共鉴定出了25个差异表达的与铁死亡相关的基因(DE-FRGs),其中6个基因上调表达,19个基因下调表达(图2A、B)。

与复发性多发性硬化相关的铁死亡调控基因分析

25个差异表达基因(DE-FRGs)的重要基因本体(Gene Ontology, GO)术语,包括生物过程(BP)、细胞组分(CC)和分子功能(MF),如图2C所示。GO-BP分析显示,基因主要集中在巨噬自噬、化学应激、外部刺激和线粒体自噬等方面。GO-CC通路主要与自噬体、次级溶酶体和自溶体相关。GO-MF分析显示富集在2个铁、2个硫亚型结合和过氧化物酶活性方面。此外,基因和基因组百科全书(Kyoto Encyclopedia of Genes and Genomes, KEGG)分析显示,这些差异表达基因(DE-FRGs)富集在自噬、多发性硬化症的神经退行性通路、卡波西肉瘤相关疱疹病毒(KSHV)感染、线粒体自噬和铁死亡(Ferroptosis)等方面(图2D)。

构建共表达网络和模块特征筛选

此外,作者利用加权基因共表达网络分析(WGCNA)将586个RRMS样本和283个正常对照样本纳入分析,总共包括2952个基因表达谱。当软阈值设为2(R 2 = 0.9)时,构建了无标度网络(图3A)。随后构建了邻接矩阵和拓扑交集矩阵(TOM),并使用动态切割算法确定了三个具有独特颜色的表达模块(图3B-D)。统计学上显著差异表明,蓝色和青色模块与RRMS呈负相关,相关系数分别为-0.25和-0.98(图3E)。

RRMS相关模块基因与铁死亡相关基因交集

从WGCNA中提取了2952个与RRMS相关的模块基因,将它们与从FerrDb获取的259个FRG进行比较,结果发现了50个交集基因,这些基因被称为交集的RRMS相关模块基因(图4A、B)。

交集基因的相关性和功能富集分析

作者对从RRMS相关模块基因和FerrDb中获得的FRG的交集中的50个基因进行了相关性分析,以研究铁死亡调节因子在RRMS进展中的潜在作用。基因关系网络图显示了这些调节因子之间的强相关性(图4C)。值得注意的是,一些铁死亡调节因子,如TXNIP和NCF2,显示出强烈的协同作用,而其他一些因子,如NCOA4和PRDX1,则表现出显著的拮抗效应。此外,TXNIP和NCOA4与其他调节因子之间存在强烈的关联(图4D)。

作者还对这些交集基因进行了功能富集分析。结果显示,BP主要与细胞对化学应激、细胞外刺激、自噬和神经元死亡相关。GO-CC主要与液泡膜、自噬体和次级溶酶体相关。此外,GO-MF显示富集在泛素蛋白连接酶结合和氧化还原酶活性方面(图5A)。KEGG通路分析进一步证明这些基因在KSHV感染、自噬、人类T细胞白血病病毒1感染、乙型肝炎感染和铁死亡中起到了显著作用(图5B)。

使用机器学习方法构建和验证有意义的诊断模型

作者应用了四种成熟的机器学习模型,分别是随机森林模型(RF)、支持向量机模型(SVM)、广义线性模型(GLM)和极限梯度提升(XGB),以进一步识别具有高诊断潜力的FRGs。根据均方根误差(RMSE)对每个模型的前10个重要特征基因进行排名(图6A),其中SVM模型的残差最低(图6B)。四个模型的ROC曲线下面积(AUC)均为1(图6C)。因此,作者选择了SVM模型作为诊断模型,并确定了残差最小的前五个特征基因(TXNIP、JUN、NCOA4、EIF2AK4和PIK3CA)作为进一步分析的预测基因。

交集基因的免疫细胞浸润分析

此外,作者全面分析了RRMS组和健康对照组外周血中免疫细胞浸润的特征。根据CIBERSORT算法,结果显示RRMS组和正常对照组之间的22种免疫细胞类型的比例存在显著差异(图7A)。CD8 T细胞、活化的CD4记忆T细胞、静止的NK细胞和M2巨噬细胞在RRMS组中比例较高(图7B)。如图7C所示,浸润的CD8 T细胞与静止的NK细胞以及活化的记忆CD4 T细胞之间存在正相关。相反,浸润的CD8 T细胞与调节性T细胞、记忆B细胞和活化的NK细胞之间存在负相关。

PPI网络构建

根据STRING数据库和Cytoscape软件,分析了这五个核心FRG(TXNIP、JUN、NCOA4、EIF2AK4和PIK3CA)的蛋白质相互作用关系。根据STRING数据库提供的富集信息,作者筛选出与RRMS显著相关的条目,并列出可能引发的潜在疾病事件(图8)。

总结

铁离子调节在多发性硬化的发展中是一个重要因素,与铁死亡相关的信号通路已成为各种神经退行性疾病的潜在诊断生物标志物和治疗靶点[25]。然而,铁死亡在多发性硬化中的确切作用和具体分子机制仍不清楚,需要进一步探索。在本研究中,作者对586名RRMS患者的FRG表达进行了生物信息学分析,包括对大规模基因表达的测量。作者确定了五个核心FRG,并全面调查了FRG与RRMS之间的关系,从而建立了一个可靠的RRMS诊断模型。对这篇文章的思路感兴趣的老师,欢迎咨询!

0 阅读:4

生信风暴

简介:关注科研生态,推广科学成果,解密生命奥妙!