这样分析新冠肺炎的方法你见过吗,899
导语
今天给同学们分享一篇关于新冠肺炎PBMC中的DEGS关键基因模块的生信文章“BioinformaticsandmachinelearningapproachidentifiespotentialdrugtargetsandpathwaysinCOVID-9”,这篇文章于今年4月份发表在BriefBioinform杂志上,影响因子IF=8.。在本研究中,作者对新冠肺炎PBMC中的DEGS关键基因模块(通过WGCNA鉴定)进行了系统生物学研究。根据基因模块(MMHub)和蛋白质互作网络(PPIHub),分别从关键基因模块中筛选出关键基因。然后,作者采用机器学习的方法来确定这些关键基因的有效性。最后,作者确定了几种候选药物,将这些枢纽基因作为治疗靶点。作者的结果可能为新冠肺炎的发病机制和潜在的分子靶点提供新的见解。
BioinformaticsandmachinelearningapproachidentifiespotentialdrugtargetsandpathwaysinCOVID-9
生物信息学和机器学习方法确定新冠肺炎中潜在的药物靶点和通路.DEGS识别
数据集(GSE)包含个基因,7个COVID-9和7个健康对照样本。在排除低表达基因后,作者选择了个基因进行差异分析。作者从这个数据集中得到个差异基因(其中有个上调和22个下调,p??0.05),用于进一步的WGCNA分析。作者从COVID-9样品中的验证集(CRA)中筛选出了个差异基因(39个上调和个下调)。
2.加权基因共表达网络与模块分析
用GSE数据集中的6个COVID-9样品进行WGCNA分析。这些样本的聚类树状图在图2A中可视化。作者选择了优化的软阈值为6(图2B)。然后利用这个软阈值功率构建共表达网络,获得0个共表达模块,即黑色、蓝色、棕色、绿色、灰色、洋红色、粉红色、红色、绿松石和黄色。这0个模块的聚类树状图如图2D所示。作者分别观察到黑色,蓝色,棕色,绿色,品红色,粉红色,红色,绿松石和黄色模块中分布含有63,,,95,46,58,77,和98个基因。其中灰色模块包含25个非共表达的基因。图2C显示了具有这九个模块的所有基因的网络热图。这些共表达模块之间的相互作用,用模块eigengene树状图和eigengene网络热图呈现(图2E)。在模块保存分析中,作者使用了GSE以7个健康控制样本作为测试集的数据集。通过保守性分析,作者确定绿松石,蓝色,棕色和粉红色模块最稳定。其余模块被认为是不稳定的(图2G)。图2F显示绿松石,蓝色,棕色和粉红色模块在所有模块中保守性最好的。
图2.WGCNA共表达模块的构建
3.四个模块基因的富集分析
为了进一步了解所选四个模块的基因,在该研究中进行了GO和KEGG通路富集分析。重要的生物过程(BP)主要富集于免疫反应,分裂和裂变相关的BP(图3A)。重要的分子功能(MF)主要富含结合相关功能(图3B)。四个模块中最重要的细胞组分(CC)富集在几个细胞区室中(图3C)。四个模块基因的KEGG分析显示,基因在几种通路中显着富集,例如感染相关通路(即:单纯疱疹病毒感染,人乳头瘤病毒感染),自身免疫疾病相关通路(即:系统性红斑狼疮,类风湿性关节炎,i型糖尿病),ECM受体相互作用,IL-7信号通路和p53信号通路(图3D)。有趣的是,酒精中毒和系统性红斑狼疮显着富集了这四个模块的基因。
图3.GO和KEGG四个关键模块的富集分析
4.关键基因的鉴定和验证
作者使用模块连接阈值标准,在具有高连通性的绿松石,蓝色,棕色和粉红色模块中鉴定了个关键基因(MMhub?0.8)。此外,作者通过具有连接度的STRING数据库为PPI中的四个模块确定了个关键基因,本研究进一步分析了CRA验证集,以确认这些关键基因作为COVID-9候选生物标志物基因的作用。作者在MMhub,PPIhub和CRA中鉴定了52个常见基因(图5A)。这些常见基因在COVID-9和健康对照样品上的表达值显示在图5C中。就COVID-9感染的样品和对照样品而言,热图显示了图5B中这52个关键基因的两个主要簇。
图5.Hub基因表达谱
5.基于分类算法的关键基因性能评价
为了研究在两种不同分析(即:MMhub和PPIhub)中鉴定的hubDEGs的有效性,在该研究中执行了五种流行的分类算法。根据MMHub基因和PPIhub基因的数据分别计算了性能指标。作者使用五倍交叉验证执行了20次这些计算,基于测试精度和AUC的五个机器学习分类器的箱线图如图4所示。作者观察到,支持向量比其他四种分类器(RF0.、PLDA0.82、NBLDA0.和voomDLDA0.)对具有MMHub基因的数据集提供更高的准确率0.。作者还观察到,对于具有PPIhub基因的数据集,voomDLDA比其他四个分类器(SVM0.,RF0.98,PLDA0.和NBLDA0.)提供更高的0.精度。
图4.基于五分类器性能的接收器操作曲线ROC图
6.P?PI网络分析鉴定关键基因
通过Cytoscape中的STRING构建了52个常见基因的PPI网络。图6A显示了这些基因之间的网络相互作用,并基于更高程度的连通性鉴定了0个关键基因(PLK、AURKB、AURKA、CDK、CDC20、KIF、CCNB、KIF2C、DTL和CDC6)
7.已鉴定关键基因的转录调控因子
作者从TFs基因相互作用网络中确定了FOXC、GATA2、YY、E2F、NFIC、FOXL和SRF枢纽TFs(图6B)。从miRNAs基因相互作用网络即“mir-6-5p”、“mir-24-3p”、“mir-34a-5p”、“mir-47a”、“mir--3p”、“mir-29-2-3p”、“mir-07”和“mir-95-5p”中检测到重要的关键miRNAs(图6C)。
图6.PPI网络构建
小结
本研究旨在确定与正常血细胞相比,SARS-CoV-2在血细胞中改变的关键基因和分子通路。通过模块保存分析,检测到四个关键模块。根据模块统计和PPI网络,从和个枢纽基因中筛选出52个常见基因,并从52个基因的PPI网络中鉴定出0个枢纽基因。作者的结果可能为新冠肺炎的发病机制提供新的见解,并为新的介入治疗提供潜在的分子靶点。对该思路感兴趣的老师,欢迎扫码咨询。
生信分析定制服务
请扫描下方