高维WGCNA:揭示复杂转录组数据的深层次联系
在高维度中探索基因共表达网络的秘密
在生物信息学领域,hdWGCNA是一个专门针对高维度转录组数据,如单细胞RNA测序或空间转录组学数据进行加权基因共表达网络分析(WGCNA)的R包。它的设计高度模块化,能够构建跨越多尺度细胞和空间层次的共表达网络,并通过多种生物学知识源提供对这些网络的上下文理解。
1、项目介绍
hdWGCNA建立在WGCNA的基础上,扩展了其在单细胞和空间转录组学领域的应用。该工具要求输入数据为流行的Seurat对象格式,这使得它成为研究者处理大规模复杂数据的理想选择。我们的项目文档包括单细胞数据和空间转录组学数据的教程,引导您轻松上手。
开发状态: 这个项目正处于积极发展阶段,我们欢迎用户提供反馈和建议,共同完善这个工具。
关于Seurat v5: 目前,hdWGCNA主要与Seurat v4兼容,对于Seurat v5的测试正在进行中,我们建议您暂时使用Seurat v4。
2、项目技术分析
hdWGCNA的核心算法基于WGCNA的模块聚类方法,它利用相关性矩阵构建网络并识别出紧密相连的基因模块。此外,借助于igraph
等工具,该包还能生成直观的网络图形展示,以便研究人员更好地理解和解释模块结构。此外,hdWGCNA还整合了GeneOverlap
和ggforestplot
,用于基因集富集分析和森林图可视化,以揭示模块功能的潜在意义。
3、项目及技术应用场景
hdWGCNA适用于以下场景:
- 单细胞RNA测序数据分析,以发现细胞亚群的特异性和共表达模式。
- 空间转录组学数据的分析,帮助描绘组织微环境中的基因表达模式和细胞相互作用。
- 跨多层细胞和空间层级的网络构建,探索疾病状态下复杂的生物机制。
4、项目特点
- 高维度处理能力:hdWGCNA专为处理大型、高维度转录组数据而设计。
- 模块化设计:允许用户灵活地构建和分析不同层次的共表达网络。
- 生物学关联:与多种生物学数据库集成,为基因模块赋予生物学含义。
- 易用性:提供详细的教程和文档,简化用户的使用流程。
安装与引用
要在您的项目中使用hdWGCNA,请首先创建一个R的conda环境,然后按照指南安装所需依赖项和包。在完成安装后,务必引用相关的文献,以便于科研工作的公正性。
如果你的研究受益于hdWGCNA,别忘了引用以下两篇论文以及原始的WGCNA论文:
- Morabito等人,《Cell Reports Methods》(2023)
- Morabito & Miyoshi等人,《Nature Genetics》(2021)
现在,就开始你的高维基因共表达网络之旅吧!hdWGCNA将是你探索复杂转录组学数据的强大助手。