空间转录组学技术(SRT)能够在组织切片中高通量地测量基因表达,但由于数据稀疏性,分析空间基因表达模式面临挑战。为了解决这一问题,研究者提出了一种名为“基因表达地形图”的新方法,使用一种称为等深度(isodepth)的量值对组织切片进行拓扑建模。这种方法不仅可以识别具有不同细胞类型组成的空间域,还能揭示基因表达的连续梯度与离散变化。
研究中开发了一个无监督且可解释的深度学习算法——GASTON(Gradient Analysis of Spatial Transcriptomics Organization with Neural Networks)。该算法能够同时学习等深度、空间梯度以及基因表达的分段线性函数,从而对基因表达的连续梯度和离散变化进行建模。
算法原理
1. 等深度概念:引入 “等深度”(isodepth)这一标量,等深度的等值线将组织切片划分为不同的空间域,并确定域内各位置的相对位置。等深度的梯度表示基因表达在空间中的最大变化方向。
2. GASTON 算法:
• 输入:组织切片的空间转录组学数据。
• 过程:通过深度神经网络,利用无监督学习,计算等深度和空间梯度,网络中的一个可解释隐藏层用于表示等深度值。
• 输出:生成组织切片的等深度拓扑图,标识空间域及基因表达梯度。
• 基因表达建模:基因表达被建模为等深度的分段线性函数,能够同时捕捉连续的基因表达梯度和域间离散变化。
应用
• 识别空间域
• 推断基因表达的连续梯度和不连续跳跃
• 推导细胞类型的空间变化图,揭示细胞组织的空间分布特征。
• 解析肿瘤微环境中的连续梯度
参考文献:Nature Methods, 2025, doi.org/10.1038/s41592-024-02503-3