4月11日,beat365柯荣秦课题组在WIREs RNA(Wiley Interdisciplinary Reviews - RNA)发表了题为“Spatial analysis toolkits for RNA in situ sequencing”的长篇综述文章,系统总结了当前原位测序技术(in situ sequencing, ISS)的整体分析流程,主要包括图像分析、信号解码、细胞分割、降维聚类、功能富集、细胞通讯等,比较了不同工具的优缺点及其与ISS数据的兼容性,讨论了如何将不同的工具集成到方便调用的整合分析流程中,并就这些工具在ISS方面的未来应用前景和研发挑战提出了展望。
ISS技术自2013年首次发表以来经历了一系列发展和改进,包括ISS、FISSEQ、STARmap、dRNA-HybISS和ExSeq等,以及在此基础上发展而来的商业化技术平台。基于ISS技术的空间转录组学技术已经成为空间基因表达分析最重要的工具之一。本综述首先对这些技术的原理进行了总结,并比较了它们各自的技术特点和优势(图1)。ISS的基本实验流程是使用序列编码的基因特异DNA探针与对应基因的mRNA或cDNA靶点杂交,连接成环后经过滚环扩增(rolling circle amplification, RCA)进行信号放大,利用多轮显微成像于组织的原始位置对基因进行解码并构建其空间表达谱。
图1. 五种主流ISS技术的原理
ISS的数据分析主要包括三个部分:上游的图像分析、中游的整合分析和下游的探索分析(图2)。具体来说,上游分析的目的是为了得到显微图像中的基因表达信息,这个过程通常包括多轮图像配准、图像增强、原始图像的碱基识别、多轮碱基合并、碱基序列解码、单细胞分割和空间可视化,最终可以得到单细胞分辨率的空间基因表达矩阵(图2a)。中游分析主要是上下游分析的媒介,将ISS的数据整理为高度可复用的数据格式,主要工具包括R包Seurat,Python库Scanpy和Squidpy(图2b)。下游分析旨在回答具体的科学问题,可以分为基因层面和细胞层面的分析,前者主要包括基因功能富集和共表达模块挖掘,后者主要包括细胞间的通讯及其进展轨迹推断等(图2c和d)。
图2. ISS技术的分析流程
最后,本文讨论了ISS数据分析的未来发展方向。在细胞分割方面,基于深度学习的工具能够获得比常规分割方法更准确的结果。在下游分析方面,除了目前沿袭单细胞测序的分析内容外,还应该结合图像空间信息获得更多的空间单细胞基因表达和互作信息。这是由于ISS的基因维数较低,单纯使用常规单细胞测序的分析工具并不能很好地区分细胞间的异质性。在大规模应用方面,未来的研究人员还需要建立标准的ISS图像数据存储格式、流程化分析工具和方便存储大型图像数据的数据库等生物信息手段,帮助大家更好地使用ISS技术。
总之,本综述首次较为全面地总结了多种ISS数据分析工具,为各领域的研究人员提供了最新的分析参考,并进一步展望了新型ISS数据分析软件和算法的开发。
beat365生物医学工程专业硕士生陈嘉驭为综述论文的第一作者,柯荣秦教授为通讯作者。该工作得到了福建省自然科学基金、厦门市科技基金和华侨大学科研基金的资助。
原文链接
https://doi.org/10.1002/wrna.1842