近日,中国科学院合肥肿瘤医院肿瘤转化医学研究中心李雪玲研究员在烧伤皮肤基因表达时序分析方面取得新进展,开发了一种基于高分辨率细胞类型反卷积组模式分析烧伤后皮肤基因表达随时间变化过程的方法。相关研究结果以“Characterization of Cell Type Abundance and Gene Expression Timeline from Burned Skin Bulk Transcriptomics by Deconvolution”为题发表在美国烧伤协会会刊Journal of burn care & research: official publication of the American Burn Association。
分析烧伤皮肤基因表达随时间变化过程对于适时治疗(therapeutic timing)至关重要。过去三十多年中,针对组织bulk转录组的基因表达谱分析为最常用的数据分析手段,但是该技术不能区分因为细胞类型数量和细胞类型特异性的基因表达变化等混淆因素的影响,仅能够判定所有细胞类型的平均基因表达变化。然而,皮肤组织的基因表达变化原因,既由细胞基因表达变化即细胞状态变化,也由细胞类型分数和数目变化所引起的综合结果。精确区分细胞分数和基因表达变化,挖掘烧伤后细胞和基因靶标,对促进临床伤口愈合具有重要意义。
基因表达谱呈现出较强的细胞类型特异性,是构建细胞类型分子标签的理论基础,然而高分辨率细胞类型反卷积要求bulk样本数目高于细胞类型数目。早在2012年,李雪玲研究员在University of Texas Medical Branch at Galveston工作期间,深入参与了美国烧伤协会Genomics项目, 分析烧伤后血液、皮肤、肝和心脏基因表达变化。在此基础上,李雪玲研究员带领团队,开发了一种使用CIBERSORTx高分辨率细胞类型反卷积组模式方法,分析pooled 皮肤bulk转录组数据,该方法能够鉴别引起bulk基因扰动的细胞分数和基因表达变化来源。研究人员首先整合血液和皮肤单细胞数据,构建了皮肤8细胞和7细胞类型参考标签-Sig_Na,在独立纯化细胞微阵列数据集上与报道的Derm2皮肤类型参考标签进行反卷积准确度比较,证明了Sig_Na的优越性,并进一步在纯化细胞类型的跨平台RNA-seq bulk测序数据上证明了其准确度。同时,发明一种通过添加白噪音的bulk样本扩增技术,克服了高分辨率细胞类型反卷积中bulk样本数目不足而导致模型无法应用缺憾,扩展了模型的适用范围。最后,基于Sig_Na对7种细胞类型:皮肤角质细胞、皮肤成纤维细胞、黑色素细胞、嗜中性粒细胞、巨噬细胞、T细胞、内皮细胞进行组模式高分辨率细胞类型反卷积。接下来,利用纯化角质细胞类型的RNA-Seq时间表达变化数据作为独立验证集(3个时间点),验证了高分辨率细胞类型反卷积准确性。并就皮肤脂肪细胞高分辨率反卷积进行了初步尝试,利用白色脂肪细胞和褐色脂肪细胞特异性基因表达标志物,在bulk转录组上验证了烧伤皮肤中存在白色脂肪褐色化过程。最后,指出高分辨率细胞类型反卷积的深度学习模型和烧伤数据采集等未来发展方向。
中国科学院合肥肿瘤医院李雪玲研究员为本文的通讯作者。该研究工作受到国家自然科学基金、安徽省医学重点专项等多个项目资助。
图1 该研究示意图
图2 皮肤bulk转录组高分辨率细胞类型反卷积构建protocol