单细胞测序数据的差异表达分析方法总结-single cell differential expression
无论是传统的多细胞转录组测序(bulk RNA-seq)还是单细胞转录组测序(scRNA-seq),差异表达分析(differential expression analysis)是比较两组不同样本基因表达异同的基本方法,可获得一组样本相对于另一组样本表达显著上调(up-regulated)和下调的基因(down-regulated),从而可进一步研究这些差异表达基因的功能,包括富集的通路(pathway)或生物学过程(biological process)。由于单细胞测序技术的局限性,单细胞测序数据通常具有高噪音,有较高的dropout问题,即很多低表达或中度表达的基因无法有效检测到。所以,以前针对传统多细胞转录组测序数据开发的差异表达检测方法或软件不一定完全适用于单细胞测序数据。若想比较不同细胞亚型或不同条件下的细胞表达差异时,为了能得到可靠的结果,需要选定一个好的差异表达分析方法(微信公众号:AIPuFuBio)。
近年来,有不少专门针对单细胞转录组测序数据的差异表达分析方法相继被开发出来,如MAST (Finak et al., 2015)、SCDE (Kharchenko et al., 2014)、 DEsingle (Miao et al., 2018)、 Census (Qiu et al., 2017)、 BCseq (Chen and Zheng, 2018)等。具体可以见下表所示:
红线上方是专门针对单细胞测序数据开发的差异表达分析软件或R包,红色下方是针对bulk转录组数据开发的软件或R包
图1、一些比较流行的差异表达分析软件(Chen et al. Frontiers in Genetics, 2019) 。
这里要值得提一下SCDE(全名:Single Cell Differential Expression)软件,其属于最早一批专门针对单细胞测序数据开发的差异表达分析软件,地址为:https://hms-dbmi.github.io/scde/。下图是原文章中SCDE与其他传统差异表达分析软件的性能比较,显示SCDE具有不错的性能。
图2、SCDE与其他软件在单细胞测序数据集上鉴定差异表达基因的性能比较(Kharchenko et al. Nature Methods, 2014)
最近,Wang et al.等人比较了11款经典的软件在单细胞测序测序数据集上的差异表达分析性能,这些软件具体如下表所示:
图3、不同差异表达软件的相关信息(Wang et al. BMC Bioinformatics, 2019)
图4、不同差异表达软件ROC曲线比较( Wang et al. BMC Bioinformatics, 2019)
图5、不同差异表达软件各主要指标的比较( Wang et al. BMC Bioinformatics, 2019)
图6、不同差异表达软件之间在真实数据集上检测到的差异表达基因比较( Wang et al. BMC Bioinformatics, 2019)。差异表达基因的定义为:adjusted p-value< 0.05
图7、样本数量对不同差异表达软件各方面性能的影响比较( Wang et al. BMC Bioinformatics, 2019)
图8、不同差异表达软件鉴定到的top 300个差异表达基因富集的显著KEGG通路数和GO条目数比较( Wang et al. BMC Bioinformatics, 2019) 。(条件:FDR<0.05)
总的来说,不同的差异表达软件有不同的优缺点。有些软件具有高灵敏性,但检测精度却比较低,有些则刚好相反。这11款软件中,DEsingle 和SigEMD这两个方法较好的平衡了差异表达基因检测灵敏性和准确性。值得注意的是,Wang et al. 的比较发现,现在这些专门针对单细胞测序数据开发的差异表达分析软件和传统的方法相比,并没有显示出太多的优势( Wang et al. BMC Bioinformatics, 2019)。这也进一步说明,还需不断开发新的单细胞测序差异表达分析方法,以更好的检测单细胞测序数据的差异表达基因。(更多经典,可见大型免费综合生物信息学资源和工具平台AIPuFu:www.aipufu.com)。笔者建议,做单细胞测序数据的差异表达分析,最好还是选择专门针对单细胞测序数据开发的软件,如SCDE、DEsingle 和SigEMD等。
希望今天的内容对大家有用哦,会持续更新的,欢迎留言~~
参考文献
-
Chen et al. Single-Cell RNA-Seq Technologies and Related Computational Data Analysis,Frontiers in Genetics, 2019
-
Wang et al. Comparative analysis of differential gene expression analysis tools for single-cell RNA sequencing data, BMC Bioinformatics, 2019
-
Kharchenko et al. Bayesian approach to single-cell differential expression analysis, Nature Methods, 2014
- 点赞
- 收藏
- 分享
- 文章举报
- 单细胞转录组测序技术及各类数据分析方法总结
- 基于R语言的数据分析和挖掘方法总结——中位数检验
- Atitit 知识与数据 信息 加工方法总结 目录 1.1. 信息加工是指通过判别、筛选、分类、排序、分析和研究等一系列过程 1 1.2. 首先通过聚类信息 专题化 分组聚合 1 1.3. 多种聚
- 数据分析方法总结
- Excel与VBA对比Python与pandas数据分析方法总结
- 用R和BioConductor进行基因芯片数据分析(六):差异表达基因
- 基于R语言的数据分析和挖掘方法总结——描述性统计
- 基于R语言的数据分析和挖掘方法总结——均值检验
- Atitit 数据分析存储位置的查找方法与流程attilax总结
- 7000 字深度总结:运营必备的 15 个数据分析方法
- 数据分析常用方法总结
- 数据结构之排序的方法总结及相关的复杂度分析(包括伪码描述)
- python数据分析 常用方法总结(持续更新)
- ASP.NET页面间数据传递方法总结及分析
- 数学建模高级方法(九):数据分析之组内一致与组间差异
- mysql查询今天,昨天,近7天,近30天,本月,上一月数据的方法分析总结
- SkinMagic使用方法总结--SetSingleDialogSkin断言失败
- 八种常见的防盗链方法总结及分析
- 八种常见的防盗链方法总结及分析(我转载的,写的真好,收藏了)
- JMP新品发布暨先进数据分析方法研讨会盛大召开