一款表达谱数据分析的神器--CCLE--转载
2017-12-06 09:13
726 查看
现在做生物和医学的,很多都可能会和各种组学数据打交道。其中表达谱数据总是最常用的,也是比较好测的。即使在工作中不去测序,也可以利用已有的数据库去做一些数据挖掘,找一找不同表型(比如癌症)对应的marker或者调控的通路。这里跟大家推荐一款分析表达谱数据的神器GENE-E,亲测比较好用,满足常用需求,可以做各种热图,聚类,箱图,相似分析和标记筛选等等,而且非常小巧。
进入软件之后,界面如下,这里显示的就是基因表达的热图(heatmap),其中蓝色表示被低调控,红色表示被高调。横向是不同的细胞系,纵向是不同的基因和探针名。
数据操作
第一次进入程序可以利用它自带的测试数据来上手,如下图,打开File->OpenExample Data-> CCLE,然后需要几分钟来下载数据,别忘记连网。CCLE是Board Institute维护的一个癌症细胞系的数据库,目前有近千个cell line,有兴趣的也可以去官网看看。
等几分钟load完数据之后了就可以挑选感兴趣的数据进行分析了。比如可以在圆圈处敲入skin ovary,即挑选和皮肤癌以及卵巢癌有关的细胞系(此时带有关键词的列名已经被橙色高亮)。然后点击黑色箭头处的图标,既可以选中这些列。
然后点击图中图标,建立新的热图(heatmap)。
相似分析
对两种癌症的数据就可以进行进一步分析。比如我们可以分析不同细胞系间的相似性,如下图Tools->Similarity Matrix,点击ok即可。
得到相似性如下图(这里为了计算更快,只取了其中部分数据),其中矩阵中的(i,j)位置对应细胞系i和细胞系j之间的相似性,红色表示相似度高。矩阵上方和右方的色条表示的是卵巢癌(深蓝)或皮肤癌(浅蓝)的细胞系。我们可以发现一个位置来源的癌细胞都相互之间很像。
聚类分析
另外我们也可以做聚类分析,如下图,点击图标后输入参数。这里需要选择对列(Column)还是行(Row)聚类。这里我们在两个方向都可以聚类。
聚类结果如下图,这里也选择了一部分(事实上只聚类了显示的这一部分。。)。跟刚才的热图的区别就是把行和列重新进行了排列,让更相似的临近在一起,可以方便看出被差异调控的基因或者相关模块。可以看到有一些基因在皮肤癌中高表达,在卵巢癌中低表达。这些基因就是潜在的皮肤癌的marker,至于如何利用这个软件做marker分析,我们下次再说吧。
软件的下载地址在这里
需要安装java,需要机构邮箱来进行注册。如果没有机构邮箱,至少认识一个有的童鞋吧。
进入软件之后,界面如下,这里显示的就是基因表达的热图(heatmap),其中蓝色表示被低调控,红色表示被高调。横向是不同的细胞系,纵向是不同的基因和探针名。
数据操作
第一次进入程序可以利用它自带的测试数据来上手,如下图,打开File->OpenExample Data-> CCLE,然后需要几分钟来下载数据,别忘记连网。CCLE是Board Institute维护的一个癌症细胞系的数据库,目前有近千个cell line,有兴趣的也可以去官网看看。
等几分钟load完数据之后了就可以挑选感兴趣的数据进行分析了。比如可以在圆圈处敲入skin ovary,即挑选和皮肤癌以及卵巢癌有关的细胞系(此时带有关键词的列名已经被橙色高亮)。然后点击黑色箭头处的图标,既可以选中这些列。
然后点击图中图标,建立新的热图(heatmap)。
相似分析
对两种癌症的数据就可以进行进一步分析。比如我们可以分析不同细胞系间的相似性,如下图Tools->Similarity Matrix,点击ok即可。
得到相似性如下图(这里为了计算更快,只取了其中部分数据),其中矩阵中的(i,j)位置对应细胞系i和细胞系j之间的相似性,红色表示相似度高。矩阵上方和右方的色条表示的是卵巢癌(深蓝)或皮肤癌(浅蓝)的细胞系。我们可以发现一个位置来源的癌细胞都相互之间很像。
聚类分析
另外我们也可以做聚类分析,如下图,点击图标后输入参数。这里需要选择对列(Column)还是行(Row)聚类。这里我们在两个方向都可以聚类。
聚类结果如下图,这里也选择了一部分(事实上只聚类了显示的这一部分。。)。跟刚才的热图的区别就是把行和列重新进行了排列,让更相似的临近在一起,可以方便看出被差异调控的基因或者相关模块。可以看到有一些基因在皮肤癌中高表达,在卵巢癌中低表达。这些基因就是潜在的皮肤癌的marker,至于如何利用这个软件做marker分析,我们下次再说吧。
软件的下载地址在这里
需要安装java,需要机构邮箱来进行注册。如果没有机构邮箱,至少认识一个有的童鞋吧。
相关文章推荐
- [转载] MapReduce中TextInputFormat分片和读取分片数据源码级分析
- 转载.USBlyzer是一款Windows平台的USB协议分析工具,可以监视和分析USB控制器、USB Hub和USB设备的活动
- Joy:一款用于捕获和分析网络内部流量数据的工具
- 【转载】数据分析数据挖掘好书分享
- 推荐一款查看json数据的神器:chrome插件jsonview
- (转载)你好,C++(9)坐216路公交车去买3.5元一斤的西红柿——C++中如何表达各种数值数据 3.3 数值数据类型
- 推荐一款查看json数据的神器:chrome插件jsonview
- 文本数据分析神器—— IBM BigInsights Text Analytics
- [转载]大数据(Hadoop、分析与BI、NoSQL与NewSQL)
- 【转载】如何组建一支优秀的数据分析团队?
- 转载:MySQL源码分析(1):主要模块及数据流
- 给大家推荐一款非常好用的数据分析工具“ProClarity Desktop Professional”
- 【转载】大道至简的数据分析方法论
- 对CCLE数据库可以做的分析--转载
- [转载]kaldi学习笔记:run.sh(egs/timit/s5)详细分析:从数据准备到特征提取
- C#抓取网页数据、分析并且去除HTML标签(转载)
- 调试大叔V1.0.1(2017.09.01)|http/s接口调试、数据分析程序员辅助开发神器
- 实时Web数据的实时分析 【转载】
- 转载_BlueTooth: 蓝牙基带数据传输机理分析
- Fiddler对IPhone手机的数据进行抓包分析(转载)