找回密码
 注册账号

QQ登录

微信登录

一款表达谱数据分析的神器

摘要: 现在做生物和医学的,很多都可能会和各种组学数据打交道。其中表达谱数据总是最常用的,也是比较好测的。即使在工作中不去测序,也可以利用已有的数据库去做一些数据挖掘, ...
现在做生物和医学的,很多都可能会和各种组学数据打交道。其中表达谱数据总是最常用的,也是比较好测的。即使在工作中不去测序,也可以利用已有的数据库去做一些数据挖掘,找一找不同表型(比如癌症)对应的marker或者调控的通路。这里跟大家推荐一款分析表达谱数据的神器GENE-E,亲测比较好用,满足常用需求,可以做各种热图,聚类,箱图,相似分析和标记筛选等等,而且非常小巧。



进入软件之后,界面如下,这里显示的就是基因表达的热图(heatmap),其中蓝色表示被低调控,红色表示被高调。横向是不同的细胞系,纵向是不同的基因和探针名。


数据操作
第一次进入程序可以利用它自带的测试数据来上手,如下图,打开File->OpenExample Data-> CCLE,然后需要几分钟来下载数据,别忘记连网。CCLE是Board Institute维护的一个癌症细胞系的数据库,目前有近千个cell line,有兴趣的也可以去官网看看。




等几分钟load完数据之后了就可以挑选感兴趣的数据进行分析了。比如可以在圆圈处敲入skin ovary,即挑选和皮肤癌以及卵巢癌有关的细胞系(此时带有关键词的列名已经被橙色高亮)。然后点击黑色箭头处的图标,既可以选中这些列。


然后点击图中图标,建立新的热图(heatmap)。



相似分析
对两种癌症的数据就可以进行进一步分析。比如我们可以分析不同细胞系间的相似性,如下图Tools->Similarity Matrix,点击ok即可。


得到相似性如下图(这里为了计算更快,只取了其中部分数据),其中矩阵中的(i,j)位置对应细胞系i和细胞系j之间的相似性,红色表示相似度高。矩阵上方和右方的色条表示的是卵巢癌(深蓝)或皮肤癌(浅蓝)的细胞系。我们可以发现一个位置来源的癌细胞都相互之间很像。



聚类分析
另外我们也可以做聚类分析,如下图,点击图标后输入参数。这里需要选择对列(Column)还是行(Row)聚类。这里我们在两个方向都可以聚类。



聚类结果如下图,这里也选择了一部分(事实上只聚类了显示的这一部分。。)。跟刚才的热图的区别就是把行和列重新进行了排列,让更相似的临近在一起,可以方便看出被差异调控的基因或者相关模块。可以看到有一些基因在皮肤癌中高表达,在卵巢癌中低表达。这些基因就是潜在的皮肤癌的marker,至于如何利用这个软件做marker分析,我们下次再说吧。



软件的下载地址在这里
需要安装java,需要机构邮箱来进行注册。如果没有机构邮箱,至少认识一个有的童鞋吧。
(邵斌

一款表达谱数据分析的神器
下载地址木法点击呀
评论 支持 反对

举报

好东西一定要看看!
评论 支持 反对

举报

好东西一定要看看!
评论 支持 反对

举报

好东西一定要看看!
评论 支持 反对

举报

谢谢您的分享!
评论 支持 反对

举报

大家都不容易!
评论 支持 反对

举报

谢谢您的分享!
评论 支持 反对

举报

以后多分享一些这样的有价值的帖子啊
评论 支持 反对

举报

返回顶部