怎么让热图显示基因名_热图,PCA画图网站推荐--------- ClustVis

news/2024/5/15 5:35:11/文章来源:https://blog.csdn.net/weixin_36098128/article/details/112158002

c0b4a71d239cc259e323362038567d4f.png

1:前言

在生信的分析学习过程中,对结果的可视化是非常重要的,在很多生信文章常见的就是热图,PCA等图。

但是在画图之前,我们需要知道,我们这么做的目的是什么?那么画热图和PCA分析图的意义和目的是什么呢?什么是热图,什么是PCA分析图?

2:热图

在组学分析的生信文章中,常常可以见到热图。非常吸引读者的眼球,好看的热图可以为文章增(ti)色(gao)不(bi)少(ge)。

举个栗子:(A)在用不同的病毒处理了小鼠后,取肺部与上皮组织生长有关的cluster 1 基因的热图,展现的是这个cluster的代表性基因,红色的基因被上调,蓝色的基因被下调。调节的幅度用颜色的强度表示.

基因表达热图,文章来源:Host Response Comparison of H1N1- and H5N1-Infected Mice Identifies Two Potential Death Mechanisms

f0c01e421fa07a0ac882964c0e159dae.png

其实从这个栗子就可以看出来热图的三个基本功能:

2.1:展示样本多个基因的表达量的高低变化根据每组的基因表达值进行归一化后显示。(一般归一化的方法有按行均一化,按列均一化,所有值均一化)

2.2:聚类结果,对不同样本进行分类 ,聚类其实是根据差异程度(选的是欧氏距离,还是相关系数等),目的是为了判断样本的近远关系。比如说肿瘤的进化过程中,细胞的衍化类型是什么样的

2.3:获得表达模式相似的基因集合

3:PCA分析

在转录组的分析当中,主成分分析(PCA)往往是成果体现的一个很重要的手段。

3.1PCA分析的定义:

主成分分析法是数据挖掘中常用的一种降维算法,是Pearson在1901年提出的,再后来由hotelling在1933年加以发展提出的一种多变量的统计方法,其最主要的用途在于“降维”,通过析取主成分显出的最大的个别差异,也可以用来削减回归分析和聚类分析中变量的数目,与因子分析类似。(说实话没太看懂)

举个小栗子:

比如你要做一项分析人的肥胖的因素有哪些,这时你设计了50个你觉得都很重要的指标,然而这50个指标对于你的分析确实太过繁杂,这时你就可以采用主成分分析的方法进行降维。50个指标之间会有这样那样的联系,相互之间会有影响,通过主成分分析后,得到三五个主成分指标。此时,这几个主成分指标既涵盖了你50个指标中的绝大部分信息,这让你的分析得到了简化(从50维降到3、5维)。

如果运用到生信分析的话,可以这么理解:我们拿到了一个表达谱数据,里面有很多差异表达的基因信息。(一般情况下,这些基因数目非常的多,成千上万)。那么拿这么多基因进行分析肯定不行。所以需要找到最具有代表性的进行区分。

推荐大家看一个比较经典的PCA分析的文章:主成分分析(PCA)基本原理及分析实例 (https://www.jianshu.com/p/162bb4ea1b7f)

----------------------------------------分割线------------------------------------------------

4:画图

说了那么多,现在来给大家推荐一个非常好用的画图网站---------Clustvis,网址链接是 a web tool for visualizing clustering of multivariate data (BETA)

clustvis主页

df085ed24646945c6f8eec024521d6b0.png

4.1:点击 Data import

上传data可以直接用上传文件(不能大于2M),也可以直接复制粘贴(如果数据不是很多的话),此外还可以从公共数据库导入等方法。文本的格式内容可以参照它给的sample,需要给出基本行列信息以及每个样本的数值(表达值或者是甲基化等数值)

选择上传data的方式,以及数据格式

a9ea7b0075327b3ee0a799e974304c25.png

4.2:进行数据的预处理

以它给出的sample样本信息为例

对数据的预处理

ab434de3dd09e1c3c37882ebe2290c1c.png

4.2.1:首先是不是需要转换(如果数值比较大或者是比较小的情况下)

4.2.2:每列的注释是否需要保留,这个信息是在上传的时候样本标记好的

sample每列的信息

39da4e9fb55062c5bf2700629e61ae62.png

4.2.3:缺失值的取值范围(自己可以调整)

4.2.4:Row scaling 主要是运用到PCA画图分析中,可以有不同的选项,可以以单元度,向量度,贡献度进行PCA分析

4.2.5:PCA的分析方法:

有SVD 分析方法(奇异值分析方法:SVD最主要的应用就是对数据进行压缩,只保留最主要的数据。),Nipals 分析方法(偏最小二乘法PS回归),Probabilistic PCA PPCA:(即认为观测到的高维变量其实是由低维的潜变量通过某个广义线性模型生成的(这种低维→高维的映射,可以类比三维空间的曲线方程,一维自变量tt被映射为三维函数值yy),我们的目的是通过观测值(高维)推测背后的潜变量(低维),这样也就实现了数据压缩的效果)

4.3:结果展示

在画图出来的左边的工具栏是可以调整参数的比如说画图的颜色等。

示例样本的热图绘制结果

172994284a5ccc991821f047db1e562c.png

示例样本的PCA结果

347d1e24c76345d9fd6a317d9cb6e5bd.png

Reference and Recommend:

你真的了解热图吗

算法杂记-SVD,*PCA*,KPCA以及PPCA和FA - simplex - 博客园 (https://www.baidu.com/link?url=ypLDGkpdibz7Bp51KmZvojMl1UMyELzr_p8Tlgg7ZSNK9gFTqdA9t1P8DKHCMrdApWrokMMiTH4NSgilwdWeDq&wd=&eqid=bf9a25e30003ec9b000000035c23b40e)

知乎----高通量测序技术专栏 :(高通量测序技术)

知乎live---R入门和基础绘图系统:(R入门与基础绘图系统)

热图文章来源:Host Response Comparison of H1N1- and H5N1-Infected Mice Identifies Two Potential Death Mechanisms

--------------------------------------------分割线--------------------------------------------

后记:

网站虽然好用,但是掌握了R语言画图代码的话,是不是更好呢?大家学习起来,推荐孟大神的高通量专栏(https://zhuanlan.zhihu.com/ngs-learning)和知乎live呀!

附上学习笔记:R语言----PCA分析,热图(楔子)

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.luyixian.cn/news_show_824200.aspx

如若内容造成侵权/违法违规/事实不符,请联系dt猫网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

技术干货:使用静态缓存提升网站性能的五种方法!

本文作者: 乔锐杰 现担任上海驻云信息科技有限公司运维总监/架构师。曾任职过黑客讲师、java软件工程师/网站架构师、高级运维、阿里云架构师等职位。维护过上千台服务器,主导过众安保险、新华社等千万级上云架构。在云端运维、分布式集群架构等方面有着…

IIS7 发布网站 出现 处理程序“PageHandlerFactory-Integrated”在其模块列表中有一个错误...

windows7下发布web项目需要安装IIS,当安装完以后,web程序已经映射到了本地IIS上,运行出现如下错误提示处理程序“PageHandlerFactory-Integrated”在其模块列表中有一个错误模块“ManagedPipelineHandler”原因:vs2010默认的是4.0框架,4.0的框架是独立的CLR&#xf…

下载网站原代码步骤

打开你想复制的网站; 在网站的空白区,鼠标右键选择—页面另存为。会弹出一个窗口,选择需要保存的网页文件类型为“网页,全部”,网页文件的名称根据自己来写,比如是网站的首页就写index.htm ; …

小网站架构优化-提升抗并发能力:子应用程序分离方案

前言:标题为啥要加个“小”,只因为上一篇文章“小网站架构优化:从100并发抗到4000并发”,带了个“小”字,所以这篇也顺流加个“小”了。大意“小”是特指秋色园(流量小,服务器配置低&#xff09…

从运维角度看中大型网站架构的演变之路

前言 网上有很多文章类似于我今天要分享的课程,有架构师写的,有运维写的,还有开发些的,偏重点都不同,今天我以咱们运维角度全面讲解。 一个成熟的网站架构并不是一开始设计就具备高可用、高伸缩、高性能等特性的&#…

SVN 导出代码在VS2012运行提示“未能将网站xx 配置为使用 ASP.NET 4.0,为了使此网站正确运行,您必须将它手动配置为使用 ASP.NET 4.0”

今天接到了我们自己的一个订餐系统优化的任务,要想执行这个任务就得使用 SVN 获取源代码(我的学习进度还没有走到SVN); 其实这样来一下也好,有助于更好地学习接下来的SVN,哈哈。下面说问题: 1,当…

闪电精灵SEO 打破百度快速排名规则

我们许多站长们都是每天为了自己网站的排名操碎了心,然而纵使每天苦逼的更新网站,做外链,排名未必上得去,度娘总是不给面子,排名优化做的太慢。但是你可知道有一种方法能够在7-30天内快速提高网站排名吗?或者听说过但不会做? 百…

从运维角度看中大型网站架构的演变之路

本文出自 “李振良的技术博客” 博客,请务必保留此出处http://lizhenliang.blog.51cto.com/7876557/1951651 前言 网上有很多文章类似于我今天要分享的课程,有架构师写的,有运维写的,还有开发些的,偏重点都不同&#x…

当代文学网站设计初稿

完成设计初稿;设计思路:页头以毛笔开始,页尾以钢笔结束;为的是形象的表述当代文学从1949年至今的一个发展历程。页面采用古典元素点缀增加页面古典气息,采用笔墨、墨汁等增加页面文学韵味,页面背景采用有点…

网站、数据库的衍变之路

网站、数据库的衍变之路 转发自博客:http://www.cnblogs.com/birdshover/原文地址:http://www.cnblogs.com/birdshover/archive/2009/08/03/1537225.html (一) 最简单的一个网站,可能说是demo更加合适一些,…

20个非常不错的HTML5免费建站模板

HTML5是下一代主要的HTML编码规范,HTML5为网页设计者们提供了一些强大的新功能,HTML5的新功能包括:表单控制、APIS、拖拽、多媒体、屏幕绘图等。 本文向大家推荐12款免费的优秀高质量 HTML5CSS3 模板。 1. Touch The Future: Create An Elega…

20 个非常漂亮的 JavaScript 滑块设计的网站

这些东西一定会用的到的,哒哒 JavaScript 滑块,特别是基于 jQuery 插件的滑块在网站设计中使用非常频繁,下面是 20 个使用该技术设计的网站,设计非常精美,值得参考。 These Are Things Elevate Mathieu Clauss The Dai…

SEO禁用蜘蛛(爬虫)搜索收录网页(全)

手段一: Robots协议:用来告知搜索引擎哪些页面能被抓取,哪些页面不能被抓取;可以屏蔽一些网站中比较大的文件,如:图片,音乐,视频等,节省服务器带宽;可以屏蔽站…

今日头条垂涎已久的Reddit,到底是个什么网站?

硅谷Live / 实地探访 / 热点探秘 / 深度探讨 在国内,说起新闻网站,我们肯定会想到今日头条、百度、搜狐、网易等等网站。 那么你们知道么?在美国,如果你问美国人他们最常逛的新闻社区是什么,回答中肯定会提及一个网站。…

如何确定一个网站是用Wordpress开发的

问题 如何确定一个网站是用Wordpress开发的? 答案 打开网页的源码页,可以通过搜索功能查找一下是否源码中包含wp-content。如果有这个文字,说明此网站基本就是使用wordpress程序创建的网站,因为wp-content是wordpress建站程序的一…

著名电子商务网站高并发千万级大型数据库经验之- 读写分离

由于公司的主服务器责任重大,而且满负荷跑了接近2年了,怕万一有闪失主服务器出现硬件故障后重新购买新服务器订货到货周期可能会比较长,所以公司在春节期间购买了一台更强大的新服务器来当备用服务器,购买的初衷就是防止出现硬件故…

利用shell脚本批量提交网站404死链给百度

网站运营人员对于死链这个概念一定不陌生,网站的一些数据删除或页面改版等都容易制造死链,影响用户体验不说,过多的死链还会影响到网站的整体权重或排名。百度站长平台提供的死链提交工具,可将网站存在的死链(协议死链、404页面)进行提交,可快…

全球最大同性交友网站,已经10岁了!

本文转自硅星人(ID:guixingren123)作者:光谱1999 年上线的 SourceForge,因为免费一度是世界上最受欢迎的开源软件代码托管网站。然而 Google 担心它一家独大,上线了自家的代码托管网站 Google Code。2005 年&#xff0…

全球最大同性交友网站,已经10岁了!

本文转自硅星人(ID:guixingren123)作者:光谱1999 年上线的 SourceForge,因为免费一度是世界上最受欢迎的开源软件代码托管网站。然而 Google 担心它一家独大,上线了自家的代码托管网站 Google Code。2005 年&#xff0…

采用LAMP网站架构(Linux+Apache+MySQL+PHP)

2019独角兽企业重金招聘Python工程师标准>>> LAMP指的Linux(操作系统)、Apache(HTTP 服务器),MySQL(数据库软件) 和PHP(有时也是指Perl或Python) 的缩写&…