R语言图片之间的保存和导出

1.图片保存

图片保存的几种方法:

1.1 基础包作图的保存

1.2 ggplot系列图(包括ggpubr)通用的简便保存 ggsave

1.3 pheatmap函数的图保存方式

1.4 eoffice包 导出为ppt,全部元素都是可编辑模式

1.5 其它方式保存图片(通用)

1.1 基础包作图的保存

不需要加载任何R包

通用:三段论

(1)图片保存的格式及文件名: pdf("test.pdf")、png("test.png"),支持各种合格图片的格式,注意对应的后缀不能写错。

(2)作图代码可以写很多行代码

(3)图画完,关闭画板:dev.off(),图画完需要终止符号。

图画完后,点击保存的图片,能打开说明正常,不能打开,可能代码出了问题。

pdf("iris_box_ggpubr.pdf")
boxplot(iris[,1]~iris[,5])
text(6.5,4, labels = 'hello')
dev.off()
##先设置保存的格式为pdf,再画图,运行画图代码后,图片保存在工作目录下。

1.2 ggplot系列图(包括ggpubr)通用的简便保存 ggsave

##保存直接保存)
ggsave("iris_box_ggpubr.png")
#右下角出的图,用ggsave保存,后缀就是什么后缀,支持很多种格式,从帮助文档里翻
##保存ggplot画的图

##赋值保存
library(ggpubr)
p <- ggboxplot(iris, x = "Species", 
               y = "Sepal.Length",
               color = "Species", 
               shape = "Species",
               add = "jitter")
ggsave(p,filename = "iris_box_ggpubr.png")
#给图赋值,写保存的名称。

1.3 pheatmap函数的图保存方式

### 第一种在pheatmap函数后面设置filename ="DEG_break_pheatmap.png" ,后缀可以是png或是pdf
p <- pheatmap(dat,scale = "row",show_colnames =T,show_rownames = F, 
              cluster_cols = T, 
              annotation_col=group,
              main = "edgeR's DEG",
              breaks = seq(-2,2,length.out = 100),
              filename ="DEG_break_pheatmap.png" )
p
### 第二种用普通包保存函数pdf,png,对应的后缀要写对
pdf("DEG_break_pheatmap.pdf")

###代码正常运行,不出图的情况下,运行以下两句代码
dev.off()
dev.new()

1.4 eoffice包 导出为ppt,全部元素都是可编辑模式

library(eoffice)
library(ggpubr)
p <- ggboxplot(iris, x = "Species", 
               y = "Sepal.Length",
               color = "Species", 
               shape = "Species",
               add = "jitter")
topptx(p,"iris_box_ggpubr.pptx")
##运行完代码后在目录下生成PPT文件

后缀.pptx不能写错,保存好后,打开PPT--点击右键--取消组合,看到图片有很多可编辑元素,可以编辑横纵坐标的字体字号,图片的颜色等做一些修饰,切忌不可造假图片。能用代码解决的事情坚决用代码,后面需要用到ppt编辑再编辑。

1.5 其它方式保存

有时候遇到新的画图函数,但是之前没接触过,着急且查不到代码时。可以打开当前图片框,点击export保存,在工作目录下。保存图片多的时候比较占时间,还是学会用代码保存最好。

2.拼图

2.1 R包patchwork

语法简单,完美兼容ggplot2

拼图比例设置简单

(1)支持直接p1+p2,比任何一个包简单

(2)复杂的布局代码易读性更强

(3)可以给子图添加标记(例如ABCD,I,II,III,IV这样)

(4)可以统一修改所有子图

(5)可以将子图的图例移到一起,整体性特别好。

(来自生信技能树小洁老师课件描述)

library(patchwork)
p1=ggplot(data = iris)+
  geom_point(mapping = aes(x = Sepal.Length,
                           y = Petal.Length,
                           color = Species))

p2=ggplot(data = diamonds) + 
  geom_bar(mapping = aes(x = cut,fill=clarity))

R包patchwork的其它介绍

https://mp.weixin.qq.com/s/p7LLLvzR5LPgHhuRGhYQBQ

library(ggplot2)
colnames(iris)
p1=ggplot(iris,aes(Sepal.Length,Sepal.Width))+
  geom_point(aes(color=Species))#color=Species

p2=ggplot(iris,aes(Sepal.Length,Sepal.Width))+
  geom_point(aes(color=Sepal.Length))#color=Sepal.Length

library(patchwork)##拼图前一定要加载
p1+p2
##拼图后,可以用gglpot2的保存方式去保存

注意的问题:

代码可运行却不出图,是因为画板被占用

使用代码:dev.off()关闭画板,出现null device

多次运行dev.off(),到出现null device,再重新运行出图代码或dev.new()

dev.off()报错,提示关闭画板不存在,惯着它,特例的报错,不用管

遇到问题可以运行dev.new(),不行重启Rstudio,再不行重启电脑:每次重启都会把一些被破坏的默认设置恢复到原样。

3.画图合辑

3.1 小洁老师的语雀专辑

复习补充:连续型和分散型,以iris为例

library(ggplot2)
colnames(iris)
#图一代码
ggplot(iris,aes(Sepal.Length,Sepal.Width))+
  geom_point(aes(color=Species))#color=Species,
#图二代码
ggplot(iris,aes(Sepal.Length,Sepal.Width))+
  geom_point(aes(color=Sepal.Length))#color=Sepal.Length

两者行代码画出的图,不一样,图一的点图有3种颜色,图二的图几乎只有一种颜色

iris$Species#是离散型数据,table(iris$Species)有三个独立的值,互不相干的颜色
iris$Sepal.Length#就一堆数字,sort(iris$Sepal.Length),4.3连续到7.9不好分颜色

画图箱线图,希望横坐标按顺序排序,但是横坐标不是数字,ggplot默认的横坐标顺序与自己的想象有差别,是因为有因子存在,因子有些争议,有人认为它是数据类型,有人认为它是数据结构。

iris$Species
##最后一列有Levels,Levels是因子的关键词,因子水平的意思
class(iris$Species)
#[1] "factor"
##R语言基础比较扎实时再去完因子,不然会崩溃。

##调整横坐标会用到有序因子

画箱线图时,连续型的数值不能作为横纵标,要有重复值,这个以后慢慢去理解

library(ggstatsplot)
##用这个包里函数的一句代码画出非常漂亮的小提琴图,难点是这个包的安装,一个个包找去z

##热图学习
?pheatmap
##帮助文档是最好学习热图的教程

3.2 资料里有曾老师给的脚本和html文件

详细介绍很多种图的一步一步画法

画图部分的扩展学习文件:

基础包画图500行代码zz_Basic plot in R for biotrainee .R

ggplot2画图50个案例:top50ggplot.html

4.总结:

一般画图都是找别人的代码(R 火山图搜索),把自己的数据套进去,解决自己的数据与别人数据的差别,就是把自己的数据整理成与示例的数据一样。

难点不是作图代码,而是如何将自己的数据整理成示例数据的样子。不同的图,示例数据是不一样的,有的是需要矩阵,有的是要数据框,有的是要数值型或是其它类型。作图数据不可能都是统一类型。

要根据自己的R语言基础去搞明白,比较数据,能运行成功和不能运行成功的数据差在哪里:

数据结构(人家的是矩阵,你的是数据框),数据类型(人家的是纯数值型,你的里边夹杂一些字符型,逻辑型):用class函数,str函数,is.xx函数判断。

行、列的组织方式、对应关系(人家的一行是一个基因,你的一列是一个基因;人家有两个或是多个示例数据,这两个示例数据或是多个示例数据之间有对应关系,如两个表达矩阵,一个表达矩阵的某个信息有6个列,而你的信息有8列,和另一个表达矩阵某一行对应关系):使用转置函数t()。

(如果以上的信息排除了,可能有以下情况)

缺失值,异常值,重复值等

有的列名还有要求一样,这个比较少见。

最常见要求是:数据结构,数据类型

说明

以上内容是听生信技能树小洁老师的R语言线上课,根据自己的理解记录下来,小洁老师授课非常细心,对不同水平的同学都照顾到,并且补充很多技巧(拼图最好用的包)以及注意事项。

版权声明:
作者:Zad
链接:https://www.techfm.club/p/43281.html
来源:TechFM
文章版权归作者所有,未经允许请勿转载。

THE END
分享
二维码
< <上一篇
下一篇>>