1 ggplot2入门笔记1—ggplot2简要教程
代码下载地址 ggplot2是R中最优雅,美观的图形框架。它具有精心设计的结构。本教程重点介绍可用于制作任何ggplot的基础结构。但是,在ggplot2中绘制图的方式与使学习曲线陡峭的基本图形截然不同。因此,将您对基本图形的了解留在后面并继续。您距离破解ggplot拼图只有5个步骤。该章节主要内容有:
设置 The Setup
图层 The Layers
标签 The Labels
主题 The Theme
分面 The Facets
常用函数 Commonly Used Features
首先,您需要告诉ggplot使用什么数据集。这是使用ggplot(df)函数完成的,其中df是一个数据框,其中包含制作绘图所需的所有功能。这是最基本的步骤。与基础图形不同,ggplot不会将矢量作为参数。 您可以aes()通过指定数据集中的各个变量,将想要应用到ggplot(内部参数)的任何美学效果添加到其中-例如X和Y轴。颜色,大小,形状基于其更改的变量也可以在此处自行指定。此处指定的美学将被您随后添加的所有geom层继承。如果以后打算添加更多的图层(可能是折线图顶部的条形图),则可以在添加这些图层时指定各自的外观。
# 调用ggplot2库 library(ggplot2) # 展示金刚石数据集 head(diamonds)
添加图片注释,不超过 140 字(可选)
# if only the dataset is known. 只显示数据 ggplot(diamonds)
添加图片注释,不超过 140 字(可选)
# if only X-axis is known. The Y-axis can be specified in respective geoms. # 只设定x轴,y轴数据可以在geoms中指定 ggplot(diamonds, aes(x=carat))
添加图片注释,不超过 140 字(可选)
# if both X and Y axes are fixed for all layers. # 指定x轴和y轴 ggplot(diamonds, aes(x=carat, y=price))
添加图片注释,不超过 140 字(可选)
# Each category of the 'cut' variable will now have a distinct color, once a geom is added. # 指定颜色类别cut ggplot(diamonds, aes(x=carat, color=cut)) + geom_density(alpha = .25)
添加图片注释,不超过 140 字(可选)
函数语法:ggplot(data, aes(data的单维数据, color = cut, fill = cut)) + geom_density(alpha = .25)
color = cut是表示是否画出来的线条是否填充颜色
fill = cut是表示是否根据数据的内容分组
library(tidyverse) # install.packages("tidyverse")
ggplot(diamonds, aes(carat, color = cut, fill = cut)) + geom_density(alpha = .25)
添加图片注释,不超过 140 字(可选)
aes代表美学。ggplot2还将图的X轴和Y轴以及颜色,大小,形状,填充等也视为美观特征。如果要固定颜色,大小等(即,不根据数据框中的变量而变化) ,您需要aes()像这样在之外指定它。有关更多颜色,请参见R语言调色板。
ggplot(diamonds, aes(x=carat), color="steelblue")+ geom_density(alpha = .25)
添加图片注释,不超过 140 字(可选)
ggplot2中的图层也称为“ geoms ”。基本设置完成后,您可以将几何图形一个附加在另一个图形之上。 此文档提供了所有可用geoms的全面列表。
ggplot(diamonds, aes(x=carat, y=price, color=cut)) + # Adding scatterplot geom (layer1) 添加散点图 geom_point() + # Adding moothing geom (layer2) 在散点图的基础上添加一条平滑的趋势曲线 geom_smooth()
`geom_smooth()` using method = 'gam' and formula = 'y ~ s(x, bs = "cs")'
ggplot(diamonds, aes(x=carat, y=price, color=cut))+geom_point()+geom_smooth()
添加图片注释,不超过 140 字(可选)
我们在上图添加了两层(geom)- geom_point()和geom_smooth()。由于X轴Y轴和颜色是在ggplot()设置本身中定义的,因此这两层继承了那些美学。另外,您也可以如下所示在geom图层内指定这些外观
# Same as above but specifying the aesthetics inside the geoms. 类似上面的结果 ggplot(diamonds) + geom_point(aes(x=carat, y=price, color=cut)) + geom_smooth(aes(x=carat, y=price, color=cut))
`geom_smooth()` using method = 'gam' and formula 'y ~ s(x, bs = "cs")'
添加图片注释,不超过 140 字(可选)
library(ggplot2) ggplot(diamonds) + geom_point(aes(x=carat, y=price, color=cut)) + # Remove color from geom_smooth 只画一条拟合平滑线 geom_smooth(aes(x=carat, y=price))
#`geom_smooth()` using method = 'gam' and formula 'y ~ s(x, bs = "cs")'
添加图片注释,不超过 140 字(可选)
# same but simpler 类似上图同样的功能 ggplot(diamonds, aes(x=carat, y=price)) + geom_point(aes(color=cut)) + geom_smooth()
#`geom_smooth()` using method = 'gam' and formula 'y ~ s(x, bs = "cs")'
添加图片注释,不超过 140 字(可选)
# Answer to the challenge 设置形状点 ggplot(diamonds, aes(x=carat, y=price, color=cut, shape=color)) + geom_point()
Warning messages:
1: Using shapes for an ordinal variable is not advised
2: The shape palette can deal with a maximum of 6 discrete values because more than 6 becomes difficult to
discriminate; you have 7. Consider specifying shapes manually if you must have them.
3: Removed 2808 rows containing missing values (`geom_point()`).
添加图片注释,不超过 140 字(可选)
gg <- ggplot(diamonds, aes(x=carat, y=price, color=cut)) + geom_point() + # add axis lables and plot title 添加标签 labs(title="Scatterplot", x="Carat", y="Price") print(gg)
添加图片注释,不超过 140 字(可选)
除了我们要增加标签的大小并更改图例标题以外,几乎所有内容都已设置。调整标签的大小可以在theme()函数中通过设置功能plot.title,axis.text.x和axis.text.y。需要在中指定它们element_text()。如果要删除其中任何一个,请将其设置为element_blank(),它将完全消失。 调整图例标题有些棘手。如果您的图例是某个color属性的图例,并且其根据因数而变化,则您需要设置scale_color_discrete()中的name,其中颜色部分属于color属性,而离散部分属于离散属性,因为图例是基于因数变量的。
gg1 <- gg + theme( # 设置标题大小,face="bold"字体加粗 plot.title=element_text(size=30, face="bold"), axis.text.x=element_text(size=15), axis.text.y=element_text(size=15), axis.title.x=element_text(size=25), axis.title.y=element_text(size=25)) + # add title and axis text, change legend title. # 添加渐变色,并设置颜色条图例标题 scale_color_discrete(name="Cut of diamonds") print(gg1) # print the plot
添加图片注释,不超过 140 字(可选)
如果图例显示基于因子变量的形状属性,则需要使用scale_shape_discrete(name=“legend title”)进行更改。如果它是一个连续变量,改用scale_shape_continuous(name=“legend title”)。如果您的图例基于fill连续变量的属性,使用scale_fill_continuous(name=“legend title”)。
gg1 + facet_wrap( ~cut , ncol=3)
添加图片注释,不超过 140 字(可选)
# row: color, column: cut gg1 + facet_wrap(color ~ cut)
添加图片注释,不超过 140 字(可选)
# row: color, column: cut # gg1 + facet_wrap(color ~ cut, scales="free")
添加图片注释,不超过 140 字(可选)
gg1 + facet_grid(color ~ cut)
添加图片注释,不超过 140 字(可选)
6.1 绘制时间序列图(使用ggfortify)
ggfortify包使直接从时间序列对象绘制时间序列变得非常容易,而无需将其转换为数据帧。下面的示例一步绘制AirPassengers时间序列。 在此处查看更多ggfortify的自动绘图选项以绘制时间序列。
# 载入库
install.packages("ggfortify") library(ggfortify)
# 查看数据 AirPassengers
添加图片注释,不超过 140 字(可选)
autoplot(AirPassengers) + labs(title="AirPassengers")
添加图片注释,不超过 140 字(可选)
6.2 在同一ggplot上绘制多个时间序列
# Approach 1: data(economics, package="ggplot2") # init data economics <- data.frame(economics) # convert to dataframe # 展示数据 head(economics)
添加图片注释,不超过 140 字(可选)
# 画图 ggplot(economics) + # 画线条 geom_line(aes(x=date, y=pce, color="pcs")) + geom_line(aes(x=date, y=unemploy, col="unemploy")) + # 设定颜色 scale_color_discrete(name="Legend") + labs(title="Economics")
添加图片注释,不超过 140 字(可选)
# Approach 2: library(reshape2)
添加图片注释,不超过 140 字(可选)
# 融合数据 df <- melt(economics[, c("date", "pce", "unemploy")], id="date") #选择其中3列的所有行
添加图片注释,不超过 140 字(可选)
添加图片注释,不超过 140 字(可选)
df2 <- melt(economics[, c("date", "pce", "unemploy")], id=c("date","pce"))
date pce variable value
1 1967-07-01 506.7 unemploy 2944
2 1967-08-01 509.8 unemploy 2945
3 1967-09-01 515.6 unemploy 2958
4 1967-10-01 512.2 unemploy 3143
5 1967-11-01 517.4 unemploy 3066
6 1967-12-01 525.1 unemploy 3018
# 绘图 ggplot(df) +
geom_line(aes(x=date, y=value, color=variable)) + labs(title="Economics")
添加图片注释,不超过 140 字(可选)
df <- melt(economics[, c("date", "pce", "unemploy", "psavert")], id="date") ggplot(df) + geom_line(aes(x=date, y=value, color=variable)) + facet_wrap( ~ variable, scales="free")
添加图片注释,不超过 140 字(可选)
001、 指定单个ID
> ID <- c(1,1,2,2)
> Time <- c(1,2,1,2)
> X1 <- c(5,3,6,2)
> X2 <- c(6,5,1,4)
> mydata <- data.frame(ID,Time,X1,X2) ## 测试数据框
> mydata
ID Time X1 X2
1 1 1 5 6
2 1 2 3 5
3 2 1 6 1
4 2 2 2 4
> melt(mydata, id="ID")
ID variable value
1 1 Time 1
2 1 Time 2
3 2 Time 1
4 2 Time 2
5 1 X1 5
6 1 X1 3
7 2 X1 6
8 2 X1 2
9 1 X2 6
10 1 X2 5
11 2 X2 1
12 2 X2 4
melt(mydata, id = c("ID","Time")) ## 将长数据转换为端数据, 同时指定多个ID
ID Time variable value
1 1 1 X1 5
2 1 2 X1 3
3 2 1 X1 6
4 2 2 X1 2
5 1 1 X2 6
6 1 2 X2 5
7 2 1 X2 1
8 2 2 X2 4
melt(mydata, id = c("ID","Time","X1")) ## 同时指定3个ID
ID Time X1 variable value
1 1 1 5 X2 6
2 1 2 3 X2 5
3 2 1 6 X2 1
4 2 2 2 X2 4
6.3 条形图
# 显示数据 head(mtcars) plot1 <- ggplot(mtcars, aes(x=cyl)) + # 画柱状图 geom_bar() + # Y axis derived from counts of X item labs(title="Frequency bar chart") print(plot1)
添加图片注释,不超过 140 字(可选)
df <- data.frame(var=c("a", "b", "c"), nums=c(1:3)) # 显示数据 df
> df
var nums
1 a 1
2 b 2
3 c 3
# Y axis is explicit. 'stat=identit # 显示y plot2 <- ggplot(df, aes(x=var, y=nums)) + geom_bar(stat = "identity") print(plot2)
添加图片注释,不超过 140 字(可选)
6.4 自定义布局
library(gridExtra) # 分配图像 grid.arrange(plot1, plot2, ncol=2)
添加图片注释,不超过 140 字(可选)
6.5 翻转坐标轴
df <- data.frame(var=c("a", "b", "c"), nums=c(1:3)) ggplot(df, aes(x=var, y=nums)) + geom_bar(stat = "identity") + # 翻转坐标轴 coord_flip() + labs(title="Coordinates are flipped")
添加图片注释,不超过 140 字(可选)
6.6 调整X和Y轴范围
Using coord_cartesian(xlim=c(x1,x2))
Using xlim(c(x1,x2))
Using scale_x_continuous(limits=c(x1,x2))
第 2项和第3项将从数据本身中删除超出限制的数据点。因此,如果添加任何平滑线等,结果将失真。项目1(coord_cartesian)不会删除任何数据点,而是会放大到图表的特定区域。
ggplot(diamonds, aes(x=carat, y=price, color=cut)) + geom_point() + geom_smooth() + # 设置y轴范围 coord_cartesian(ylim=c(0, 10000)) + labs(title="Coord_cartesian zoomed in!")
# `geom_smooth()` using method = 'gam' and formula 'y ~ s(x, bs = "cs")'
添加图片注释,不超过 140 字(可选)
ggplot(diamonds, aes(x=carat, y=price, color=cut)) + geom_point() + geom_smooth() + # 设定范围 ylim(c(0, 10000)) + labs(title="Datapoints deleted: Note the change in smoothing lines!")
`geom_smooth()` using method = 'gam' and formula 'y ~ s(x, bs = "cs")' Warning message: "Removed 5222 rows containing non-finite values (stat_smooth)." Warning message: "Removed 5222 rows containing missing values (geom_point)."
添加图片注释,不超过 140 字(可选)
6.7 等坐标轴
ggplot(diamonds, aes(x=price, y=price+runif(nrow(diamonds), 100, 10000), color=cut)) + geom_point() + geom_smooth() + coord_equal()
`geom_smooth()` using method = 'gam' and formula 'y ~ s(x, bs = "cs")'
添加图片注释,不超过 140 字(可选)
6.8 变更主题
ggplot(diamonds, aes(x=carat, y=price, color=cut)) + geom_point() + geom_smooth() + # 更改主题 theme_bw() + labs(title="bw Theme")
`geom_smooth()` using method = 'gam' and formula 'y ~ s(x, bs = "cs")'
添加图片注释,不超过 140 字(可选)
6.9 图例删除和更改位置
# 无图例 p1 <- ggplot(diamonds, aes(x=carat, y=price, color=cut)) + geom_point() + geom_smooth() + # 无图例 theme(legend.position="none") + labs(title="legend.position='none'")
添加图片注释,不超过 140 字(可选)
p2 <- ggplot(diamonds, aes(x=carat, y=price, color=cut)) + geom_point() + geom_smooth() + # legend at top 设置图例在图形顶部 theme(legend.position="top") + labs(title="legend.position='top'")
添加图片注释,不超过 140 字(可选)
p3 <- ggplot(diamonds, aes(x=carat, y=price, color=cut)) + geom_point() + geom_smooth() + labs(title="legend.position='coords inside plot'") + # legend inside the plot 设置图形位置 theme(legend.justification=c(1,0), legend.position=c(1,0))
添加图片注释,不超过 140 字(可选)
# arrange统一显示图像 grid.arrange(p1, p2, p3, ncol=3)
`geom_smooth()` using method = 'gam' and formula 'y ~ s(x, bs = "cs")' `geom_smooth()` using method = 'gam' and formula 'y ~ s(x, bs = "cs")' `geom_smooth()` using method = 'gam' and formula 'y ~ s(x, bs = "cs")'
添加图片注释,不超过 140 字(可选)
ggplot(mtcars, aes(x=cyl)) + geom_bar(fill='darkgoldenrod2') + theme(panel.background = element_rect(fill = 'steelblue'), # 设置主网格线 panel.grid.major = element_line(colour = "firebrick", linewidth=3), panel.grid.minor = element_line(colour = "blue", linewidth=1))
添加图片注释,不超过 140 字(可选)
6.11 图边距和背景
ggplot(mtcars, aes(x=cyl)) + geom_bar(fill="firebrick") + # top, right, bottom, left # plot.background设置背景,plot.margain设置边距 theme(plot.background=element_rect(fill="steelblue"), plot.margin = unit(c(2, 4, 1, 3), "cm"))
添加图片注释,不超过 140 字(可选)
6.12 注释
library(grid) # 添加注释
# 设置annotation_custom对象的属性
# grob参数用于指定注释的内容,这里使用textGrob函数创建一个文本注释
# xmin、xmax、ymin和ymax参数用于指定annotation_custom对象在绘图区域的位置
# 可根据需要调整fontsize、fontface等属性 my_grob = grobTree(textGrob("This text is at x=0.1 and y=0.9, relative!\n Anchor point is at 0,0", x=0.1, y=0.9, hjust=0, gp=gpar(col="firebrick", fontsize=25, fontface="bold"))) ggplot(mtcars, aes(x=cyl)) + geom_bar() + annotation_custom(my_grob) + labs(title="Annotation Example")
添加图片注释,不超过 140 字(可选)
6.13 保存ggplot
plot1 <- ggplot(mtcars, aes(x=cyl)) + geom_bar() # 保存图像 ggsave("myggplot.png") # saves the last plot,默认地址是:C:/Users/Vera\Documents/. ggsave("myggplot.png", plot=plot1) # save a stored ggplot
Saving 6.67 x 6.67 in image Saving 6.67 x 6.67 in image