使用此数据框(“df”):
year pollution
1 1999 346.82000
2 2002 134.30882
3 2005 130.43038
4 2008 88.27546
我尝试创建一个这样的折线图:
plot5 <- ggplot(df, aes(year, pollution)) +
geom_point() +
geom_line() +
labs(x = "Year", y = "Particulate matter emissions (tons)", title = "Motor vehicle emissions in Baltimore")
我得到的错误是:
geom_path:每个组仅包含一个观察值。需要调整群体审美吗?
即使我想要折线图,该图表也会显示为散点图。我尝试将 geom_line()
替换为 geom_line(aes(group = year))
,但没有成功。
在一个答案中,我被告知将年份转换为因子变量。我做到了,问题仍然存在。这是 str(df)
和 dput(df)
的输出:
'data.frame': 4 obs. of 2 variables:
$ year : num 1 2 3 4
$ pollution: num [1:4(1d)] 346.8 134.3 130.4 88.3
..- attr(*, "dimnames")=List of 1
.. ..$ : chr "1999" "2002" "2005" "2008"
structure(list(year = c(1, 2, 3, 4), pollution = structure(c(346.82,
134.308821199349, 130.430379885892, 88.275457392443), .Dim = 4L, .Dimnames = list(
c("1999", "2002", "2005", "2008")))), .Names = c("year",
"pollution"), row.names = c(NA, -4L), class = "data.frame")
df
可能不是您认为的那样。请以可重复的形式陈述您的问题,即显示 dput(df)
的输出。
您只需将 group = 1
添加到 ggplot 或 geom_line aes() 中。
对于折线图,必须对数据点进行分组,以便知道要连接哪些点。在这种情况下,很简单——所有点都应该连接,所以 group=1。当使用更多变量并绘制多条线时,通常通过变量来对线进行分组。
参考:Cookbook for R, Chapter: Graphs Bar_and_line_graphs_(ggplot2), Line graphs.
尝试这个:
plot5 <- ggplot(df, aes(year, pollution, group = 1)) +
geom_point() +
geom_line() +
labs(x = "Year", y = "Particulate matter emissions (tons)",
title = "Motor vehicle emissions in Baltimore")
您收到此错误是因为您的变量之一实际上是一个因子变量。执行
str(df)
检查这一点。然后执行此双变量更改以保留年份数字,而不是转换为“1,2,3,4”级别数字:
df$year <- as.numeric(as.character(df$year))
编辑:您的 data.frame 似乎有一个“数组”类的变量,这可能会导致 pb。那就试试吧:
df <- data.frame(apply(df, 2, unclass))
并再次阴谋?
我对数据框有类似的问题:
group time weight.loss
1 Control wl1 4.500000
2 Diet wl1 5.333333
3 DietEx wl1 6.200000
4 Control wl2 3.333333
5 Diet wl2 3.916667
6 DietEx wl2 6.100000
7 Control wl3 2.083333
8 Diet wl3 2.250000
9 DietEx wl3 2.200000
我认为 x 轴的变量应该是数字,以便 geom_line 知道如何连接点来绘制线。
在我将第二列更改为数字后:
group time weight.loss
1 Control 1 4.500000
2 Diet 1 5.333333
3 DietEx 1 6.200000
4 Control 2 3.333333
5 Diet 2 3.916667
6 DietEx 2 6.100000
7 Control 3 2.083333
8 Diet 3 2.250000
9 DietEx 3 2.200000
然后它工作。
在新会话中启动 R 并将其粘贴到:
library(ggplot2)
df <- structure(list(year = c(1, 2, 3, 4), pollution = structure(c(346.82,
134.308821199349, 130.430379885892, 88.275457392443), .Dim = 4L, .Dimnames = list(
c("1999", "2002", "2005", "2008")))), .Names = c("year",
"pollution"), row.names = c(NA, -4L), class = "data.frame")
df[] <- lapply(df, as.numeric) # make all columns numeric
ggplot(df, aes(year, pollution)) +
geom_point() +
geom_line() +
labs(x = "Year",
y = "Particulate matter emissions (tons)",
title = "Motor vehicle emissions in Baltimore")
pollution
是一维数组而不是普通向量。看str(df)
我得到了类似的提示。这是因为我以某个百分比的形式指定了 x 轴(例如:10%A、20%B、....)。因此,另一种方法可能是将这些值相乘并以最简单的形式编写。
我发现如果绘制的大部分数据超出轴限制,也会发生这种情况。在这种情况下,请相应地调整轴刻度。
group
参数进行分组。仅按color
分组是不够的。我只是遇到了这个麻烦,希望这可以帮助遇到同样问题的人df %>% arrange(pollution) %>% ggplot()