ChatGPT解决这个技术问题 Extra ChatGPT

ggplot2折线图给出“geom_path:每个组只包含一个观察值。你需要调整组审美吗?”

使用此数据框(“df”):

year pollution
1 1999 346.82000
2 2002 134.30882
3 2005 130.43038
4 2008  88.27546

我尝试创建一个这样的折线图:

  plot5 <- ggplot(df, aes(year, pollution)) +
           geom_point() +
           geom_line() +
           labs(x = "Year", y = "Particulate matter emissions (tons)", title = "Motor vehicle emissions in Baltimore")

我得到的错误是:

geom_path:每个组仅包含一个观察值。需要调整群体审美吗?

即使我想要折线图,该图表也会显示为散点图。我尝试将 geom_line() 替换为 geom_line(aes(group = year)),但没有成功。

在一个答案中,我被告知将年份转换为因子变量。我做到了,问题仍然存在。这是 str(df)dput(df) 的输出:

'data.frame':   4 obs. of  2 variables:
 $ year     : num  1 2 3 4
 $ pollution: num [1:4(1d)] 346.8 134.3 130.4 88.3
  ..- attr(*, "dimnames")=List of 1
  .. ..$ : chr  "1999" "2002" "2005" "2008"

structure(list(year = c(1, 2, 3, 4), pollution = structure(c(346.82, 
134.308821199349, 130.430379885892, 88.275457392443), .Dim = 4L, .Dimnames = list(
    c("1999", "2002", "2005", "2008")))), .Names = c("year", 
"pollution"), row.names = c(NA, -4L), class = "data.frame")
当我运行它时它没有给出错误。 df 可能不是您认为的那样。请以可重复的形式陈述您的问题,即显示 dput(df) 的输出。
可能是您的变量是因素,那么您需要将它们转换为数字
@G.Grothendieck 我发布了你所说的。我也转换为数字,但仍然有问题。
你真的应该以可重复的形式陈述问题。如果我们无法重现错误,就很难为您提供帮助。
是否可以按“污染”的降序排列线点?

B
Brad Larson

您只需将 group = 1 添加到 ggplot 或 geom_line aes() 中。

对于折线图,必须对数据点进行分组,以便知道要连接哪些点。在这种情况下,很简单——所有点都应该连接,所以 group=1。当使用更多变量并绘制多条线时,通常通过变量来对线进行分组。

参考:Cookbook for R, Chapter: Graphs Bar_and_line_graphs_(ggplot2), Line graphs.

尝试这个:

plot5 <- ggplot(df, aes(year, pollution, group = 1)) +
         geom_point() +
         geom_line() +
         labs(x = "Year", y = "Particulate matter emissions (tons)", 
              title = "Motor vehicle emissions in Baltimore")

值得注意的是,必须使用 group 参数进行分组。仅按 color 分组是不够的。我只是遇到了这个麻烦,希望这可以帮助遇到同样问题的人
这个答案仍然有效吗?在美学中添加 group=1 似乎不再起作用。
@Giacomo - 在 Mac 上的 3.6.2 上为我工作。收到可怕的警告,但添加 group=1 解决了问题。 ggplot(lakemeta, mapping=aes(x=Lake, y=Area, group=1)) + geom_line(size=2, color="blue")
是否可以按“污染”的降序排列点?
@AndyIan 是的。一个简单的 dplyr 解决方案是:df %>% arrange(pollution) %>% ggplot()
a
agenis

您收到此错误是因为您的变量之一实际上是一个因子变量。执行

str(df) 

检查这一点。然后执行此双变量更改以保留年份数字,而不是转换为“1,2,3,4”级别数字:

df$year <- as.numeric(as.character(df$year))

编辑:您的 data.frame 似乎有一个“数组”类的变量,这可能会导致 pb。那就试试吧:

df <- data.frame(apply(df, 2, unclass))

并再次阴谋?


这对我来说是一个方便的答案,因为它从根本上解决了问题
X
Xin Niu

我对数据框有类似的问题:

group time weight.loss
1 Control  wl1    4.500000
2    Diet  wl1    5.333333
3  DietEx  wl1    6.200000
4 Control  wl2    3.333333
5    Diet  wl2    3.916667
6  DietEx  wl2    6.100000
7 Control  wl3    2.083333
8    Diet  wl3    2.250000
9  DietEx  wl3    2.200000

我认为 x 轴的变量应该是数字,以便 geom_line 知道如何连接点来绘制线。

在我将第二列更改为数字后:

 group time weight.loss
1 Control    1    4.500000
2    Diet    1    5.333333
3  DietEx    1    6.200000
4 Control    2    3.333333
5    Diet    2    3.916667
6  DietEx    2    6.100000
7 Control    3    2.083333
8    Diet    3    2.250000
9  DietEx    3    2.200000

然后它工作。


G
G. Grothendieck

在新会话中启动 R 并将其粘贴到:

library(ggplot2)

df <- structure(list(year = c(1, 2, 3, 4), pollution = structure(c(346.82, 
134.308821199349, 130.430379885892, 88.275457392443), .Dim = 4L, .Dimnames = list(
    c("1999", "2002", "2005", "2008")))), .Names = c("year", 
"pollution"), row.names = c(NA, -4L), class = "data.frame")

df[] <- lapply(df, as.numeric) # make all columns numeric

ggplot(df, aes(year, pollution)) +
           geom_point() +
           geom_line() +
           labs(x = "Year", 
                y = "Particulate matter emissions (tons)", 
                title = "Motor vehicle emissions in Baltimore")

在新会话中启动 R 并将我帖子中的代码粘贴到其中。
你有没有想过这个问题。我和你有同样的问题,每个 x 值我只有一个值。等待你的答复。谢谢。
您能解释一下为什么将所有内容都转换为数字可以解决问题吗?我的有序因子变量是一个字符,所以我不能用数字代替它。
pollution 是一维数组而不是普通向量。看str(df)
A
Areeha

我得到了类似的提示。这是因为我以某个百分比的形式指定了 x 轴(例如:10%A、20%B、....)。因此,另一种方法可能是将这些值相乘并以最简单的形式编写。


q
qwr

我发现如果绘制的大部分数据超出轴限制,也会发生这种情况。在这种情况下,请相应地调整轴刻度。


关注公众号,不定期副业成功案例分享
关注公众号

不定期副业成功案例分享

领先一步获取最新的外包任务吗?

立即订阅