ChatGPT解决这个技术问题 Extra ChatGPT

如何在 Ruby 中映射和删除 nil 值

我有一个 map 可以更改值或将其设置为 nil。然后我想从列表中删除 nil 条目。该列表不需要保留。

这是我目前拥有的:

# A simple example function, which returns a value or nil
def transform(n)
  rand > 0.5 ? n * 10 : nil }
end

items.map! { |x| transform(x) } # [1, 2, 3, 4, 5] => [10, nil, 30, 40, nil]
items.reject! { |x| x.nil? } # [10, nil, 30, 40, nil] => [10, 30, 40]

我知道我可以做一个循环并有条件地收集到另一个数组中,如下所示:

new_items = []
items.each do |x|
    x = transform(x)
    new_items.append(x) unless x.nil?
end
items = new_items

但这似乎不是惯用的。有没有一种很好的方法可以将函数映射到列表上,随时删除/排除 nil?

Ruby 2.7 引入了 filter_map,这似乎是完美的。省去了重新处理阵列的需要,而不是第一次按需要得到它。 More info here.
Array 也有紧凑的

J
Jason Axelson

您可以使用 compact

[1, nil, 3, nil, nil].compact
=> [1, 3] 

我想提醒人们,如果你得到一个包含 nils 的数组作为 map 块的输出,并且该块试图有条件地返回值,那么你就有了代码异味,需要重新考虑你的逻辑。

例如,如果你正在做这样的事情:

[1,2,3].map{ |i|
  if i % 2 == 0
    i
  end
}
# => [nil, 2, nil]

然后不要。相反,在 map 之前,reject 您不想要的东西或 select 您想要的东西:

[1,2,3].select{ |i| i % 2 == 0 }.map{ |i|
  i
}
# => [2]

我考虑使用 compact 来清理混乱,作为最后的努力,以摆脱我们没有正确处理的事情,通常是因为我们不知道会发生什么。我们应该始终知道在我们的程序中抛出了什么样的数据;意外/未知数据是错误的。每当我在正在处理的数组中看到 nil 时,我都会深入研究它们存在的原因,看看我是否可以改进生成数组的代码,而不是让 Ruby 浪费时间和内存来生成 nil,然后筛选数组以删除他们以后。

'Just my $%0.2f.' % [2.to_f/100]

为什么要呢? OP 需要去除 nil 条目,而不是空字符串。顺便说一句,nil 与空字符串不同。
两种解决方案都会对集合进行两次迭代...为什么不使用 reduceinject
听起来您没有阅读 OPs 问题或答案。问题是,如何从数组中删除 nil。 compact 是最快的,但实际上一开始就正确编写代码完全消除了处理 nil 的需要。
我不同意!问题是“映射和删除零值”。好吧,映射和删除 nil 值就是减少。在他们的示例中,OP 映射然后选择 nil。调用 map 然后压缩,或 select 然后 map ,等于犯了同样的错误:正如您在答案中指出的那样,这是一种代码味道。
@Ziggy 的回答应该被接受为正确的答案
t
the Tin Man

尝试使用 reduceinject

[1, 2, 3].reduce([]) { |memo, i|
  if i % 2 == 0
    memo << i
  end

  memo
}

我同意我们不应该 mapcompact 的公认答案,但原因不同。

我内心深处觉得map然后compact相当于select然后map。考虑:map 是一对一的函数。如果您从一组值进行映射,并且您map,那么您希望在输出集中为输入集中的每个值提供一个值。如果您必须事先select,那么您可能不希望在场景中使用map。如果您之后必须select(或compact),那么您可能不希望在片场出现 map。在任何一种情况下,您都在整个集合上迭代两次,而 reduce 只需要执行一次。

此外,在英语中,您正在尝试“将一组整数减少为一组偶数”。


可怜的 Ziggy,不喜欢你的建议。哈哈。加一,别人有数百个赞!
我相信总有一天,在你的帮助下,这个答案会超越公认的。 ^o^//
+1 当前接受的答案不允许您使用您在选择阶段执行的操作的结果
如果只需要通过,就像在接受的答案中那样,迭代可枚举的数据结构两次似乎很浪费。因此,通过使用 reduce! 来减少传递次数!谢谢@Ziggy
确实如此!但是对 n 个元素的集合进行两次传递仍然是 O(n)。除非您的集合太大以至于无法放入缓存中,否则执行两次可能就可以了(我只是认为这更优雅,更具表现力,并且将来在循环下降时不太可能导致错误不同步)。如果您也喜欢一次性完成,您可能有兴趣了解传感器! github.com/cognitect-labs/transducers-ruby
S
SRack

红宝石 2.7+

现在有!

Ruby 2.7 正是为此目的引入了 filter_map。它是惯用的和高性能的,我希望它很快就会成为常态。

例如:

numbers = [1, 2, 5, 8, 10, 13]
enum.filter_map { |i| i * 2 if i.even? }
# => [4, 16, 20]

在您的情况下,当块评估为假时,只需:

items.filter_map { |x| process_x url }

Ruby 2.7 adds Enumerable#filter_map”是关于这个主题的好读物,有一些针对这个问题的早期方法的一些性能基准:

N = 100_000
enum = 1.upto(1_000)
Benchmark.bmbm do |x|
  x.report("select + map")  { N.times { enum.select { |i| i.even? }.map{ |i| i + 1 } } }
  x.report("map + compact") { N.times { enum.map { |i| i + 1 if i.even? }.compact } }
  x.report("filter_map")    { N.times { enum.filter_map { |i| i + 1 if i.even? } } }
end

# Rehearsal -------------------------------------------------
# select + map    8.569651   0.051319   8.620970 (  8.632449)
# map + compact   7.392666   0.133964   7.526630 (  7.538013)
# filter_map      6.923772   0.022314   6.946086 (  6.956135)
# --------------------------------------- total: 23.093686sec
# 
#                     user     system      total        real
# select + map    8.550637   0.033190   8.583827 (  8.597627)
# map + compact   7.263667   0.131180   7.394847 (  7.405570)
# filter_map      6.761388   0.018223   6.779611 (  6.790559)

好的!感谢您的更新 :) 一旦 Ruby 2.7.0 发布,我认为将接受的答案切换到这个可能是有意义的。不过,我不确定这里的礼仪是什么,您是否通常给现有接受的回复一个更新的机会?我认为这是引用 2.7 中新方法的第一个答案,因此应该成为公认的答案。 @the-tin-man 你同意这个观点吗?
谢谢@PeterHamilton - 感谢您的反馈,并希望它对很多人有用。我很高兴同意你的决定,但显然我喜欢你提出的论点:)
是的,这是有核心团队倾听的语言的好处。
建议更改选定的答案是一个很好的姿态,但这种情况很少发生。 SO 没有提供提醒人们的便利工具,人们通常不会重新审视他们提出的旧问题,除非 SO 表示有活动。作为侧边栏,我建议查看 Fruity 以获得基准,因为它不那么繁琐,并且更容易进行明智的测试。
C
Community

绝对 compact 是解决此任务的最佳方法。但是,我们可以通过简单的减法获得相同的结果:

[1, nil, 3, nil, nil] - [nil]
 => [1, 3]

是的,集合减法会起作用,但由于它的开销,它的速度大约是原来的一半。
s
sawa

在您的示例中:

items.map! { |x| process_x url } # [1, 2, 3, 4, 5] => [1, nil, 3, nil, nil]

除了被替换为 nil 之外,这些值看起来并没有发生变化。如果是这样的话,那么:

items.select{|x| process_x url}

就足够了。


F
Fred Willmore

如果你想要一个更宽松的拒绝标准,例如,拒绝空字符串和 nil,你可以使用:

[1, nil, 3, 0, ''].reject(&:blank?)
 => [1, 3, 0] 

如果您想更进一步并拒绝零值(或对流程应用更复杂的逻辑),您可以传递一个块来拒绝:

[1, nil, 3, 0, ''].reject do |value| value.blank? || value==0 end
 => [1, 3]

[1, nil, 3, 0, '', 1000].reject do |value| value.blank? || value==0 || value>10 end
 => [1, 3]

。空白的?仅在导轨中可用。
为了将来参考,由于 blank? 仅在 rails 中可用,我们可以使用不与 rails 耦合的 items.reject!(&:nil?) # [1, nil, 3, nil, nil] => [1, 3]。 (虽然不排除空字符串或 0)
A
Abdullah Numan

您可以对结果数组使用 #compact 方法。

[10, nil, 30, 40, nil].compact => [10, 30, 40]

此解决方案已提供here
p
pnomolos

each_with_object 可能是最干净的方式:

new_items = items.each_with_object([]) do |x, memo|
    ret = process_x(x)
    memo << ret unless ret.nil?
end

在我看来,在条件情况下,each_with_objectinject/reduce 更好,因为您不必担心块的返回值。


W
Wand Maker

实现它的另一种方法如下所示。在这里,我们使用 Enumerable#each_with_object 来收集值,并利用 Object#tap 来摆脱 nil 检查 process_x 方法的结果所需的临时变量。

items.each_with_object([]) {|x, obj| (process x).tap {|r| obj << r unless r.nil?}}

说明的完整示例:

items = [1,2,3,4,5]
def process x
    rand(10) > 5 ? nil : x
end

items.each_with_object([]) {|x, obj| (process x).tap {|r| obj << r unless r.nil?}}

替代方法:

通过查看您调用 process_x url 的方法,不清楚在该方法中输入 x 的目的是什么。如果我假设您要通过传递一些 url 来处理 x 的值,并确定哪些 x 真正被处理为有效的非零结果 - 那么,可能是 Enumerabble.group_by 是比 Enumerable#map 更好的选择。

h = items.group_by {|x| (process x).nil? ? "Bad" : "Good"}
#=> {"Bad"=>[1, 2], "Good"=>[3, 4, 5]}

h["Good"]
#=> [3,4,5]