ChatGPT解决这个技术问题 Extra ChatGPT

如何在shell中拆分字符串并获取最后一个字段

假设我有字符串 1:2:3:4:5 并且我想获取它的最后一个字段(在本例中为 5)。我如何使用 Bash 做到这一点?我试过 cut,但我不知道如何用 -f 指定最后一个字段。


S
Stephen

您可以使用 string operators

$ foo=1:2:3:4:5
$ echo ${foo##*:}
5

这会贪婪地修剪从前面到“:”的所有内容。

${foo  <-- from variable foo
  ##   <-- greedy front trim
  *    <-- matches anything
  :    <-- until the last ':'
 }

虽然这适用于给定的问题,但如果字符串为 1:2:3:4:5:,则以下 William 的答案 (stackoverflow.com/a/3163857/520162) 也会返回 5(而使用字符串运算符会产生空结果)。这在解析可能包含(或不包含)结束 / 字符的路径时特别方便。
那么你会如何做相反的事情呢?回显'1:2:3:4:'?
以及如何保留最后一个分隔符之前的部分?显然是通过使用 ${foo%:*}# - 从头开始; % - 从头开始。 #, % - 最短匹配; ##, %% - 最长匹配。
如果我想从路径中获取最后一个元素,我应该如何使用它? echo ${pwd##*/} 不起作用。
@Putnik 该命令将 pwd 视为变量。试试 dir=$(pwd); echo ${dir##*/}。为我工作!
a
a3nm

另一种方法是在 cut 前后反转:

$ echo ab:cd:ef | rev | cut -d: -f1 | rev
ef

这使得获取最后一个字段或从末尾编号的任何字段范围变得非常容易。


这个答案很好,因为它使用了“cut”,作者(大概)已经很熟悉了。另外,我喜欢这个答案,因为我使用的是“cut”并且有这个确切的问题,因此通过搜索找到了这个线程。
一些使用空格作为分隔符的人的剪切和粘贴素材:echo "1 2 3 4" | rev | cut -d " " -f1 | rev
转速 |切-d -f1 | rev 太聪明了!谢谢!帮了我一堆(我的用例是 rev | -d ' ' -f 2- | rev
我总是忘记 rev,这正是我所需要的! cut -b20- | rev | cut -b10- | rev
我最终得到了这个解决方案,我尝试用“awk -F”/“'{print $NF}'”剪切文件路径对我来说有点失败,因为包括空格在内的文件名也被分开了
W
William Pursell

使用cut很难得到最后一个字段,但是这里有一些awk和perl中的解决方案

echo 1:2:3:4:5 | awk -F: '{print $NF}'
echo 1:2:3:4:5 | perl -F: -wane 'print $F[-1]'

此解决方案优于已接受的答案:它还匹配包含或不包含结束 / 字符的路径:/a/b/c/d/a/b/c/d/ 在处理 pwd | awk -F/ '{print $NF}' 时产生相同的结果 (d)。在 /a/b/c/d/ 的情况下,接受的答案导致空结果
@eckes 对于 AWK 解决方案,在 GNU bash 上,版本 4.3.48(1)-release 是不正确的,因为无论是否有斜杠都很重要。简单地说,AWK 将使用 / 作为分隔符,如果您的路径是 /my/path/dir/,它将使用最后一个分隔符之后的值,这只是一个空字符串。因此,如果您需要像我一样做这样的事情,最好避免使用斜杠。
我将如何获得子字符串直到最后一个字段?
@blackjacx 有一些怪癖,但像 awk '{$NF=""; print $0}' FS=: OFS=: 这样的东西通常效果很好。
N
Nicholas M T Elliott

假设使用相当简单(例如,没有转义分隔符),您可以使用 grep:

$ echo "1:2:3:4:5" | grep -oE "[^:]+$"
5

细分 - 在行尾 ($) 查找除定界符 ([^:]) 之外的所有字符。 -o 只打印匹配的部分。


-E 表示使用扩展语法; [^...] 表示除列出的字符之外的任何内容; + 一个或多个这样的命中(将采用模式的最大可能长度;此项是 gnu 扩展) - 例如,分隔字符是冒号。
A
Abdallah_98

如果您想使用 cut,您可以尝试这样的事情:

echo "1:2:3:4:5" | cut -d ":" -f5

您也可以像这样使用 grep 尝试:

echo " 1:2:3:4:5" | grep -o '[^:]*$'

您的第二个命令对我很有用。你能把它分解一下,以便我能更好地理解它吗?谢谢你。
D
Dennis Williamson

单程:

var1="1:2:3:4:5"
var2=${var1##*:}

另一个,使用数组:

var1="1:2:3:4:5"
saveIFS=$IFS
IFS=":"
var2=($var1)
IFS=$saveIFS
var2=${var2[@]: -1}

另一个带有数组的:

var1="1:2:3:4:5"
saveIFS=$IFS
IFS=":"
var2=($var1)
IFS=$saveIFS
count=${#var2[@]}
var2=${var2[$count-1]}

使用 Bash(版本 >= 3.2)正则表达式:

var1="1:2:3:4:5"
[[ $var1 =~ :([^:]*)$ ]]
var2=${BASH_REMATCH[1]}

M
Mateusz Piotrowski
$ echo "a b c d e" | tr ' ' '\n' | tail -1
e

只需将分隔符转换为换行符并使用 tail -1 选择最后一个条目。


如果最后一项包含 \n,它将失败,但在大多数情况下,这是最易读的解决方案。
R
Rafael

使用 sed

$ echo '1:2:3:4:5' | sed 's/.*://' # => 5

$ echo '' | sed 's/.*://' # => (empty)

$ echo ':' | sed 's/.*://' # => (empty)
$ echo ':b' | sed 's/.*://' # => b
$ echo '::c' | sed 's/.*://' # => c

$ echo 'a' | sed 's/.*://' # => a
$ echo 'a:' | sed 's/.*://' # => (empty)
$ echo 'a:b' | sed 's/.*://' # => b
$ echo 'a::c' | sed 's/.*://' # => c

鉴于许多实用程序的输出是原始文件名后跟冒号 (:) 后跟实用程序输出 (${path}:${output}) 的形式,这对于添加您自己的控制字符(如 TAB)非常有用$'\t' 或单位分隔符 $'\037' 等在最后一个冒号之后。在文件输出的最后一个冒号处添加 TAB 的示例:file ~/yourPath/* | sed "s/\(.*:\)\(.*\)/\1"$'\t'"\2/"
0
021

这里有很多很好的答案,但我仍然想使用 basename 分享这个:

 basename $(echo "a:b:c:d:e" | tr ':' '/')

但是,如果您的字符串中已经有一些“/”,它将失败。如果斜杠 / 是您的分隔符,那么您只需要(并且应该)使用 basename。

这不是最好的答案,但它只是展示了如何使用 bash 命令发挥创造力。


c
codeforester

如果您的最后一个字段是单个字符,您可以这样做:

a="1:2:3:4:5"

echo ${a: -1}
echo ${a:(-1)}

检查string manipulation in bash


这不起作用:它给出了 a 的最后一个 字符,而不是最后一个 字段
没错,这就是想法,如果您知道最后一个字段的长度,那就太好了。如果没有,你必须使用其他东西......
R
Rafa Viotti

使用 Bash。

$ var1="1:2:3:4:0"
$ IFS=":"
$ set -- $var1
$ eval echo  \$${#}
0

可以使用 echo ${!#} 而不是 eval echo \$${#}
C
Crytis
echo "a:b:c:d:e"|xargs -d : -n1|tail -1

首先使用 xargs 使用“:”拆分它,-n1 表示每一行只有一个部分。然后,pring 最后一部分。


c
codeforester

使用 read 内置的解决方案:

IFS=':' read -a fields <<< "1:2:3:4:5"
echo "${fields[4]}"

或者,使其更通用:

echo "${fields[-1]}" # prints the last item

s
sth
for x in `echo $str | tr ";" "\n"`; do echo $x; done

如果任何字段中有空格,就会出现问题。此外,它没有直接解决检索最后一个字段的问题。
s
slushy

sed 中的正则表达式匹配是贪婪的(总是到最后一次出现),您可以在这里利用它来发挥自己的优势:

$ foo=1:2:3:4:5
$ echo ${foo} | sed "s/.*://"
5

C
Christoph Boeddeker

对于熟悉 Python 的人来说,https://github.com/Russell91/pythonpy 是解决此问题的不错选择。

$ echo "a:b:c:d:e" | py -x 'x.split(":")[-1]'

来自 pythonpy 帮助:-x treat each row of stdin as x

使用该工具,可以轻松编写应用于输入的 Python 代码。

编辑(2020 年 12 月):Pythonpy 不再在线。这是一个替代方案:

$ echo "a:b:c:d:e" | python -c 'import sys; sys.stdout.write(sys.stdin.read().split(":")[-1])'

它包含更多样板代码(即 sys.stdout.read/write),但只需要来自 python 的标准库。


b
bombs

如果您喜欢 python 并且可以选择安装软件包,您可以使用 this python utility

# install pythonp
pythonp -m pip install pythonp

echo "1:2:3:4:5" | pythonp "l.split(':')[-1]"
5

python 可以直接这样做:echo "1:2:3:4:5" | python -c "import sys; print(list(sys.stdin)[0].split(':')[-1])"
@MortenB你错了。 pythonp 包的全部目的是让您做与 python -c 相同的事情,但输入的字符更少。请查看存储库中的 README。