我在 Bash 中有一个字符串:
string="My string"
如何测试它是否包含另一个字符串?
if [ $string ?? 'foo' ]; then
echo "It's there!"
fi
其中 ??
是我的未知运算符。我使用 echo
和 grep
吗?
if echo "$string" | grep 'foo'; then
echo "It's there!"
fi
这看起来有点笨拙。
expr
命令
如果使用双括号,也可以在 case 语句之外使用 Marcus's answer (* wildcards):
string='My long string'
if [[ $string == *"My long"* ]]; then
echo "It's there!"
fi
请注意,needle 字符串中的空格需要放在双引号之间,并且 *
通配符应该放在外面。另请注意,使用了一个简单的比较运算符(即 ==
),而不是正则表达式运算符 =~
。
如果您更喜欢正则表达式方法:
string='My string';
if [[ $string =~ "My" ]]; then
echo "It's there!"
fi
=~
运算符已在整个字符串中搜索匹配项;这里的 .*
是多余的。此外,引号通常比反斜杠更可取:[[ $string =~ "My s" ]]
E14)
。最好分配给一个变量(使用引号),然后进行比较。像这样:re="My s"; if [[ $string =~ $re ]]
if [[ ! "abc" =~ "d" ]]
为真。
我不确定是否使用 if 语句,但您可以使用 case 语句获得类似的效果:
case "$string" in
*foo*)
# Do stuff
;;
esac
[[ $string == *foo* ]]
也适用于某些 POSIX 兼容的 sh 版本(例如 Solaris 10 上的 /usr/xpg4/bin/sh
)和 ksh (>= 88)
stringContain 变体(兼容或大小写无关)
由于这些 Stack Overflow 答案主要讲述的是 Bash,因此我在这篇文章的最底部发布了一个 case Independent Bash 函数...
反正有我的
兼容的答案
由于已经有很多使用 Bash 特定功能的答案,因此有一种方法可以在功能较差的 shell 下工作,例如 BusyBox:
[ -z "${string##*$reqsubstr*}" ]
在实践中,这可以给出:
string='echo "My string"'
for reqsubstr in 'o "M' 'alt' 'str';do
if [ -z "${string##*$reqsubstr*}" ] ;then
echo "String '$string' contain substring: '$reqsubstr'."
else
echo "String '$string' don't contain substring: '$reqsubstr'."
fi
done
这是在 Bash、Dash、KornShell (ksh
) 和 ash (BusyBox) 下测试的,结果始终是:
String 'echo "My string"' contain substring: 'o "M'.
String 'echo "My string"' don't contain substring: 'alt'.
String 'echo "My string"' contain substring: 'str'.
合一功能
正如@EeroAaltonen 所问,这里是同一演示的一个版本,在相同的外壳下进行了测试:
myfunc() {
reqsubstr="$1"
shift
string="$@"
if [ -z "${string##*$reqsubstr*}" ] ;then
echo "String '$string' contain substring: '$reqsubstr'.";
else
echo "String '$string' don't contain substring: '$reqsubstr'."
fi
}
然后:
$ myfunc 'o "M' 'echo "My String"'
String 'echo "My String"' contain substring 'o "M'.
$ myfunc 'alt' 'echo "My String"'
String 'echo "My String"' don't contain substring 'alt'.
注意:您必须转义或双引号和/或双引号:
$ myfunc 'o "M' echo "My String"
String 'echo My String' don't contain substring: 'o "M'.
$ myfunc 'o "M' echo \"My String\"
String 'echo "My String"' contain substring: 'o "M'.
简单的功能
这是在 BusyBox、Dash,当然还有 Bash 下测试的:
stringContain() { [ -z "${2##*$1*}" ]; }
那么现在:
$ if stringContain 'o "M3' 'echo "My String"';then echo yes;else echo no;fi
no
$ if stringContain 'o "M' 'echo "My String"';then echo yes;else echo no;fi
yes
...或者如果提交的字符串可能是空的,正如@Sjlver 所指出的那样,该函数将变为:
stringContain() { [ -z "${2##*$1*}" ] && [ -z "$1" -o -n "$2" ]; }
或按照 Adrian Günter's comment 的建议,避免 -o
开关:
stringContain() { [ -z "${2##*$1*}" ] && { [ -z "$1" ] || [ -n "$2" ];};}
最终(简单)功能:
并反转测试以使它们可能更快:
stringContain() { [ -z "$1" ] || { [ -z "${2##*$1*}" ] && [ -n "$2" ];};}
使用空字符串:
$ if stringContain '' ''; then echo yes; else echo no; fi
yes
$ if stringContain 'o "M' ''; then echo yes; else echo no; fi
no
大小写无关(仅限 Bash!)
要在不区分大小写的情况下测试字符串,只需将每个字符串转换为小写即可:
stringContain() {
local _lc=${2,,}
[ -z "$1" ] || { [ -z "${_lc##*${1,,}*}" ] && [ -n "$2" ] ;} ;}
查看:
stringContain 'o "M3' 'echo "my string"' && echo yes || echo no
no
stringContain 'o "My' 'echo "my string"' && echo yes || echo no
yes
if stringContain '' ''; then echo yes; else echo no; fi
yes
if stringContain 'o "M' ''; then echo yes; else echo no; fi
no
string_contains() { [ -z "${2##*$1*}" ] && [ -n "$2" -o -z "$1" ]; }
最后一个想法:空字符串是否包含空字符串?上面的版本是肯定的(因为 -o -z "$1"
部分)。
您应该记住,shell 脚本与其说是一种语言,不如说是一组命令。您本能地认为这种“语言”要求您在 if
后面加上 [
或 [[
。这两个只是返回指示成功或失败的退出状态的命令(就像所有其他命令一样)。出于这个原因,我会使用 grep
,而不是 [
命令。
做就是了:
if grep -q foo <<<"$string"; then
echo "It's there"
fi
既然您将 if
视为测试它后面的命令的退出状态(用分号完成),为什么不重新考虑您正在测试的字符串的来源呢?
## Instead of this
filetype="$(file -b "$1")"
if grep -q "tar archive" <<<"$filetype"; then
#...
## Simply do this
if file -b "$1" | grep -q "tar archive"; then
#...
-q
选项使 grep 不输出任何内容,因为我们只需要返回码。 <<<
使 shell 扩展下一个单词并将其用作命令的输入,这是 <<
here 文档的单行版本(我不确定这是标准还是 Bashism)。
if grep -q foo <(echo somefoothing); then
echo
是不可移植的,如果您要传递变量,请改用 printf '%s' "$string
。
grep -q foo <<<"$mystring"
意味着 1 个 fork 并且是 bashism 并且 echo $mystring | grep -q foo
意味着 2 个 fork(一个用于管道,第二个用于运行 /path/to/grep
)
echo
可能仍然存在意外的可移植性问题。 echo "nope\c"
预计在某些平台上会像 echo -e "nope"
在其他平台上一样工作。 printf '%s' "nope"
与 printf '%s\n' 'nope\c'
公认的答案是最好的,但由于有不止一种方法可以做到这一点,这里有另一种解决方案:
if [ "$string" != "${string/foo/}" ]; then
echo "It's there!"
fi
${var/search/replace}
是 $var
,如果找到 search
的第一个实例,则替换为 replace
(它不会更改 $var
)。如果您尝试用任何内容替换 foo
,并且字符串已更改,那么显然找到了 foo
。
$XDG_CURRENT_DESKTOP
与 $string
进行比较。您想要的表达式是 if [ "$XDG_CURRENT_DESKTOP" != "${XDG_CURRENT_DESKTOP/GNOME/}" ]; then echo MATCHES GNOME; fi
"x$string" != "x${string/foo/}"
更好。
所以这个问题有很多有用的解决方案——但哪个最快/使用最少的资源?
使用此框架重复测试:
/usr/bin/time bash -c 'a=two;b=onetwothree; x=100000; while [ $x -gt 0 ]; do TEST ; x=$(($x-1)); done'
每次更换 TEST:
[[ $b =~ $a ]] 2.92 user 0.06 system 0:02.99 elapsed 99% CPU
[ "${b/$a//}" = "$b" ] 3.16 user 0.07 system 0:03.25 elapsed 99% CPU
[[ $b == *$a* ]] 1.85 user 0.04 system 0:01.90 elapsed 99% CPU
case $b in *$a):;;esac 1.80 user 0.02 system 0:01.83 elapsed 99% CPU
doContain $a $b 4.27 user 0.11 system 0:04.41 elapsed 99%CPU
(doContain 在 F. Houri 的回答中)
对于咯咯笑:
echo $b|grep -q $a 12.68 user 30.86 system 3:42.40 elapsed 19% CPU !ouch!
因此,无论是在扩展测试还是案例中,简单的替换选项都可以预见地获胜。箱子是便携式的。
管道输出到 100000 个 greps 是可以预见的痛苦!关于无需使用外部实用程序的旧规则仍然适用。
[[ $b == *$a* ]]
。
case
会以最少的总时间消耗获胜。但是,您在 $b in *$a
之后缺少一个星号。在纠正错误后,[[ $b == *$a* ]]
的结果比 case
的结果稍快一些,但它当然也可能取决于其他因素。
[[ $b == *$a* ]]
很快,case
几乎一样快(并且与 POSIX 兼容)。
[[ $b == *$a* ]]
和 case 语句 case $b in *$a):;;esac
在不匹配条件下是不等价的。交换 $a
和 $b
会导致条件表达式 [[
的退出代码 1 和 case
语句的退出代码 0。根据 help case
:退出状态:返回最后执行的命令的状态。如果 no pattern 匹配,则返回状态为零,这可能不是预期的行为。要在不匹配条件下返回 1,它应该是:case $b in *$a*):;; *) false ;; esac
这也有效:
if printf -- '%s' "$haystack" | egrep -q -- "$needle"
then
printf "Found needle in haystack"
fi
阴性测试是:
if ! printf -- '%s' "$haystack" | egrep -q -- "$needle"
then
echo "Did not find needle in haystack"
fi
我想这种风格更经典一些——更少依赖 Bash shell 的特性。
--
参数是纯粹的 POSIX 偏执狂,用于保护类似于选项的输入字符串,例如 --abc
或 -a
。
注意:在紧密循环中,此代码将比使用内部 Bash shell 功能慢得多,因为将创建一个(或两个)单独的进程并通过管道连接。
echo
不可移植,您应该改用 printf '%s' "$haystack
。
-
开头的没有转义的文字文本外,只需完全避免 echo
。它可能对你有用,但它不是便携式的。根据是否设置了 xpg_echo
选项,甚至 bash 的 echo
的行为也会有所不同。 PS:我忘了关闭我之前评论中的双引号。
--
未列在 POSIX spec for printf
中,但无论如何您都应该使用 printf '%s' "$anything"
,以避免在 $anything
包含 %
字符时出现问题。
Bash 4+ 示例。注意:当单词包含空格等时,不使用引号会导致问题。始终在 Bash、IMO 中引用。
以下是 Bash 4+ 的一些示例:
示例 1,检查字符串中的“是”(不区分大小写):
if [[ "${str,,}" == *"yes"* ]] ;then
示例 2,检查字符串中的“是”(不区分大小写):
if [[ "$(echo "$str" | tr '[:upper:]' '[:lower:]')" == *"yes"* ]] ;then
示例 3,检查字符串中的“是”(区分大小写):
if [[ "${str}" == *"yes"* ]] ;then
示例 4,检查字符串中的“是”(区分大小写):
if [[ "${str}" =~ "yes" ]] ;then
示例 5,完全匹配(区分大小写):
if [[ "${str}" == "yes" ]] ;then
示例 6,完全匹配(不区分大小写):
if [[ "${str,,}" == "yes" ]] ;then
示例 7,完全匹配:
if [ "$a" = "$b" ] ;then
示例 8,通配符匹配 .ext(不区分大小写):
if echo "$a" | egrep -iq "\.(mp[3-4]|txt|css|jpg|png)" ; then
享受。
${str,,}
中的两个逗号将 $str
转换为小写之后,我才理解它。很棒的解决方案/很棒的清单!
正如他的性能比较中的 Paul mentioned:
if echo "abcdefg" | grep -q "bcdef"; then
echo "String contains is true."
else
echo "String contains is not true."
fi
这与 'the answer provided by Marcus 中的 'case "$string" 一样符合 POSIX,但它比 case 语句的答案更容易阅读。另请注意,这将比使用 case 语句慢得多。正如保罗指出的那样,不要在循环中使用它。
这个怎么样:
text=" <tag>bmnmn</tag> "
if [[ "$text" =~ "<tag>" ]]; then
echo "matched"
else
echo "not matched"
fi
[[ $string == *foo* ]] && echo "It's there" || echo "Couldn't find"
echo "Couldn't find
语句是一个很好的技巧,可以为这些匹配的命令返回 0 个退出状态。
|| echo "Couldn't find"
,那么如果没有匹配项,您将返回错误退出状态,如果您正在运行 CI 管道,例如您想要全部返回非错误退出状态的命令
This Stack Overflow answer 是唯一一个捕获空格和破折号的字符:
# For null cmd arguments checking
to_check=' -t'
space_n_dash_chars=' -'
[[ $to_check == *"$space_n_dash_chars"* ]] && echo found
接受的答案是正确的,但很难阅读和理解。对于与搜索相关的问题,您应该始终在 $haystack 成语中使用 $needle。由于它建议的编辑队列已满,我发布了这个:
haystack='There are needles here.'
if [[ "$haystack" == *"needle"* ]]; then
echo "It's there!"
fi
一种是:
[ $(expr $mystring : ".*${search}.*") -ne 0 ] && echo 'yes' || echo 'no'
expr
是一种瑞士军刀实用程序,一旦您弄清楚如何去做,它通常可以做任何您需要做的事情,但一旦实施,您永远不会记得它为什么或如何做它正在做的事情,所以你永远不会再碰它,并希望它永远不会停止做它正在做的事情。
expr
。但从个人经验来看,每当重新阅读这些 expr
-isms 时,我都必须返回手册页。所以,我只想评论 expr
的每个用法......
expr
和 test
等工具来执行它们。在这个时代,通常有更好的工具,其中许多内置于任何现代外壳中。我猜 test
仍然挂在那里,但似乎没有人错过 expr
。
expr: syntax error: unexpected argument ‘.*.*’
bash: [: -ne: unary operator expected
由于 POSIX/BusyBox 问题已关闭且未提供正确答案 (恕我直言),因此我将在此处发布答案。
最短的答案是:
[ ${_string_##*$_substring_*} ] || echo Substring found!
或者
[ "${_string_##*$_substring_*}" ] || echo 'Substring found!'
请注意,双重哈希是强制,带有一些 shell (ash
)。当找不到子字符串时,上面将评估 [ stringvalue ]
。它不返回错误。当找到子字符串时,结果为空,并计算 [ ]
。这将抛出错误代码 1,因为字符串被完全替换(由于 *
)。
最短更常用的语法:
[ -z "${_string_##*$_substring_*}" ] && echo 'Substring found!'
或者
[ -n "${_string_##*$_substring_*}" ] || echo 'Substring found!'
另一个:
[ "${_string_##$_substring_}" != "$_string_" ] && echo 'Substring found!'
或者
[ "${_string_##$_substring_}" = "$_string_" ] || echo 'Substring found!'
注意单个等号!
我的 .bash_profile 文件以及我如何使用 grep:
如果 PATH 环境变量包含我的两个 bin
目录,请不要附加它们,
# .bash_profile
# Get the aliases and functions
if [ -f ~/.bashrc ]; then
. ~/.bashrc
fi
U=~/.local.bin:~/bin
if ! echo "$PATH" | grep -q "home"; then
export PATH=$PATH:${U}
fi
grep -q -E 'pattern1|...|patternN'
。
此处回答的问题的扩展How do you tell if a string contains another string in POSIX sh?:
此解决方案适用于特殊字符:
# contains(string, substring)
#
# Returns 0 if the specified string contains the specified substring,
# otherwise returns 1.
contains() {
string="$1"
substring="$2"
if echo "$string" | $(type -p ggrep grep | head -1) -F -- "$substring" >/dev/null; then
return 0 # $substring is in $string
else
return 1 # $substring is not in $string
fi
}
contains "abcd" "e" || echo "abcd does not contain e"
contains "abcd" "ab" && echo "abcd contains ab"
contains "abcd" "bc" && echo "abcd contains bc"
contains "abcd" "cd" && echo "abcd contains cd"
contains "abcd" "abcd" && echo "abcd contains abcd"
contains "" "" && echo "empty string contains empty string"
contains "a" "" && echo "a contains empty string"
contains "" "a" || echo "empty string does not contain a"
contains "abcd efgh" "cd ef" && echo "abcd efgh contains cd ef"
contains "abcd efgh" " " && echo "abcd efgh contains a space"
contains "abcd [efg] hij" "[efg]" && echo "abcd [efg] hij contains [efg]"
contains "abcd [efg] hij" "[effg]" || echo "abcd [efg] hij does not contain [effg]"
contains "abcd *efg* hij" "*efg*" && echo "abcd *efg* hij contains *efg*"
contains "abcd *efg* hij" "d *efg* h" && echo "abcd *efg* hij contains d *efg* h"
contains "abcd *efg* hij" "*effg*" || echo "abcd *efg* hij does not contain *effg*"
contains "-n" "n"
在这里不起作用,因为 echo -n
会吞下 -n
作为选项!一个流行的解决方法是改用 printf "%s\n" "$string"
。
grep -q
可用于此目的。
同样使用 awk
:
string="unix-bash 2389"
character="@"
printf '%s' "$string" | awk -vc="$character" '{ if (gsub(c, "")) { print "Found" } else { print "Not Found" } }'
输出:
未找到
string="unix-bash 2389"
character="-"
printf '%s' "$string" | awk -vc="$character" '{ if (gsub(c, "")) { print "Found" } else { print "Not Found" } }'
输出:
成立
原始来源:http://unstableme.blogspot.com/2008/06/bash-search-letter-in-string-awk.html
echo
不可移植,您应该改用 printf '%s' "$string"
。我正在编辑答案,因为用户似乎不再存在。
echo
以何种方式不可移植,@nyuszika7h?
我喜欢sed。
substr="foo"
nonsub="$(echo "$string" | sed "s/$substr//")"
hassub=0 ; [ "$string" != "$nonsub" ] && hassub=1
编辑,逻辑:
使用 sed 从字符串中删除子字符串的实例
如果新字符串与旧字符串不同,则存在子字符串
我发现经常需要这个功能,所以我在我的 .bashrc
中使用了一个自制的 shell 函数,这样我就可以根据需要多次重用它,并且名称易于记忆:
function stringinstring()
{
case "$2" in
*"$1"*)
return 0
;;
esac
return 1
}
要测试 $string1
(例如,abc)是否包含在 $string2
(例如,123abcABC)中,我只需要运行 stringinstring "$string1" "$string2"
并检查返回值, 例如
stringinstring "$str1" "$str2" && echo YES || echo NO
x
hack。
strstr()
:-)
通用针 haystack 示例跟随着变量
#!/bin/bash
needle="a_needle"
haystack="a_needle another_needle a_third_needle"
if [[ $haystack == *"$needle"* ]]; then
echo "needle found"
else
echo "needle NOT found"
fi
case $string in (*foo*)
# Do stuff
esac
这与 https://stackoverflow.com/a/229585/11267590 的答案相同。但简单的风格也符合 POSIX 标准。
精确单词匹配:
string='My long string'
exactSearch='long'
if grep -E -q "\b${exactSearch}\b" <<<${string} >/dev/null 2>&1
then
echo "It's there"
fi
试试 oobash。
它是一个面向 Bash 4 的 OO 风格的字符串库。它支持德语变音符号。它是用 Bash 编写的。
许多函数可用:-base64Decode
、-base64Encode
、-capitalize
、-center
、-charAt
、-concat
、-contains
、-count
、-endsWith
、-equals
、-equalsIgnoreCase
、{ 12}、-hashCode
、-indexOf
、-isAlnum
、-isAlpha
、-isAscii
、-isDigit
、-isEmpty
、-isHexDigit
、-isLowerCase
、-isSpace
、-isPrintable
、-isUpperCase
,-isVisible
,-lastIndexOf
,-length
,-matches
,-replaceAll
,-replaceFirst
,-startsWith
,-substring
,-swapCase
,-toLowerCase
,-toString
,-toUpperCase
,{ 37}和-zfill
。
查看包含示例:
[Desktop]$ String a testXccc
[Desktop]$ a.contains tX
true
[Desktop]$ a.contains XtX
false
oobash is available at Sourceforge.net。
我使用这个函数(不包括但很明显的一个依赖项)。它通过了如下所示的测试。如果函数返回值 > 0,则找到该字符串。您也可以轻松地返回 1 或 0。
function str_instr {
# Return position of ```str``` within ```string```.
# >>> str_instr "str" "string"
# str: String to search for.
# string: String to search.
typeset str string x
# Behavior here is not the same in bash vs ksh unless we escape special characters.
str="$(str_escape_special_characters "${1}")"
string="${2}"
x="${string%%$str*}"
if [[ "${x}" != "${string}" ]]; then
echo "${#x} + 1" | bc -l
else
echo 0
fi
}
function test_str_instr {
str_instr "(" "'foo@host (dev,web)'" | assert_eq 11
str_instr ")" "'foo@host (dev,web)'" | assert_eq 19
str_instr "[" "'foo@host [dev,web]'" | assert_eq 11
str_instr "]" "'foo@host [dev,web]'" | assert_eq 19
str_instr "a" "abc" | assert_eq 1
str_instr "z" "abc" | assert_eq 0
str_instr "Eggs" "Green Eggs And Ham" | assert_eq 7
str_instr "a" "" | assert_eq 0
str_instr "" "" | assert_eq 0
str_instr " " "Green Eggs" | assert_eq 6
str_instr " " " Green " | assert_eq 1
}
您可以使用逻辑 && 更紧凑
#!/bin/bash
# NO MATCH EXAMPLE
string="test"
[[ "$string" == *"foo"* ]] && {
echo "YES"
}
# MATCH EXAMPLE
string="tefoost"
[[ "$string" == *"foo"* ]] && {
echo "YES"
}
msg="message"
function check {
echo $msg | egrep [abc] 1> /dev/null
if [ $? -ne 1 ];
then
echo "found"
else
echo "not found"
fi
}
check
这将发现任何出现的 a 或 b 或 c
使用 jq:
string='My long string'
echo $string | jq -Rr 'select(contains("long"))|"It is there"'
jq 中最难的是打印单引号:
echo $string | jq --arg quote "'" -Rr 'select(contains("long"))|"It\($quote)s there"'
使用 jq 只是为了检查条件:
if jq -Re 'select(contains("long"))|halt' <<< $string; then
echo "It's there!"
fi
[[: not found
。知道有什么问题吗?我在 Ubuntu 上使用 GNU bash 版本 4.1.5(1)。#!/bin/sh
。请改用#!/bin/bash
。