不区分大小写的替换

B

Brian Moeskau

string 类型不支持这一点。您最好将 the regular expression sub method 与 re.IGNORECASE 选项一起使用。

>>> import re
>>> insensitive_hippo = re.compile(re.escape('hippo'), re.IGNORECASE)
>>> insensitive_hippo.sub('giraffe', 'I want a hIPpo for my birthday')
'I want a giraffe for my birthday'

如果您只进行一次替换，或者想要节省代码行，使用 re.sub 和 (?i) 标志的单个替换更有效： re.sub('(?i)' + re .escape('hippo'), 'giraffe', '我的生日想要一只河马')

为什么只为一串字母重新转义？谢谢。

@Elena，'hippo' 不需要它，但如果将要替换的值传递给函数，它会很有用，所以它确实比其他任何东西都更好。

除了必须re.escape你的针之外，这里还有另一个陷阱，这个答案无法避免，在 stackoverflow.com/a/15831118/1709587 中指出：由于 re.sub 处理转义序列，如 docs.python.org/library/re.html#re.sub 中所述，你需要转义你的所有反斜杠替换字符串或使用 lambda。

这不适用于在 r'xxxA\BCxxxA\BCxxx') 中用 r'D\EF' 替换 r'A\BC' - 正确答案是打击，来自 johv

U

Unknown

import re
pattern = re.compile("hello", re.IGNORECASE)
pattern.sub("bye", "hello HeLLo HELLO")
# 'bye bye bye'

或单行：re.sub('hello', 'bye', 'hello HeLLo HELLO', flags=re.IGNORECASE)

请注意，re.sub 自 Python 2.7 起仅支持此标志。

B

Bill the Lizard

在一行中：

import re
re.sub("(?i)hello","bye", "hello HeLLo HELLO") #'bye bye bye'
re.sub("(?i)he\.llo","bye", "he.llo He.LLo HE.LLO") #'bye bye bye'

或者，使用可选的“标志”参数：

import re
re.sub("hello", "bye", "hello HeLLo HELLO", flags=re.I) #'bye bye bye'
re.sub("he\.llo", "bye", "he.llo He.LLo HE.LLO", flags=re.I) #'bye bye bye'

E

Excelsior_07

继续 bFloch 的回答，这个函数不会改变一个，而是所有出现的 old 和 new - 以不区分大小写的方式。

def ireplace(old, new, text):
    idx = 0
    while idx < len(text):
        index_l = text.lower().find(old.lower(), idx)
        if index_l == -1:
            return text
        text = text[:index_l] + new + text[index_l + len(old):]
        idx = index_l + len(new) 
    return text

做得太好了。比正则表达式好得多；它处理各种字符，而正则表达式对任何非字母数字都非常挑剔。首选答案恕我直言。

您所要做的就是逃避正则表达式：接受的答案比这更短且更容易阅读。

Escape 仅适用于匹配，目标中的反斜杠仍然会使事情变得混乱。

可能是不区分大小写替换的最快方法，针对使用数组字符串和使用正则表达式进行了测试。

b

bFloch

这不需要 RegularExp

def ireplace(old, new, text):
    """ 
    Replace case insensitive
    Raises ValueError if string not found
    """
    index_l = text.lower().index(old.lower())
    return text[:index_l] + new + text[index_l + len(old):]

好一个，但是这不会将所有出现的旧的都更改为新的，而只会更改第一次出现。

它的可读性不如正则表达式版本。无需在这里重新发明轮子。

在此版本和投票版本之间进行性能比较会很有趣，它可能会更快，这对某些应用程序很重要。或者它可能会更慢，因为它在解释型 Python 中做更多的工作。

M

Mark Amery

就像布莱尔康拉德说 string.replace 不支持这一点。

使用正则表达式 re.sub，但请记住先转义替换字符串。请注意，2.6 中没有用于 re.sub 的标志选项，因此您必须使用嵌入式修饰符 '(?i)'（或 RE 对象，请参阅 Blair Conrad 的回答）。此外，另一个陷阱是 sub 将处理替换文本中的反斜杠转义，如果给出一个字符串。为了避免这种情况，可以改为传入一个 lambda。

这是一个函数：

import re
def ireplace(old, repl, text):
    return re.sub('(?i)'+re.escape(old), lambda m: repl, text)

>>> ireplace('hippo?', 'giraffe!?', 'You want a hiPPO?')
'You want a giraffe!?'
>>> ireplace(r'[binfolder]', r'C:\Temp\bin', r'[BinFolder]\test.exe')
'C:\\Temp\\bin\\test.exe'

N

Nico Bako

此函数同时使用 str.replace() 和 re.findall() 函数。它将以不区分大小写的方式将 string 中所有出现的 pattern 替换为 repl。

def replace_all(pattern, repl, string) -> str:
   occurences = re.findall(pattern, string, re.IGNORECASE)
   for occurence in occurences:
       string = string.replace(occurence, repl)
       return string

M

Murray

关于语法细节和选项的有趣观察：

Python 3.7.2 (tags/v3.7.2:9a3ffc0492, Dec 23 2018, 23:09:28) [MSC v.1916 64 bit (AMD64)] on win32

import re
old = "TREEROOT treeroot TREerOot"
re.sub(r'(?i)treeroot', 'grassroot', old)

《草根草根草根》

re.sub(r'treeroot', 'grassroot', old)

'树根草根树根'

re.sub(r'treeroot', 'grassroot', old, flags=re.I)

《草根草根草根》

re.sub(r'treeroot', 'grassroot', old, re.I)

'树根草根树根'

因此，匹配表达式中的 (?i) 前缀或添加“flags=re.I”作为第四个参数将导致不区分大小写的匹配。但是，仅使用“re.I”作为第四个参数不会导致不区分大小写的匹配。

为了比较，

re.findall(r'treeroot', old, re.I)

['树根'，'树根'，'树根']

re.findall(r'treeroot', old)

['树根']

这没有提供问题的答案。请edit您的答案，以确保它比该问题中已有的其他答案有所改进。

从 re.sub docs 它有 5 个参数：re.sub(pattern, repl, string, count=0, flags=0) 这就是 flags=re.I 工作但尝试将其作为位置参数传递失败的原因，它位于错误的位置。

N

Nimantha

我正在将 \t 转换为 escape sequences （向下滚动一点），所以我注意到 re.sub 将反斜杠转义字符转换为转义序列。

为了防止我写了以下内容：

替换不区分大小写。

import re
    def ireplace(findtxt, replacetxt, data):
        return replacetxt.join(  re.compile(findtxt, flags=re.I).split(data)  )

此外，如果您希望它用转义字符替换，就像这里的其他答案将特殊含义的 bashslash 字符转换为转义序列一样，只需解码您的查找和或替换字符串。在 Python 3 中，可能需要执行类似 .decode("unicode_escape") # python3 之类的操作

findtxt = findtxt.decode('string_escape') # python2
replacetxt = replacetxt.decode('string_escape') # python2
data = ireplace(findtxt, replacetxt, data)

在 Python 2.7.8 中测试

N

Nimantha

i='I want a hIPpo for my birthday'
key='hippo'
swp='giraffe'

o=(i.lower().split(key))
c=0
p=0
for w in o:
    o[c]=i[p:p+len(w)]
    p=p+len(key+w)
    c+=1
print(swp.join(o))

学习：通常当您对字符串进行搜索和替换时，最好不必先将其转换为数组。这就是为什么第一个答案可能是最好的。当它使用外部模块时，它将字符串视为一个完整的字符串。在这个过程中发生了什么也更清楚了。

学习：对于没有上下文的开发人员来说，阅读这段代码并破译它在做什么是非常困难的:)

不区分大小写的替换

关注公众号

想领先一步获取最新的外包任务吗？

相似问题

平台

支持

友情链接

联系我们