2009-05-28 16 views

Odpowiedz

148

Typ string nie obsługuje tego. Najlepiej najlepiej użyć opcji the regular expression sub method z opcją re.IGNORECASE.

>>> import re 
>>> insensitive_hippo = re.compile(re.escape('hippo'), re.IGNORECASE) 
>>> insensitive_hippo.sub('giraffe', 'I want a hIPpo for my birthday') 
'I want a giraffe for my birthday' 
+7

Jeśli robisz tylko jedną zamianę lub chcesz zapisać wiersze kodu, bardziej efektywne jest użycie pojedynczego zastępowania za pomocą opcji re.sub i flagi (? I): re.sub ('(? I) "+ re.uciec ("hipopotam"), "żyrafa", "Chcę hIPpo na moje urodziny") –

+8

+1 za re .escape – daboross

+2

Dlaczego ** re.escape ** tylko dla ciągu liter? Dzięki. – Elena

61
import re 
pattern = re.compile("hello", re.IGNORECASE) 
pattern.sub("bye", "hello HeLLo HELLO") 
# 'bye bye bye' 
2

nie wymaga RegularExp

def ireplace(old, new, text): 
    """ 
    Replace case insensitive 
    Raises ValueError if string not found 
    """ 
    index_l = text.lower().index(old.lower()) 
    return text[:index_l] + new + text[index_l + len(old):] 
+2

Dobrze, ale to nie zmienia wszystkich wystąpień starego z nowym, ale tylko pierwszym wystąpieniem. – rsmoorthy

+3

Jest mniej czytelny niż wersja regex. Nie trzeba tu wymyślać na nowo. –

+0

Interesujące byłoby porównanie wydajności tej wersji z wersją przestawioną, która może być szybsza, co ma znaczenie w przypadku niektórych aplikacji. Lub może być wolniejszy, ponieważ działa więcej w interpretacji Pythona. –

5

Kontynuując odpowiedź bFloch użytkownika, funkcja ta zmiana nie jeden, ale wszystkie wystąpienia stare z nowym - w przypadku, niewrażliwego mody.

def ireplace(old, new, text): 
    idx = 0 
    while idx < len(text): 
     index_l = text.lower().find(old.lower(), idx) 
     if index_l == -1: 
      return text 
     text = text[:index_l] + new + text[index_l + len(old):] 
     idx = index_l + len(new) 
    return text 
+0

Bardzo dobrze zrobione. Znacznie lepiej niż regex; obsługuje wszystkie rodzaje znaków, podczas gdy regex jest bardzo wybredny w stosunku do wszystkiego, co nie jest alfanumeryczne. Preferowana odpowiedź IMHO. – fyngyrz

+0

Wszystko, co musisz zrobić, to uciec przed regexem: zaakceptowana odpowiedź jest znacznie krótsza i łatwiejsza do odczytania niż ta. –

-1

nigdy pisał odpowiedź przed i ten wątek jest bardzo stary, ale wpadłem na inny sollution i zorientowali mogę uzyskać respons, nie jestem zaprawiony w programowaniu Pythona, więc jeśli istnieją appearant wad do niego, proszę wskazać je od jego dobrej nauki :)

i='I want a hIPpo for my birthday' 
key='hippo' 
swp='giraffe' 

o=(i.lower().split(key)) 
c=0 
p=0 
for w in o: 
    o[c]=i[p:p+len(w)] 
    p=p+len(key+w) 
    c+=1 
print(swp.join(o)) 
+2

Dla uczenia się: ogólnie rzecz biorąc, kiedy szukasz i zamieniasz na łańcuch, lepiej nie zamieniać go najpierw w tablicę. Dlatego pierwsza odpowiedź jest prawdopodobnie najlepsza. Podczas używania zewnętrznego modułu traktuje ciąg jako jeden ciąg. Trochę jaśniej, co się dzieje w tym procesie. – isaaclw

25

bardzo prosty, w jednej linii:

import re 
re.sub("(?i)hello","bye", "hello HeLLo HELLO") #'bye bye bye' 
re.sub("(?i)he\.llo","bye", "he.llo He.LLo HE.LLO") #'bye bye bye' 

Lub użyć opcjonalnego "flagi" Argument:

import re 
re.sub("hello", "bye", "hello HeLLo HELLO", flags=re.I) #'bye bye bye' 
re.sub("he\.llo", "bye", "he.llo He.LLo HE.LLO", flags=re.I) #'bye bye bye' 
1

Podobnie jak Blair Conrad mówi, że string.replace nie obsługuje tego.

Użyj wyrażeń regularnych re.sub, ale pamiętaj, aby najpierw uciec przed zastępczym ciągiem znaków. Zauważ, że nie ma opcji flag w 2.6 dla re.sub, więc będziesz musiał użyć wbudowanego modyfikatora '(?i)' (lub obiektu RE, patrz odpowiedź Blair Conrad). Inną pułapką jest to, że sub przetwarza odwrotne ukośniki w tekście zastępczym, jeśli podany jest łańcuch. Aby tego uniknąć, można zamiast tego przekazać lambdę.

Poniżej funkcję:

import re 
def ireplace(old, repl, text): 
    return re.sub('(?i)'+re.escape(old), lambda m: repl, text) 

>>> ireplace('hippo?', 'giraffe!?', 'You want a hiPPO?') 
'You want a giraffe!?' 
>>> ireplace(r'[binfolder]', r'C:\Temp\bin', r'[BinFolder]\test.exe') 
'C:\\Temp\\bin\\test.exe' 
0

miałem \ t jest przekształcany do escape sequences (przewijania nieco w dół), więc zauważyć, że re.sub przekształca odwrotnym ukośnikiem uciec znaków sekwencje.

Aby zapobiec że napisałem co następuje:

Wymień wielkość liter ma znaczenie.

import re 
    def ireplace(findtxt, replacetxt, data): 
     return replacetxt.join( re.compile(findtxt, flags=re.I).split(data) ) 

Ponadto, jeśli chcesz go zastąpić znaków ewakuacyjnych, podobnie jak innych odpowiedzi tutaj, że są coraz szczególne znaczenie znaków bashslash konwertowane na sekwencje, po prostu zdekodować swoje znalezisko i lub wymienić łańcuch. W Pythonie 3, może zrobić coś podobnego .decode ("unicode_escape") # python3

findtxt = findtxt.decode('string_escape') # python2 
replacetxt = replacetxt.decode('string_escape') # python2 
data = ireplace(findtxt, replacetxt, data) 

przetestowany w Pythonie 2.7.8

nadzieję, że pomoże.

Powiązane problemy