Jak używać zmiennej wewnątrz wyrażenia regularnego?

109

Chciałbym użyć variable wewnątrz regex, jak mogę to zrobić w Python?Jak używać zmiennej wewnątrz wyrażenia regularnego?

TEXTO = sys.argv[1] 

if re.search(r"\b(?=\w)TEXTO\b(?!\w)", subject, re.IGNORECASE): 
    # Successful match 
else: 
    # Match attempt failed

Źródło

2011-08-03 Pedro Lobito

użyć ciąg konkatenacji –

160

Trzeba zbudować regex jako ciąg:

TEXTO = sys.argv[1] 
my_regex = r"\b(?=\w)" + re.escape(TEXTO) + r"\b(?!\w)" 

if re.search(my_regex, subject, re.IGNORECASE): 
    etc.

Zauważ użycie re.escape tak, że jeśli tekst zawiera znaki specjalne, nie będą one interpretowane jako takie.

Źródło

2011-08-03 18:05:54

+12

+1 za odniesienie do re.escape, nie zauważyłem tego w dokumentach wcześniej! – bdeniker

Co się stanie, jeśli zmienna przejdzie pierwsza? 'r '' + foo + 'bar''? – deed02392

@ deed02392 'r''' nie jest konieczne, jeśli robisz' re.escape (foo) ', które i tak powinieneś. Właściwie, myślę, że 're' interpretuje cokolwiek jest podane jako ciąg znaków Unicode, niezależnie od tego, czy prefiksujesz' r' czy nie. – OJFord

rx = r'\b(?<=\w){0}\b(?!\w)'.format(TEXTO)

Źródło

2011-08-03 18:04:32

+1 ponieważ interpolacja ciąg zniknie. – Chris

:-) Wątpię, czy interpolacja ciągów kiedykolwiek zniknie ... –

@phasetwenty: Nie, nie jest. Bardziej lubię formatować, ale twórcy Pythona nie planują usuwania starej składni printf. –

if re.search(r"\b(?<=\w)%s\b(?!\w)" % TEXTO, subject, re.IGNORECASE):

To wstawić co jest w Texto do regex jako ciąg znaków.

Źródło

2011-08-03 18:04:36

zgadzam się ze wszystkimi powyżej, chyba że:

sys.argv[1] było coś Chicken\d{2}-\d{2}An\s*important\s*anchor

sys.argv[1] = "Chicken\d{2}-\d{2}An\s*important\s*anchor"

nie chcesz używać re.escape, ponieważ w tym przypadku będzie go chciał zachowywać się jak regex

TEXTO = sys.argv[1] 

if re.search(r"\b(?<=\w)" + TEXTO + "\b(?!\w)", subject, re.IGNORECASE): 
    # Successful match 
else: 
    # Match attempt failed

Źródło

2015-03-28 13:37:34

Potrzebowałem wyszukać nazwy użytkowników, które są do siebie podobne, i co powiedział Ned Batchelder bardzo pomocny. Uważam jednak, miałem czystsze wyjście kiedy użyłem re.compile tworzyć kryteria wyszukiwania ponownego wyrażenia:

pattern = re.compile(r"("+username+".*):(.*?):(.*?):(.*?):(.*)" 
matches = re.findall(pattern, lines)

wyjściowe mogą być drukowane przy użyciu następujących:

print(matches[1]) # prints one whole matching line (in this case, the first line) 
print(matches[1][3]) # prints the fourth character group (established with the parentheses in the regex statement) of the first line.

Źródło

2015-10-23 20:43:37 jdelaporte

Uważam, że bardzo wygodne do budowy wzór wyrażenia regularnego poprzez łączenie wielu mniejszych wzorców.

import re 

string = "begin:id1:tag:middl:id2:tag:id3:end" 
re_str1 = r'(?<=(\S{5})):' 
re_str2 = r'(id\d+):(?=tag:)' 
re_pattern = re.compile(re_str1 + re_str2) 
match = re_pattern.findall(string) 
print(match)

wyjściowa:

[('begin', 'id1'), ('middl', 'id2')]

Źródło

2016-02-03 19:41:11

Jak używać zmiennej wewnątrz wyrażenia regularnego?

Odpowiedz

Powiązane problemy