Przeczytałem fajne article, jak uniknąć tworzenia wolnych wyrażeń regularnych. Ogólnie rzecz biorąc wygląda na to, że dłuższe i bardziej wyraźne, a wyrażenie regularne jest tym szybsze, co zostanie ukończone. Chciwe wyrażenie regularne może być wykładniczo wolniejsze.Python Regex wolniej niż oczekiwano
Pomyślałem, że przetestuję to, mierząc czas potrzebny do ukończenia bardziej złożonego/wyraźnego stwierdzenia z mniej złożonym/chciwym stwierdzeniem. W przeważającej części wszystko wydaje się być prawdziwe, ale mam jedno zachłanne stwierdzenie, które jest wolniejsze. Oto dwa przykłady:
import re
from timeit import timeit
# This works as expected, the explicit is faster than the greedy.
# http_x_real_ip explicit
print(timeit(setup="import re", stmt='''r = re.search(r'(\d{1,3}\.\d{1,3}.\d{1,3}.\d{1,3})', '192.168.1.1 999.999.999.999')''', number=1000000))
1.159849308001867
# http_x_real_ip greedy
print(timeit(setup="import re", stmt='''r = re.search(r'((?:\d{1,3}\.){3}\d{1,3})', '192.168.1.1 999.999.999.999')''', number=1000000))
1.7421739230003368
# This does not work as expected, greedy is faster.
# time_local explicit
print(timeit(setup="import re", stmt='''r = re.search(r'(\d{1,2}/\w{3}/[2][0]\d{2}:\d{2}:\d{2}:\d{2}\s[+][0]{4})', "[23/Jun/2015:11:10:57 +0000]")''', number=1000000))
1.248802040994633
# time_local greedy
print(timeit(setup="import re", stmt='''r = re.search(r'\[(.*)\]', "[23/Jun/2015:11:10:57 +0000]")''', number=1000000))
1.0256699790043058
Czy lokalne wyrażenie czasowe jest niedokładne?
czasowa chciwość nie jest równoważna. Po prostu dopasowuje wszystko między '[]'. –
Może chciwość czasowa działa szybciej niż się spodziewano? –
time_local chciwy działa szybciej niż oczekiwano ... być może, jeśli analizowany ciąg znaków był znacznie dłuższy, na przykład pełne wpisanie dziennika, zajęłoby to więcej czasu z powodu dodatkowego śledzenia wstecznego? Będę musiał spróbować. – DJO3