Jak wyodrębnić podwójną wartość z ciągu za pomocą wyrażeń regularnych.Ekstrakt float/podwójna wartość
import re
pattr = re.compile(???)
x = pattr.match("4.5")
Jak wyodrębnić podwójną wartość z ciągu za pomocą wyrażeń regularnych.Ekstrakt float/podwójna wartość
import re
pattr = re.compile(???)
x = pattr.match("4.5")
Oto prosty sposób. Nie używaj regexów dla wbudowanych typów.
try:
x = float(someString)
except ValueError, e:
# someString was NOT floating-point, what now?
W rzeczywistości jest to również najbezpieczniejszy sposób. Rozważmy błędne dane wejściowe, takie jak '0..1',' 0.0.02', bardzo trudno jest je regexowi rozpoznać. Najgorsze jest to, że będzie udawać, że jest poprawna i wywołać złą odpowiedź. – dspjm
Technicznie poprawne, ale pytanie jawnie określa regexp. – VillasV
Wyrażenie regularne z perldoc perlretut
:
import re
re_float = re.compile("""(?x)
^
[+-]?\ * # first, match an optional sign *and space*
( # then match integers or f.p. mantissas:
\d+ # start out with a ...
(
\.\d* # mantissa of the form a.b or a.
)? # ? takes care of integers of the form a
|\.\d+ # mantissa of the form .b
)
([eE][+-]?\d+)? # finally, optionally match an exponent
$""")
m = re_float.match("4.5")
print m.group(0)
# -> 4.5
Aby wyodrębnić numery z większym ciągiem:
s = """4.5 abc -4.5 abc - 4.5 abc + .1e10 abc . abc 1.01e-2 abc
1.01e-.2 abc 123 abc .123"""
print re.findall(r"[+-]? *(?:\d+(?:\.\d*)?|\.\d+)(?:[eE][+-]?\d+)?", s)
# -> ['4.5', '-4.5', '- 4.5', '+ .1e10', ' 1.01e-2',
# ' 1.01', '-.2', ' 123', ' .123']
Wyrażenie findall jest sprawą, dzięki – reabow
float jako wyrażenie regularne w brutalnej sile. są mniejsze różnice między wersją JF Sebastian:
import re
if __name__ == '__main__':
x = str(1.000e-123)
reFloat = r'(^[+-]?\d+(?:\.\d+)?(?:[eE][+-]\d+)?$)'
print re.match(reFloat,x)
>>> <_sre.SRE_Match object at 0x0054D3E0>
To nie pasuje do elementów pływających bez części całkowitej, np. ".123" zamiast "0.123". –
Do parsowania int i float (separatora punkt) Wartości:
re.findall(r'\d+\.*\d*', 'some 12 12.3 0 any text 0.8')
wynik:
['12', '12.3', '0', '0.8']
Jeśli możesz zaoferować procedurę, aby uzyskać int lub float, ale bez tego, że jest w słowniku lub tablicy, to byłoby pomocne. co mam 'str1 =" BIOS: wersja 2.0.0 "' co chcę '2.0.0' bez przecinka lub nawiasów. –
Witaj, możesz użyć: re.findall (r '[\ d \.] +', "BIOS: wersja 2.0.0") –
lepiej: re.findall (r '[\ d \.] {2, } | \ d + ', "BIOS: wersja 2.0.0") –
Możesz podać kilka szczegółów na temat dlaczego nie możesz użyć pływaka ("4,5")? – jfs