2008-12-22 24 views
24

Jak wyodrębnić podwójną wartość z ciągu za pomocą wyrażeń regularnych.Ekstrakt float/podwójna wartość

import re 

pattr = re.compile(???)  
x = pattr.match("4.5")  
+0

Możesz podać kilka szczegółów na temat dlaczego nie możesz użyć pływaka ("4,5")? – jfs

Odpowiedz

20

Oto prosty sposób. Nie używaj regexów dla wbudowanych typów.

try: 
    x = float(someString) 
except ValueError, e: 
    # someString was NOT floating-point, what now? 
+0

W rzeczywistości jest to również najbezpieczniejszy sposób. Rozważmy błędne dane wejściowe, takie jak '0..1',' 0.0.02', bardzo trudno jest je regexowi rozpoznać. Najgorsze jest to, że będzie udawać, że jest poprawna i wywołać złą odpowiedź. – dspjm

+0

Technicznie poprawne, ale pytanie jawnie określa regexp. – VillasV

45

Wyrażenie regularne z perldoc perlretut:

import re 
re_float = re.compile("""(?x) 
^
     [+-]?\ *  # first, match an optional sign *and space* 
     (   # then match integers or f.p. mantissas: 
      \d+  # start out with a ... 
      (
       \.\d* # mantissa of the form a.b or a. 
     )?  # ? takes care of integers of the form a 
     |\.\d+  # mantissa of the form .b 
    ) 
     ([eE][+-]?\d+)? # finally, optionally match an exponent 
    $""") 
m = re_float.match("4.5") 
print m.group(0) 
# -> 4.5 

Aby wyodrębnić numery z większym ciągiem:

s = """4.5 abc -4.5 abc - 4.5 abc + .1e10 abc . abc 1.01e-2 abc 
     1.01e-.2 abc 123 abc .123""" 
print re.findall(r"[+-]? *(?:\d+(?:\.\d*)?|\.\d+)(?:[eE][+-]?\d+)?", s) 
# -> ['4.5', '-4.5', '- 4.5', '+ .1e10', ' 1.01e-2', 
#  '  1.01', '-.2', ' 123', ' .123'] 
+2

Wyrażenie findall jest sprawą, dzięki – reabow

1

float jako wyrażenie regularne w brutalnej sile. są mniejsze różnice między wersją JF Sebastian:

import re 
if __name__ == '__main__': 
    x = str(1.000e-123) 
    reFloat = r'(^[+-]?\d+(?:\.\d+)?(?:[eE][+-]\d+)?$)' 
    print re.match(reFloat,x) 

>>> <_sre.SRE_Match object at 0x0054D3E0> 
+0

To nie pasuje do elementów pływających bez części całkowitej, np. ".123" zamiast "0.123". –

9

Do parsowania int i float (separatora punkt) Wartości:

re.findall(r'\d+\.*\d*', 'some 12 12.3 0 any text 0.8') 

wynik:

['12', '12.3', '0', '0.8'] 
+0

Jeśli możesz zaoferować procedurę, aby uzyskać int lub float, ale bez tego, że jest w słowniku lub tablicy, to byłoby pomocne. co mam 'str1 =" BIOS: wersja 2.0.0 "' co chcę '2.0.0' bez przecinka lub nawiasów. –

+1

Witaj, możesz użyć: re.findall (r '[\ d \.] +', "BIOS: wersja 2.0.0") –

+0

lepiej: re.findall (r '[\ d \.] {2, } | \ d + ', "BIOS: wersja 2.0.0") –

Powiązane problemy