Wyodrębnianie liczb dziesiętnych z łańcucha

Mam ciąg takich jak "3.1 ml" lub "abc 3.1 xywazw"Wyodrębnianie liczb dziesiętnych z łańcucha

chciałbym wyodrębnić "3.1" z tego łańcucha. Znalazłem wiele pytań dotyczących stackoverflow dotyczących wyodrębniania liczb z ciągu znaków, ale żadne rozwiązanie nie działa dla przypadku liczb dziesiętnych.

Źródło

2013-10-08 Stéphane Laurent

Takie podejście sprawia, że punkt dziesiętny i ułamek dziesiętny opcjonalne i umożliwia wielokrotne numery do ekstrakcji:

str <- " test 3.1 test 5" 
as.numeric(unlist(regmatches(str, 
          gregexpr("[[:digit:]]+\\.*[[:digit:]]*",str)) 
     )  ) 
#[1] 3.1 5.0

Troska o liczbach ujemnych może być adres z opcjonalnym stylu Perl antycypowana:

str <- " test -4.5 3.1 test 5" 
    as.numeric(unlist(regmatches(str,gregexpr("(?>-)*[[:digit:]]+\\.*[[:digit:]]*",str, perl=TRUE)))) 

#[1] -4.5 3.1 5.0

Źródło

2013-10-08 16:55:37

Rzeczywiście działa to w wielu sytuacjach, fantastycznie! –

Edytowano. Wcześniej miał nieprawidłowy kwantyfikator powtórzeń. –

Dobrze. Dziękuję za poprawienie mnie. –

Użyj stringr Biblioteka:

x<-"abc 3.1 xywazw" 
str_extract(x, "\\d+\\.*\\d*") 
[1] "3.1"

Źródło

2013-10-08 16:01:01 tcash21

Możliwe użycie '' \\ d + \\. \\ d + "' –

Dziękuję. @RicardoSaporta ma rację. Na przykład nie działa to dla '13.1'. –

Żadna z nich nie zadziała na "10". Nie sądzę, że "+" jest właściwym kwantyfikatorem powtórzeń do użycia dla drugiego lub trzeciego wyrażenia. –

Można użyć wyrażeń regularnych:

> str <- " test 3.1 test" 
> as.numeric(regmatches(str,regexpr("[[:digit:]]+\\.[[:digit:]]+",str))) 
[1] 3.1

regexpr zwraca pozycję początkową i długość dopasowanego łańcucha. regmatches zwraca dopasowania. Możesz następnie przekonwertować go na liczbę.

Źródło

2013-10-08 16:19:00

Mój awans został zablokowany. Próbowałem go odwrócić, gdy zdałem sobie sprawę, że "." był niewłaściwie używany. To musi być uciekł. Być może uda ci się naprawić ten błąd, a wtedy zostanie pobrane upto. –

@DWin Jeśli na przykład wprowadzisz tekst "test testu 3p1", nie zostanie on dopasowany. Więc nie jestem pewien "." tutaj trzeba uciec. –

"3p1" jest dopasowywany, ale następnie konwertowany na NA przez "as.numeric". –

wyrażenie regularne na liczbę zmiennoprzecinkową z http://www.regular-expressions.info/floatingpoint.html z drobnych korekt do pracy w R.

s <- "1e-6 dkel" 
regmatches(s,gregexpr("[-+]?[0-9]*\\.?[0-9]+([eE][-+]?[0-9]+)?",s)) 
> [[1]] 
> [1] "1e-6"

Źródło

2013-10-08 19:25:33

Wyodrębnianie liczb dziesiętnych z łańcucha

Odpowiedz

Powiązane problemy