regex do Pickout jakiś tekst w nawiasie

Powiel możliwe:
Extract info inside all parenthesis in R (regex)regex do Pickout jakiś tekst w nawiasie

Mam ciąg

Peoplesoft(id-1290)

Chciałbym uchwycić znaki pomiędzy rodzic esis, na przykład. Lubię uzyskać id-1290 z powyższego przykładu.

użyłem to:

x <- regexpr("\\((.*)\\)", df)

to daje mi numery jak

[1] 10

Czy istnieje prosty sposób, aby pobrać tekst między Paréntesis przy użyciu regex w R?

Źródło

2012-11-21 user1471980

wolę używać gsub() na to:

gsub(".*\\((.*)\\).*", "\\1", df) 
[1] "id-1290"

regex działa tak:

Znajdź tekst wewnątrz nawiasów - nie twoje prawdziwe nawiasy, ale mój dodatkowy zestaw nawiasy, tj. (.*)
Zwróć to jako odnośnik, \\1

Innymi słowy zastąpić cały tekst w ciąg z tyłu odniesienia

Jeśli chcesz użyć regexp zamiast gsub, to zrobić:

x <- regexpr("\\((.*)\\)", df) 
x 

[1] 11 
attr(,"match.length") 
[1] 9 
attr(,"useBytes") 
[1] TRUE

ta zwraca wartość 11, tj. pozycja początkowa znalezionego wyrażenia. Zwróć też uwagę na atrybut match.length, który wskazuje, ile znaków zostało dopasowanych.

Można wyodrębnić ten z attr:

attr(x, "match.length") 
[1] 9

a następnie użyć substring wyodrębnić znaki:

substring(df, x+1, x+attr(x, "match.length")-2) 
[1] "id-1290"

Źródło

2012-11-21 17:36:41 Andrie

Oto nieco inny sposób, przy użyciu lookbehind/przyszłość:

df <- "Peoplesoft(id-1290)" 
regmatches(df,gregexpr("(?<=\\().*?(?=\\))", df, perl=TRUE))

Różnica z odpowiedzią Andrie jest taka, że również orks, aby wyodrębnić wiele ciągów w nawiasach. na przykład:

df <- "Peoplesoft(id-1290) blabla (foo)" 
regmatches(df,gregexpr("(?<=\\().*?(?=\\))", df, perl=TRUE))

Daje:

[[1]] 
[1] "id-1290" "foo"

Źródło

2012-11-21 18:19:26

regex do Pickout jakiś tekst w nawiasie

Odpowiedz

Powiązane problemy