Próbuję oczyścić i usunąć katalogi z listy adresów URL w RUsuń końcu adresu URL w R
Co mam:
http://domain.com/123
http://www.sub.domain1.com/222
http://www.domain2.com/1233/abc
Czego chcę:
domain.com
sub.domain1.com
domain2.com
mam nieco długą drogę do czystej początek URL
url <- c("http://domain.com/123", "http://www.sub.domain1.com/222","http://www.domain2.com/1233/abc"
cleanurl <- gsub("http://","",url)
cleanurl2 <- gsub("www.","",cleanurl)
(Proszę dać mi znać, jeśli istnieje prostszy sposób czyszczenia http: // i www. też.)
Teraz mam problemy z regex i usunięcie wszystkiego po /
na końcu. Próbowałem to
cleanurl3 <- gsub("/*","",cleanurl2)
Ale to jest po prostu usunięcie wszystkiego po nim /
i nie.
Z góry dziękuję za pomoc!
Spróbuj użyć "\/*" (tam backsleshem tam). Myślę, że należy uciec przed ciosem. Sprawdź, czy to działa. – feralin
Próbowałem, ale daje mi ten błąd> cleanurl3 <- gsub ("\/*", "", cleanurl2) Błąd: "\ /" jest nierozpoznanym ucieczką w ciągu znaków zaczynającym się "\ /" – NicoM
Twoje drugie wyrażenie nie usuwa slasha, ponieważ '/ *' pasuje do dowolnej liczby znaków '/'. Zamiast tego chcesz '/.*'. –