Jestem nowy w XPath, ale widzę, jak potężny jest. Patrzę na kod źródłowy tego link i po prostu chcę wyodrębnić zawartość i nazwę użytkownika z dwóch kolejnych części strony, które ze względu na prostotę znajdują się w górnej części kodu źródłowego.XPath w R przy użyciu pakietu XML
content = "Żywe Stream [Offline] Gears [Archiwum] Simburgur za of War 3"
<div class="username">Simburgur</div>
Oto mój kod wewnątrz R:
doc <- htmlParse("http://forums.epicgames.com/archive/index.php/t-672775.html")
xpathSApply(doc, "//head/meta[@name=\"description\"]")
która zwraca
[[1]]
<meta name="description" content="[Archive] Simburgur's Live Stream [Offline] Gears of War 3" />
Oczywiście w tym przykładzie wszystko, czego chcę, to to, co jest w cudzysłowach content =, ale utknąłem i nie mogę sprawić, że moje wyrażenie zwróci żądany ciąg znaków.
Powtarzam. Jestem nowy w XPath. :)
Dobre pytanie, +1. Zobacz moją odpowiedź na dwa krótkie i skuteczne rozwiązania. :) –