Używanie XPath do uzyskania tekstu akapitu z łączami wewnątrz

Parsuję stronę HTML z XPath i chcę pobrać cały tekst określonego akapitu, w tym tekst linków.Używanie XPath do uzyskania tekstu akapitu z łączami wewnątrz

Na przykład mam następujący akapit:

<p class="main-content"> 
    This is sample paragraph with <a href="http://google.com">link</a> inside. 
</p>

muszę się następujący tekst jako wynik: „To jest akapit próbki z linkiem wewnątrz”, jednak stosując "//p[@class'main-content']/text()" daje mi tylko: „To jest akapit próbki z wewnątrz ".

Czy możesz pomóc? Dzięki.

Źródło

2011-11-09 Alexander Silachev

Kod jest uszkodzony - nie zamknąć 'href' cytaty atrybutów. – lonesomeday

Dzięki, poprawiono tę literówkę. –

Aby uzyskać całą zawartość tekstową węzła, użyj string funkcję:

string(//p[@class="main-content"])

pamiętać, że ten dostaje wartość ciągu. Jeśli chcesz węzłów tekstowych (zwróconych przez text()), możesz to zrobić. Trzeba szukać na wszystkich głębokościach:

//p[@class="main-content"]//text()

ta zwraca trzy węzły tekstowe: This is sample paragraph with, link i inside.

Źródło

2011-11-09 14:37:19 lonesomeday

Wielkie dzięki, @lonesomeday. Działa świetnie! –

Używanie XPath do uzyskania tekstu akapitu z łączami wewnątrz

Odpowiedz

Powiązane problemy