jak wyodrębnić tekst poza tagami xml

Chcę wyodrębnić tekst poza tagami. Na przykład:jak wyodrębnić tekst poza tagami xml

<body> 
    This is an exmaple 
    <p> 
     blablabla 
    </p> 
    <references> 
     refer 1 
     refer 2 
    </references> 
</body>

Chcę uzyskać tekst "To jest przykład" tylko bez tekstu w innych znacznikach (p lub odniesienia). Próbowałem kilku metod, ale nie działa. Any1 może pomóc? Wielkie dzięki.

Źródło

2011-07-29 Jun Hou

Musisz myśleć tekst wewnątrz znacznika, jak węzeł. Węzeł tekstowy jest pobierany za pomocą węzła testowego text(). Przykład. Biorąc pod uwagę:

<body> 
    This is an exmaple 
    <p> 
    blablabla 
    <\p> 
    <references> 
     refer 1 
     refer 2 
    <\references> 
    another example 
<\body>

XPath:

"/body/text()"

pobierze wszystkie węzły tekstowe dzieci z body, jak "To exmaple" i "kolejnym przykładem", przy czym:

"/body/text()[1]"

będzie pobierz tylko pierwszą: "To jest przykład". Jeśli chcesz wszystkie podrzędne węzły tekstowe można użyć:

"/body//text()"

lub chcesz wszystkie węzły tekstowe wewnątrz pierwszej p:

"/body/p[1]//text()"

Źródło

2011-07-29 10:18:40

Można tego dokonać poprzez C# XmlDocument lub XmlReader? Próbuję odczytać tekst i napisać tekst do innego xml do indeksowania. –

Oczywiście możesz najpierw użyć XPath na xmldocument przy użyciu niektórych metod, takich jak SelectNodes lub SelectSingleNode (nie używaj tego od co najmniej roku). –

Użyj tego XPath: /body/text(). Będzie wybrać This is an exmaple.

Źródło

2011-07-29 09:48:12

jak wyodrębnić tekst poza tagami xml

Odpowiedz

Powiązane problemy