Pobierz tekst wewnątrz tagu XML za pomocą grep

Jest piątek po południu, a mój mózg zamarzł!Pobierz tekst wewnątrz tagu XML za pomocą grep

grep -E -m 1 -o "<title>(.*)</title>" myfile.rss

powraca

<title>Some title</title>

Jak mogę po prostu Some title?

Źródło

2011-11-25 tdc

atakujących nie posiada funkcji build-in do analizowania XML. Możesz rozważyć użycie PHP, perla do parsowania XML w odpowiedni sposób. Wtedy uzyskanie wartości węzła będzie łatwe – ajreal

Nie, to kompletna przesada dla zadania! – tdc

Rozumiem, że chcemy tylko wyodrębnić zawartość tytułu z xml znanego układu, a nie parsować xml. Do parsowania xml 'xmlstarlet' może być użytecznym narzędziem. –

rura jest dodatkowo poprzez, na przykład

sed -e 's,.*<title>\([^<]*\)</title>.*,\1,g'

Źródło

2011-11-25 15:09:05

Dzięki! Rozmrażanie mózgu ;-) – tdc

+1, ale zauważ, że używanie "sed" do parsowania XML (lub HTML) nie jest dobrym pomysłem. Powinno to zostać wykonane tylko wtedy, gdy wejście jest dobrze znane i nie zmienia się nieoczekiwanie. Dla wszystkiego, co wyskoczyło automatycznie z Internetu, należy użyć odpowiedniego parsera. – Sorpigal

@Sorpigal, zgadzam się całkowicie, zobacz komentarze do samego pytania w celu uzyskania szczegółów. –

Pobierz tekst wewnątrz tagu XML za pomocą grep

Odpowiedz

Powiązane problemy