Używam poniżej, aby uzyskać wszystkie treści HTML odcinka zapisać do bazy danychPython, lxml i usuwania tag zewnętrzną z użyciem lxml.html.tostring (EL)
el = doc.get_element_by_id('productDescription')
lxml.html.tostring(el)
opisie produktu ma tag, który wygląda tak:
<div id='productDescription'>
<THE HTML CODE I WANT>
</div>
Kod działa świetnie, daje mi cały kod html, ale w jaki sposób mogę usunąć zewnętrzną warstwę czyli <div id='productDescription'>
i zamykającym tagiem </div>
?
Co to jest "łańcuch bazowy"? – nHaskins