Próbowałem HtmlAgilityPack i następujący kod, ale nie przechwytywania tekstu z list HTML:Jak wyodrębnić tekst widoczny na stronie ze źródła html?
HtmlAgilityPack.HtmlDocument doc = new HtmlAgilityPack.HtmlDocument();
doc.LoadHtml(htmlStr);
HtmlNode node = doc.DocumentNode;
return node.InnerText;
Oto kod, który kończy się niepowodzeniem:
<as html>
<p>This line is picked up <b>correctly</b>. List items hasn't...</p>
<p><ul>
<li>List Item 1</li>
<li>List Item 2</li>
<li>List Item 3</li>
<li>List Item 4</li>
</ul></p>
</as html>
To prawdopodobnie z powodu Javascript. – SLaks
Pokaż "HTML", który analizujesz. – RedFilter
@RedFilter Zaktualizowałem kod HTML. –