2012-08-30 14 views
5

Jeśli używam tegouzyskać źródło strony internetowej z wytopione html z JavaScript

WebClient client = new WebClient(); 
String htmlCode = client.DownloadString("http://test.net"); 

jestem w stanie wykorzystać pakiet agility, aby zeskanować kod HTML i uzyskać większość tagów że muszę, ale jej brakuje html, który jest renderowany przez javascript.

Moje pytanie brzmi: jak uzyskać ostateczne renderowane źródło strony za pomocą C#. Czy jest coś więcej w WebClient, aby uzyskać ostateczne renderowane źródło po uruchomieniu javascript?

+0

wątpię, można to zrobić z C# sam. – ceejayoz

Odpowiedz

1

Sam pakiet Agility HTML nie wystarczy, aby zrobić to, co chcesz, potrzebujesz również silnika javascript. Aby to zrobić, możesz wypróbować coś takiego jak Geckofx, które pozwoli ci osadzić w aplikacji w pełni funkcjonalną przeglądarkę internetową, a następnie umożliwić programowy dostęp do zawartości domeny po renderowaniu strony.

http://code.google.com/p/geckofx/

+0

nowszy geckofx można znaleźć tutaj: https://bitbucket.org/geckofx/geckofx-14.0/ – Tom

Powiązane problemy