Jak użyć wyrażenia regularnego do pobrania znacznika "img"?

Chcę pobrać znacznik img z tekstu zwróconego z danych JSON w ten sposób. Chcę pobrać to z ciągu znaków:Jak użyć wyrażenia regularnego do pobrania znacznika "img"?

<img class="img" src="https://fbcdn-photos-c-a.akamaihd.net/hphotos-ak-frc3/1239478_598075296936250_1910331324_s.jpg" alt="" />

Jakie jest wyrażenie regularne, którego muszę użyć, aby je dopasować?

Użyłem następujących, ale to nie działa.

"<img[^>]+src\\s*=\\s*['\"]([^'\"]+)['\"][^>]*>"

Źródło

2013-09-06 eng.ahmed

http : //stackoverflow.com/a/1732454/775544 –

Nie parsuj HTML z regex. HTML nie jest zwykłym językiem. – thegrinner

** Nie używaj wyrażeń regularnych do parsowania HTML. Użyj odpowiedniego modułu analizowania HTML. ** Nie można wiarygodnie parsować HTML za pomocą wyrażeń regularnych, a spotkasz na swojej drodze smutek i frustrację. Gdy tylko HTML zmieni się z twoich oczekiwań, twój kod zostanie zepsuty. Zobacz http://htmlparsing.com/php lub [this SO thread] (http://stackoverflow.com/questions/3577641/how-do-you-parse-and-process-html-xml-in-php) dla przykłady prawidłowego analizowania kodu HTML za pomocą modułów PHP, które zostały już napisane, przetestowane i debugowane. –

mógłby po prostu użyć tego wyrażenia, aby dopasować znacznika img jak w przykładzie:

<img([\w\W]+?)/>

Źródło

2013-09-06 19:24:27 aleroot

OP nie powiedział co chciał uchwycić ale ten oddaje klasę, SRC, oraz znaczniki alt. – hwnd

@hwnd tak, wiem. ale jak powiedział, że nie określono, co chce się uchwycić. – aleroot

Html tak naprawdę nie można efektywnie parsować za pomocą wyrażenia regularnego, dodając pewną ziarnistość w wyrażeniu, co jednak zwiększa prawdopodobieństwo: – sln

Twój regex nie pasuje ciąg, ponieważ brakuje zamykanie /.

Edit - Nie, / nie jest konieczne, więc regex powinny pracowali. Ale możesz zrelaksować się trochę jak poniżej.

nieco zmodyfikowany:

<img\s[^>]*?src\s*=\s*['\"]([^'\"]*?)['\"][^>]*?>

Źródło

2013-09-06 19:30:16 sln

Należy pamiętać, że nie należy używać wyrażeń regularnych do parsowania HTML dla różnych powodów

<img\s+[^>]*src="([^"]*)"[^>]*>

lub użyj Jsoup ...

String html = "<img class=\"img\" src=\"https://fbcdn-photos-c-a.akamaihd.net/ 
       hphotos-ak-frc3/1239478_598075296936250_1910331324_s.jpg\" alt=\"\" />"; 

Document doc = Jsoup.parse(html); 
Element img = doc.select("img").first(); 
String src = img.attr("src"); 

System.out.println(src);

Źródło

2013-09-06 19:36:02 hwnd

są jsoup lepiej niż to ?? –

Updated przykład – hwnd

mogę dostać cały img tag? –

Jak użyć wyrażenia regularnego do pobrania znacznika "img"?

Odpowiedz

Powiązane problemy