Próbuję uruchomić preg_match, aby wyodrębnić atrybut SRC z pierwszego tagu IMG w artykule (w tym przypadku, zapisanym w $ row-> introtext).Dopasowywanie atrybutu SRC znacznika IMG przy użyciu preg_match
preg_match('/\< *[img][^\>]*[src] *= *[\"\']{0,1}([^\"\']*)/i', $row->introtext, $matches);
Zamiast się coś podobnego
images/stories/otakuzoku1.jpg
z
<img src="images/stories/otakuzoku1.jpg" border="0" alt="Inside Otakuzoku's store" />
mam tylko
0
regex powinny być w porządku, ale nie mogę powiedzieć, dlaczego wydaje się pasować do atrybutu granicznego te, a nie atrybut src.
Ewentualnie, jeśli masz dość cierpliwości, aby przeczytać tak daleko, bez przechodzenia bezpośrednio do pola odpowiedzi i wpisując "użyj parsera HTML/XML", dobrym poradnikiem dla jednego może być zalecany, ponieważ mam problem ze znalezieniem jeden w ogóle, który dotyczy PHP 4.
PHP 4.4.7
To załatwiło sprawę. Nie jest to "idealne" rozwiązanie do analizowania kodu HTML, ale jedyne rozwiązanie, które działa i daje niezbędny rezultat. Dzięki! – KyokoHunter
jako notatkę dodatkową, $ matches [0] zawiera pełny tag IMG, a $ matches [1] zawiera źródłowy identyfikator URI. –