Mam kilka danych HTML, które piszę do pliku PDF przy użyciu PHP. W pliku PDF chcę, aby cały HTML był usuwany i czyszczony. Tak na przykład:Oczyszczanie kodu HTML za pomocą PHP w celu utworzenia czystego łańcucha
<ul>
<li>First list item</li>
<li>Second list item which is quite a bit longer</li>
<li>List item with apostrophe 's 's</li>
</ul>
powinien stać:
First list item
Second list item which is quite a bit longer
List item with apostrophe 's 's
Jednakże, jeśli po prostu użyć strip_tags()
, mam coś takiego:
First list item

Second list item which is quite a bit
longer

List item with apostrophe ’s ’s
pamiętać również wcięcia wyjściu.
Jakieś wskazówki, jak poprawnie oczyścić HTML na ładne, czyste ciągi bez bałagania i dziwnych znaków?
Dzięki :)
Wątpię, że samo 'strip_tags()' zakoduje twoje encje. Czy na pewno nie brakuje Ci połączenia z 'htmlentities'? – Yoshi
Wcięcie jest dokładnie tym, czego oczekiwałbym, PHP rozbiera znaczniki, ale nie dodatkowy tekst dookoła nich. – scragar
Czy masz na myśli, że I * powinien * lub * nie powinien * używać htmlentities() gdzieś? W tej chwili nie jestem. Dane HTML pochodzą bezpośrednio z bazy danych. – Rein