Piszę dokument HTML z kilkoma modułami Perla: HTML::TreeBuilder i HTML::Element. Z jakiegoś powodu, gdy zawartość tagu jest tylko
, którego należy się spodziewać, że zostanie zwrócony przez HTML :: Element jako dziwny charakter nigdy nie widział:Dlaczego ten znak A0 pojawia się w moim wyjściu HTML :: Element?
alt text http://www.freeimagehosting.net/uploads/2acca201ab.jpg
mogę” t skopiuj znak, więc nie może go znaleźć w Google, nie może znaleźć go na mapie znaków, a gdy go wyszukuję za pomocą wyrażenia regularnego, znajdzie je. Kiedy konwertuję zwracany dokument na ANSI lub UTF-8, znika on całkowicie. Nie mogłem znaleźć żadnych informacji na ten temat w dokumentacji HTML :: Element.
Jak mogę wykryć i zamienić tę postać na coś bardziej użytecznego, jak na przykład null
i jak mam sobie radzić w przyszłości z takimi dziwnymi postaciami?
Łącze do obrazu ma zgniłe –