Mam dość duży dokument w formacie HTML wygenerowany z Microsoft Word. Jest taki baaaardzo brudny i pełen rozdętych rzeczy (jak niezalogowany tag, nieznajoma przestrzeń nazw itp. I inne nadęte rzeczy).jak wyczyścić dokument HTML w formacie Microsoft?
czy istnieje sposób na konwersję do zwykłego sytaxa html?