2014-07-01 13 views
5

file.htmlHTML Tidy stripping przestrzeń na początku

word<i><span> <span>ratti</span></span></i> 

poleceń

Wyjście

word<i>ratti</i> 

Pożądany wyjście

word<i> ratti</i> 

Gdzie jest miejsce?

Log

line 1 column 1 - Warning: missing <!DOCTYPE> declaration 
line 1 column 1 - Warning: plain text isn't allowed in <head> elements 
line 1 column 8 - Warning: <span> is probably intended as </span> 
line 1 column 5 - Warning: replacing unexpected span by </span> 
line 1 column 33 - Warning: discarding unexpected </span> 
line 1 column 40 - Warning: discarding unexpected </i> 
line 1 column 1 - Warning: inserting missing 'title' element 
line 1 column 8 - Warning: trimming empty <span> 
Info: Document content looks like HTML 4.01 Transitional 
8 warnings, 0 errors were found! 

<!DOCTYPE html PUBLIC "-//W3C//DTD HTML 4.01 Transitional//EN"> 
<html> 
<head> 
<meta name="generator" content= 
"HTML Tidy for Linux/x86 (vers 1st November 2003), see www.w3.org"> 
<title></title> 
</head> 
<body> 
word<i>ratti</i> 
</body> 
</html> 
+0

Wygląda na to, że trzeba go odrzucić, czy próbowałeś nierozerwalnej przestrzeni  ? –

+0

Nie mogę nic zrobić z HTML, to tylko próbka pliku 10K + linii, a są tysiące takich plików, nie mogę edytować ich HTML. W takim przypadku powinna być opcja 'tidy', aby zachować przestrzenie. BTW, aby odpowiedzieć na twoje pytanie, tak to działa dobrze z   –

+0

Możesz wypróbować tę opcję --add-xml-space tak –

Odpowiedz

1

Ten problem wydaje się być rozwiązany w nowszych wersjach. Używałem wersji od 2003 roku. Po prostu updated tidy on my machine z wersją 2009 i z tym wyjście jest jak poniżej.

content: word<i><span> <span>ratti</span></span></i> 
command: tidy file.html 
output: word <i><span><span>ratti</span></span></i> 

Więc to jest zachowanie miejsca teraz, jednak nie usuwa tag span, w każdym razie to wygląda właściwej odpowiedzi na pytanie.

Powiązane problemy