2010-11-19 12 views
9

Używam pisa, która jest biblioteką konwersji HTML na PDF dla Pythona.konwerter html na .doc w języku Python?

Czy istnieje taki sam dokument Word: biblioteka HTML do konwersji .doc dla Pythona?

+0

Dlaczego chcesz tego? MS Word może czytać HTML. – MSalters

+0

Mam ten sam problem: Mam html, który wykorzystuje pisa do konwersji do formatu pdf i chcę zrobić to samo ze słowem. jest to duży dokument, ~ 20 stron, używający tego samego kawałka kodu do generowania html, a następnie eksportowania poprzez pisa lub coś innego byłoby świetne. –

+0

@Eric: Ostatnio miałem ten sam problem. Zastanawiasz się, czy znalazłeś rozwiązanie do konwersji HTML do Worda .docx? Dzięki. –

Odpowiedz

3

Choć nie jestem świadomy bezpośredniego modułu, który może pozwolić na konwersję tego jednak:

  1. Można konwertować HTML do zwykły tekst pierwszym użyciu modułu html2text.
  2. Następnie można użyć tego modułu python-docx, aby przekonwertować tekst na plik doc lub docx.
9

Można użyć Win32com z rozszerzeń Pythona pywin32 dla Windows, aby MS Word przekonwertować go dla Ciebie. Prosty przykład:

import win32com.client 

word = win32com.client.Dispatch('Word.Application') 

doc = word.Documents.Add('example.html') 
doc.SaveAs('example.doc', FileFormat=0) 
doc.Close() 

word.Quit()