Mam kilka plików .tex, z których chcę otrzymać zwykły tekst bez żadnych tagów lateksowych, takich jak \ sekcja {...} lub \ newpage.
Czy ktoś ma pojęcie, jak to osiągnąć? Mam również plik .pdf, ale kiedy po prostu skopiuj kod stamtąd, niektóre słowa się łączą, co jest naprawdę złe.
Czy znasz jakieś narzędzie?wyodrębnij tekst z tex, usuń tagi latexowe
Odpowiedz
proszę zobaczyć OpenDetex GitHub page do najnowszej wersji OpenDetex. Jest to bardziej nowoczesna, pochodna wersja mojego oryginalnego DeTeXa.
Moje dziedzictwo DeTeX home page jest dostępne here.
Jeśli chcesz tylko starszego źródła detex-2.8.tar, możesz uzyskać je here.
opendetex jest dostępny zarówno dla Windows i Linux
ściągnięciu opendetex Program stąd
http://opendetex.googlecode.com/files/opendetex-2.8.1.tar.bz2
http://code.google.com/p/opendetex/downloads/list
Zastosowanie: http://code.google.com/p/opendetex/wiki/Usage
rozpakować go do dowolnego katalogu do wyboru . Powiedz, że wypakowujesz go do katalogu Downloads.
utworzyć inny katalog o dowolnej nazwie (opcjonalnie, ale jest dobry, jeśli u tworzysz). nazwa katalogu to "my_paper". Umieść swój papier w katalogu "my_paper". powiedzieć swoje imię papier jest project.tex
Przejdź przez ścieżkę
cd ~/Downloads/opendetex
uruchomić polecenie
detex -n my_paper/project.tex > out.txt
ogólnej formie
detex -n full_path_to_tex_file.tex > output_text_file.txt
- 1. Wyodrębnij tekst z pliku PDF
- 2. Usuń tagi HTML z ciągiem javascript
- 3. Usuń tekst z jQuery
- 4. Wyodrębnij tekst z e-maila PHP
- 5. Sprostowanie ruby: wyodrębnij tekst z cudzysłowów
- 6. Wyodrębnij tekst po określonym znaku
- 7. Korzystanie BeautifulSoup wyodrębnić tekst bez Tagi
- 8. Regex: C# wyodrębnij tekst w podwójnych cudzysłowach
- 9. Sublime tekst 2: wybierz tagi z wszystkich treści w nim
- 10. Wyodrębnij tekst i obrazy z pliku PDF za pomocą iText5
- 11. Renderowanie latexowe w README.md na Githubie
- 12. Usuń wszystkie style, skrypty i tagi HTML stronie html
- 13. warunkowe tagi z haml
- 14. Wyodrębnij wszystko z pliku PDF
- 15. TeX na iPadzie kompatybilny z polityką Apple?
- 16. Problemy z uruchomieniem epstopdf. Sprawdzić instalację TeX
- 17. Wyodrębnij emotikony z tekstu
- 18. Wyodrębnij dźwięk z fla
- 19. Wyodrębnij tekst na stronie za pomocą Python pdfMiner?
- 20. Wyodrębnij tekst przy użyciu kolumn PdfMiner i PyPDF2 Scalanie
- 21. Wysublimowany tekst usuń python nową usługę autouzupełnianie
- 22. Usuń cały poprzedni tekst przed zapisaniem
- 23. Regex + Usuń cały tekst przed meczem
- 24. Korzystanie bezkształtne tagi z LabelledGenerics
- 25. Pobierz wszystkie tagi z taggit
- 26. Usuń cały tekst przekroju z wykresu kołowego (ios-charts/mpandroidchart).
- 27. format HTML tagi ignorowane Dialog
- 28. Wyodrębnij AST z bloku Ruby
- 29. Wyodrębnij standardowe błędy z glm
- 30. Wyodrębnij plik z ciągu ZIP
Jesteś mile widziany! –
Działa tylko w plikach tex ASCII. Jeśli używasz plików tex xelatex i UTF-8 z znakami spoza ASCII, detex wypisuje śmieci dla znaków spoza ASCII. – Lucas
Jest open source, zawsze można go naprawić. –