Próbuję znaleźć sposób, aby wziąć syntezator mowy i nagrać go do pliku audio. Obecnie używam pyttsx jako mojej biblioteki do zamiany tekstu na mowę, ale nie ma mechanizmu zapisywania danych wyjściowych do pliku, a jedynie odtwarzania bezpośrednio z głośników. Zajrzałem do detecting and recording audio oraz PyAudio, ale wydaje się, że pobierają one dane z mikrofonu, a nie przekierowują dźwięk wychodzący do pliku. Czy istnieje znany sposób na zrobienie tego?Nagrywanie zsyntetyzowanego zamiany tekstu na mowę w pliku w języku Python
7
A
Odpowiedz
4
Można wywołać espeak z argumentem -w przy użyciu subprocess.
import subprocess
def textToWav(text,file_name):
subprocess.call(["espeak", "-w"+file_name+".wav", text])
textToWav('hello world','hello')
Spowoduje to zapis file_name.wav bez czytania na głos. Jeśli twój tekst znajduje się w pliku (na przykład text.txt), musisz zadzwonić espeak z parametrem -f ("-f" + tekst). Zalecam przeczytanie espeak man pages, aby zobaczyć wszystkie dostępne opcje.
Mam nadzieję, że to pomoże.
1
Możesz użyć bardziej zaawansowanego opakowania SAPI do zapisania danych wyjściowych do pliku wav. Na przykład można spróbować
https://github.com/DeepHorizons/tts
Kod powinien wyglądać następująco:
import tts.sapi
voice = tts.sapi.Sapi()
voice.set_voice("Joey")
voice.create_recording('hello.wav', "Hello")
2
Oto przykład, który daje dostęp do API NSSpeechSynthesizer
#!/usr/bin/env python
from AppKit import NSSpeechSynthesizer
import sys
import Foundation
if len(sys.argv) < 2:
text = raw_input('type text to speak> ')
else:
text = sys.argv[1]
nssp = NSSpeechSynthesizer
ve = nssp.alloc().init()
ve.setRate_(100)
url = Foundation.NSURL.fileURLWithPath_('yourpath/test.aiff')
ve.startSpeakingString_toURL_(text,url)
Powiązane problemy
- 1. Uzyskiwanie ustawień regionalnych dla zamiany tekstu na mowę (TTS)
- 2. Interfejs API Chrome do zamiany tekstu na mowę nie działa
- 3. Wykrywanie i nagrywanie dźwięku w języku Python
- 4. Jak wyświetlić ustawienia dla zamiany tekstu na mowę w mojej aplikacji?
- 5. Problem z isSpeaking() podczas korzystania z funkcji zamiany tekstu na mowę w systemie Android
- 6. Czy istnieje oprogramowanie do zamiany tekstu na mowę, które akceptuje transkrypcję fonetyczną opartą na IPA?
- 7. C# Zapisywanie tekstu na mowę do pliku MP3
- 8. Jak zapisać zamiany tekstu na mowę jako wav z Microsoft SAPI?
- 9. Nagrywanie dźwięku wyjściowego w python
- 10. Windows 8 mowy do tekstu i tekstu na mowę API
- 11. Czy można "HTML na mowę", podobnie jak "Tekst na mowę"?
- 12. Jak zatrzymać przekazywanie tekstu na mowę, gdy mówi głosowo, lub odwrotnie w Swift?
- 13. LEP - zamiany tekstu z okrężnicy
- 14. Jak zapisać plik konwersji tekstu na mowę w formacie .wav/.mp3 w języku arabskim w pamięci zewnętrznej?
- 15. Przekierowanie pliku Ouput w języku Python
- 16. Dekodowanie tekstu w systemie Mac OS w języku Python
- 17. Jak programowo używać syntezatorów głosu iOS? (Tekst na mowę)
- 18. Uzyskaj nazwę folderu pliku w języku Python
- 19. Odczytywanie pliku MIDI w języku Python
- 20. Jak ustawić głośność dla metody "wypowiadania" tekstu na mowę?
- 21. Wysokiej jakości zestaw do konwersji tekstu na mowę dla iOS
- 22. Drukowanie pliku na drukarce w języku Ruby
- 23. Nagrywanie dźwięku nie do pliku na Androidzie
- 24. Tworzenie skryptów w języku Python na MAMP
- 25. Skrypty w języku Python: GUI?
- 26. Tekst na mowę w obiektywnym iPhone'ie
- 27. Nagrywanie wideo w okrągłym buforze na Androida
- 28. Parsowanie XML w języku Python z regex
- 29. Wątki w języku Python
- 30. Jak wyodrębnić tekst z pliku PDF w języku Python?
niesamowite, że zrobił sztuczka! Dzięki! – petrichor