Thorsten-Voice auf Basis der KI Sprachsoftware Piper TTS bietet die volle Bandbreite von hochqualitativer TTS-Sprachausgabe. Egal ob neutrale Betonung, in verschiedenen Emotionen oder auch ganz charmant in Hessisch – mit Thorsten-Voice und Piper TTS ist das alles möglich.
Schauen statt Lesen funktioniert hier ebenfalls mit der Anleitung auf meinem Thorsten-Voice Youtube Kanal.
Die Installation funktioniert für Microsoft Windows, Apple Mac OS X, Linux und Raspberry Pi nahezu identisch und wird im Folgenden beschrieben.
- Von der Github Seite die aktuelle Piper TTS Version für das gewünschte Betriebssystem herunterladen.
- Das heruntergeladene Archiv in einem beliebigen Verzeichnis entpacken.
Piper TTS kann direkt gestartet werden (unter Linux ist ggf. ein „chmod +x piper“) notwendig – eine Installation ist nach dem Entpacken nicht notwendig.
Neutrale Sprachausgabe
funktioniert im Anschluss mit folgenden Schritten:
- Die neutralen Thorsten-Voice TTS Dateien herunterladen (Modell und Konfiguration) und beide Dateien in einem gemeinsamen Verzeichnis abspeichern.
- Folgendes Kommando in einer Befehlszeile (Windows) oder Terminal (Mac / Linux / Raspberry) ausführen.
echo "Hier den neutralen Text schreiben." | ./piper -m ./de_DE-thorsten_high.onnx -f ausgabe.wav
Emotionale Sprachausgabe
funktioniert im Anschluss mit folgenden Schritten:
- Die emotionalen Thorsten-Voice TTS Dateien herunterladen (Modell und Konfiguration) und beide Dateien in einem gemeinsamen Verzeichnis abspeichern.
- Folgendes Kommando in einer Befehlszeile (Windows) oder Terminal (Mac / Linux / Raspberry) ausführen.
echo "Hier den emotionalen Text schreiben." | ./piper -m ./de_DE-thorsten_emotional-medium.onnx -f ausgabe.wav --speaker 1
Die Zahl hinter dem Parameter „–speaker“ definiert die Emotion, in welcher der angegebene Text gesprochen und als ausgabe.wav Datei abgespeichert werden soll.
Speaker (Zahl) | Emotion |
---|---|
0 | 😀 Fröhlich |
1 | 😡 Wütend |
2 | 🤢 Angewidert |
3 | 🥴 Betrunken |
4 | 🙂 Neutral |
5 | 🥱 Schläfrig |
6 | 😲 Überrascht |
7 | 🤫 Flüsternd |
Hessische Aussprache
kann man folgendermaßen erreichen.
- Die hessischen Thorsten-Voice TTS Dateien herunterladen (Modell und Konfiguration) und beide Dateien in einem gemeinsamen Verzeichnis abspeichern.
- Folgendes Kommando in einer Befehlszeile (Windows) oder Terminal (Mac / Linux / Raspberry) ausführen.
echo "Hier den hessischen Text babbeln lassen." | ./piper -m ./de_DE-thorsten_hessisch-medium.onnx -f ausgabe.wav