Deutsche AI TTS-Stimme kostenlos in hoher Qualität ohne Cloud

Thorsten-Voice auf Basis der KI Sprachsoftware Piper TTS bietet die volle Bandbreite von hochqualitativer TTS-Sprachausgabe. Egal ob neutrale Betonung, in verschiedenen Emotionen oder auch ganz charmant in Hessisch – mit Thorsten-Voice und Piper TTS ist das alles möglich.

Schauen statt Lesen funktioniert hier ebenfalls mit der Anleitung auf meinem Thorsten-Voice Youtube Kanal.

Thorsten-Voice unter Linux.

Die Installation funktioniert für Microsoft Windows, Apple Mac OS X, Linux und Raspberry Pi nahezu identisch und wird im Folgenden beschrieben.

Von der Github Seite die aktuelle Piper TTS Version für das gewünschte Betriebssystem herunterladen.
Das heruntergeladene Archiv in einem beliebigen Verzeichnis entpacken.

Piper TTS kann direkt gestartet werden (unter Linux ist ggf. ein „chmod +x piper“) notwendig – eine Installation ist nach dem Entpacken nicht notwendig.

Neutrale Sprachausgabe

funktioniert im Anschluss mit folgenden Schritten:

Die neutralen Thorsten-Voice TTS Dateien herunterladen (Modell und Konfiguration) und beide Dateien in einem gemeinsamen Verzeichnis abspeichern.
Folgendes Kommando in einer Befehlszeile (Windows) oder Terminal (Mac / Linux / Raspberry) ausführen.

echo "Hier den neutralen Text schreiben." | ./piper -m ./de_DE-thorsten_high.onnx -f ausgabe.wav

Emotionale Sprachausgabe

funktioniert im Anschluss mit folgenden Schritten:

Die emotionalen Thorsten-Voice TTS Dateien herunterladen (Modell und Konfiguration) und beide Dateien in einem gemeinsamen Verzeichnis abspeichern.
Folgendes Kommando in einer Befehlszeile (Windows) oder Terminal (Mac / Linux / Raspberry) ausführen.

echo "Hier den emotionalen Text schreiben." | ./piper -m ./de_DE-thorsten_emotional-medium.onnx -f ausgabe.wav --speaker 1

Die Zahl hinter dem Parameter „–speaker“ definiert die Emotion, in welcher der angegebene Text gesprochen und als ausgabe.wav Datei abgespeichert werden soll.

Speaker (Zahl)	Emotion
0	😀 Fröhlich
1	😡 Wütend
2	🤢 Angewidert
3	🥴 Betrunken
4	🙂 Neutral
5	🥱 Schläfrig
6	😲 Überrascht
7	🤫 Flüsternd

Tabelle für Zuordnung von Sprachemotion zu „speaker“ Parameter.

Hessische Aussprache

kann man folgendermaßen erreichen.

Die hessischen Thorsten-Voice TTS Dateien herunterladen (Modell und Konfiguration) und beide Dateien in einem gemeinsamen Verzeichnis abspeichern.
Folgendes Kommando in einer Befehlszeile (Windows) oder Terminal (Mac / Linux / Raspberry) ausführen.

echo "Hier den hessischen Text babbeln lassen." | ./piper -m ./de_DE-thorsten_hessisch-medium.onnx -f ausgabe.wav