Thorsten-Voice 💛 Coqui

Thorsten-Voice auf Basis der KI Sprachsoftware Coqui TTS bietet eine hochqualitative neutral gesprochene Sprachausgabe (jedoch keine emotionale oder hessische Betonung).

In den folgenden Absätzen ist die Einrichtung und Nutzung unter den Betriebssystemen Microsoft Windows, Apple Mac OS X und Linux beschrieben.

Für alle Betriebssysteme wird Python in
Version zwischen 3.7 und 3.10, sowie die Software espeak benötigt.

Die Installation gestaltet sich unter Microsoft Windows, Apple Mac OS X und Linux weitestgehend identisch. Daher sind hier die generischen Schritte beschrieben – Betriebssystemspezifische Abweichungen werden gesondert erwähnt.

  1. Einen neuen Ordner auf der Festplatte für Thorsten-Voice anlegen (Name ist frei wählbar).
  2. Kommandozeile (Windows cmd / Powershell), bzw. Terminal (Mac und Linux) öffnen und in neu angelegten Ordner wechseln.
  3. Optional: Python Version überprüfen
    „python3 -V“ (muss zwischen 3.7 und 3.10 liegen)
  4. Eine virtuelle Python Umgebung erzeugen:
    „python3 -m venv venv“
  5. Die virtuelle Umgebung aktivieren
    „source ./venv/bin/activate“ (Mac / Linux) oder „.\venv\bin\activate.bat“ (Windows)
  6. Coqui TTS installieren
    „pip install -U pip setuptools wheel tts“

Damit ist Coqui TTS installiert und die Thorsten-Voice TTS-Stimme kann per Sprachausgabe verwendet werden.

Verwendung per grafischer Oberfläche. Coqui TTS bietet die Möglichkeit einen lokalen Serverprozess zu starten, welcher eine simple Oberflächennutzung per Webbrowser ermöglicht.

Dazu muss nach den oben durchgeführten Installationsschritten lediglich der folgende Befehl ausgeführt werden. Danach steht die Oberfläche per Internetbrowser unter der URL „http://localhost:5002“ zur Verfügung.

tts-server –model_name tts_models/de/thorsten/ddc
Coqui TTS Server Webfrontend
Lokale Coqui TTS Webanwendung mit Thorsten-Voice auf Port 5002.

Die Verwendung per Kommandozeile ist natürlich auch möglich. Das bietet sich an, wenn die Sprachausgabe in andere Abläufe integriert werden soll.

Dazu nach den oben genannten Installationsschritten folgendes Kommando in die Befehlszeile / Terminal eingeben:

tts --model_name tts_models/de/thorsten/tacotron2-DDC --out_path output.wav --text "Das ist ein Test."

Schritt-für-Schritt Video Anleitungen gibt es ebenfalls auf meinem Thorsten-Voice Youtube Kanal.

Thorsten-Voice unter Microsoft Windows
Thorsten-Voice unter Apple Mac OS X mit Coqui TTS.
Thorsten-Voice unter Linux mit Coqui TTS.
This is default text for notification bar