Emotionale künstliche TTS-Stimmen - Klar, mit Thorsten-Voice

Oft klingen künstliche TTS oder Text-to-Speech Stimmen sehr neutral und nüchtern. Wie wäre es mit etwas Abwechslung von den monotonen künstlichen Stimmen?

Dafür gibt es die Thorsten-Voice Stimmen in verschiedenen Emotionen.

Flüsternd

Schläfrig

Angewidert / Eklig

Glücklich / Beschwingt

Betrunken

Wütend / Ärgerlich

Pro Tipp: Gerade für Live-Streamer die sich beim Voice-Over von der Masse abheben wollen!

Einrichtung

Die Nutzung meiner emotionalen Stimmen geht ganz einfach – und sogar ohne Installation.

Runterladen von Piper TTS für das jeweilige Betriebssystem (Link) und in einem Verzeichnis nach Wahl entpacken
Meine emotionale Stimm-Modell und Konfigurationsdatei (.onnx und .json) von Huggingface herunterladen (Link) und im gleichen Verzeichnis wie Piper ablegen.
Eine Kommandozeile (CMD, Powershell, Terminal) im entsprechenden Verzeichnis öffnen und folgendes Kommando ausführen:

echo "Hier den emotionalen Text schreiben." | ./piper -m ./de_DE-thorsten_emotional-medium.onnx -f ausgabe.wav --speaker 1

Die Zahl hinter dem Parameter „speaker“ definiert die zu nutzende Emotion. Hierbei gilt 1 (Glücklich), 2 (), …

TTS ohne Emotionen

Natürlich kannst Du meine Stimme auch in neutraler Betonung bekommen. Hier gibt es mehr Details dazu.

Es gibt auch eine freie deutsche TTS-Stimme mit (Süd)hessischem Akzent. Mehr Infos findest du auf meiner „Guude!“ Seite.