Oft klingen künstliche TTS oder Text-to-Speech Stimmen sehr neutral und nüchtern. Wie wäre es mit etwas Abwechslung von den monotonen künstlichen Stimmen?
Dafür gibt es die Thorsten-Voice Stimmen in verschiedenen Emotionen.
Pro Tipp: Gerade für Live-Streamer die sich beim Voice-Over von der Masse abheben wollen!
Einrichtung
Die Nutzung meiner emotionalen Stimmen geht ganz einfach – und sogar ohne Installation.
- Runterladen von Piper TTS für das jeweilige Betriebssystem (Link) und in einem Verzeichnis nach Wahl entpacken
- Meine emotionale Stimm-Modell und Konfigurationsdatei (.onnx und .json) von Huggingface herunterladen (Link) und im gleichen Verzeichnis wie Piper ablegen.
- Eine Kommandozeile (CMD, Powershell, Terminal) im entsprechenden Verzeichnis öffnen und folgendes Kommando ausführen:
echo "Hier den emotionalen Text schreiben." | ./piper -m ./de_DE-thorsten_emotional-medium.onnx -f ausgabe.wav --speaker 1
Die Zahl hinter dem Parameter „speaker“ definiert die zu nutzende Emotion. Hierbei gilt 1 (Glücklich), 2 (), …
TTS ohne Emotionen
Natürlich kannst Du meine Stimme auch in neutraler Betonung bekommen. Hier gibt es mehr Details dazu.
Es gibt auch eine freie deutsche TTS-Stimme mit (Süd)hessischem Akzent. Mehr Infos findest du auf meiner „Guude!“ Seite.