Hochqualitative deutsche künstliche Sprachausgabe, auch bekannt als Sprachsynthese oder TTS (Text to Speech), also die Umwandlung von Text in Sprache sollte kein Privileg großer Technologiekonzerne sein!
Sprachausgabe sollte kostenlos sein, unter freigiebiger Open-Source Lizenz stehen und ohne Internetanbindung möglich sein um die Privatsphäre zu schützen und auch in Regionen ohne stabilen Internetzugang funktionieren.
Vision von Thorsten-Voice
Eine qualitativ hochwertige, KI basierte (künstliche Intelligenz), deutsche, künstliche TTS/Text-to-Speech Sprachausgabe, die offline erzeugt werden kann, sollte jedem Projekt kostenlos und ohne lizenzrechtliche Einschränkungen (Open-Source) zur Verfügung stehen.
An dieser Vision arbeiten Thorsten Müller und Dominik Kreutz seit Oktober 2019.
Die Stimmen.
Die Stimmen wurden mit künstlicher Intelligenz (KI) und tausenden Stimmaufnahmen von Thorsten Müller trainiert. Die künstlichen Sprachausgabe TTS-Stimmen wurden mit den Programmen Coqui TTS und Piper TTS erzeugt. Alle Thorsten-Voice Stimmen stehen unter freigiebigen Open-Source Lizenzen zur Verfügung. Eine Übersicht der Vor- und Nachteile der TTS-Stimmen ist hier zu finden.
Die Aufnahmen.
Keine KI-Modelle ohne gute Trainingsdaten. Für die künstlichen TTS-Stimmen zur Sprachausgabe habe ich über 30.000 Aufnahmen im Wave Format gemacht. Alle Aufnahmen stehen unter der CC0 Lizenz frei auf Zenodo und Huggingface zur Verfügung. Durch die freigiebige Lizenz eignen sie sich auch sehr für Wissenschaft und Forschung.
Thorsten-Voice auf Youtube.
Als Enthusiast für freie Sprachtechnologien betreibe ich seit einigen Jahren den „Thorsten-Voice“ Kanal auf Youtube. Hier veröffentliche ich regelmäßig Schritt-für-Schritt Anleitungen zu Open-Source Sprachtechnologien, News aus dem Bereich sowie gelegentlich Interviews mit faszinierenden Persönlichkeiten aus dem Bereich der freien Sprachausgabe.
Weitere Informationen
finden sich auf Github und auf dem Wikipedia Schwesterprojekt / Marjorie-wiki. Dort findet sich auch eine Liste von wissenschaftlichen Abhandlungen, welche Thorsten-Voice verwenden.
Gerne freue ich mich auch auf den Austausch mit anderen Enthusiasten aus dem Gebiet der künstlichen Intelligenz (KI) TTS Sprachausgabe über das Kontaktformular.