Das Pediaphon ist ein Webdienst von mir, der seit 2006 Wikipedia-Artikel in Sprache umwandelt. Dort werden diverse Open Source TTS Generatoren und Stimmen eingesetzt. Ursprünglich basierte das Pediaphon auf einem EU-projekt namens MBROLA, später kamen TTS-Systeme wie espeak, Milena und SVOX-Pico (2010) hinzu. Moderne Text-to-Speech- (TTS) Verfahren basieren heute auf Neuronalen Netzen (landläufig als KI bezeichnet, bei künstlicher Sprachausgabe handelt es sich aber um sogenannte „schwache KI“), die mit Sprachsamples trainiert werden. Alle der bekannten, in Windows, Android und IOS integrierten kommerziellen TTS-Stimmen nutzen heute solche Techniken. Seit einiger Zeit sind auch Open Source Stimmen entwickelt worden, die auf diesen Techniken beruhen. Meist werden die Sprachmodelle in Python trainiert und auch ausgeführt. Da ich im Pediaphon ganze und teilweise sehr große Wikipedia-Artikel in einem Stück und nicht als Stream in Sprache umwandle, bin ich auf sehr schnelle Algorithmen angewiesen. Weiterlesen
Archiv der Kategorie: podcasting
Audio Lehrmaterial automatisch erzeugt!
Ich habe die Praktikumsanleitung für den PRT Pioneer Roboter nun auch als als Stream, MP3 und auch als Podcast erzeugt! m-Learning bei PRT!
PRT Praktikum Pionieer Roboter, FernUni-Hagen als MP3.
PRT Praktikum Pionieer Roboter, FernUni-Hagen als ASF-Stream.
PRT Praktikum Pioneer Roboter, FernUni-Hagen als WMA-Datei
Es handelt sich um eine Stunde Audio-Material, die Generierung dauert ca. 5 Sekunden.Eingebunden sind diese Dateien in das Lehrmaterial hier. Die Audio-Versionen habe ich automatisch mit einer Text-to-Speech Lösung unter Linux erzeugt (mbrola,txt2pho). Das sollte für die FernUni der Weg sein, um Audio-basiertes Lehrmaterial
zu erzeugen! Einen Sprecher einzusetzen (siehe DVT) ist ein sehr uneffektiver und teurer Weg.