Maschinelles Lernen Herausforderung: Englisch lernen Aussprache
-
21-08-2019 - |
Frage
Sagen Sie bitte CMU Laut Datensatz Eingang nehmen möchten, dass sieht wie folgt aus:
ABERRATION AE2 B ER0 EY1 SH AH0 N
ABERRATIONAL AE2 B ER0 EY1 SH AH0 N AH0 L
ABERRATIONS AE2 B ER0 EY1 SH AH0 N Z
ABERT AE1 B ER0 T
ABET AH0 B EH1 T
ABETTED AH0 B EH1 T IH0 D
ABETTING AH0 B EH1 T IH0 NG
ABEX EY1 B EH0 K S
ABEYANCE AH0 B EY1 AH0 N S
(Das Wort nach links, nach rechts, ist eine Reihe von Phonemen, Schlüssel hier )
Und wollen Sie es als Trainingsdaten für ein Maschinenlernsystem verwenden, die neuen Worte nehmen und erraten, wie sie auf Englisch ausgesprochen werden würde.
Es ist nicht so offensichtlich, zumindest für mich, weil es keine feste Token-Größe der Buchstaben ist das könnte möglich Karte zu einem Phonem. Ich habe das Gefühl, dass etwas mit einer Markow-Kette zu tun, könnte der richtige Weg zu gehen.
Wie würden Sie das tun?
Lösung
Das Problem genannt wird Graphem-Phonem-Umwandlung, ein Teilproblem von Natural Language Processing . Google bringt ein paar Papiere auf.
Andere Tipps
Nicht ganz mein Feld, aber vielleicht ein neuronales Netzwerk mit mehreren Schichten aufbauen -. Frühere Schichten, die die Spaltung der Worte in aufeinanderfolgenden Silben zu erraten, die späteren Schichten der pronounciation der genannten Silben erraten
ein ANFIS-lernenden neuralen Netzwerk einrichten, ist recht unkompliziert numerische Daten, für wörtliche / Laut Daten der Aufgabe mehr Aufträge ist zweifellos komplexer.