Frage

Sagen Sie bitte CMU Laut Datensatz Eingang nehmen möchten, dass sieht wie folgt aus:

ABERRATION  AE2 B ER0 EY1 SH AH0 N
ABERRATIONAL  AE2 B ER0 EY1 SH AH0 N AH0 L
ABERRATIONS  AE2 B ER0 EY1 SH AH0 N Z
ABERT  AE1 B ER0 T
ABET  AH0 B EH1 T
ABETTED  AH0 B EH1 T IH0 D
ABETTING  AH0 B EH1 T IH0 NG
ABEX  EY1 B EH0 K S
ABEYANCE  AH0 B EY1 AH0 N S

(Das Wort nach links, nach rechts, ist eine Reihe von Phonemen, Schlüssel hier )

Und wollen Sie es als Trainingsdaten für ein Maschinenlernsystem verwenden, die neuen Worte nehmen und erraten, wie sie auf Englisch ausgesprochen werden würde.

Es ist nicht so offensichtlich, zumindest für mich, weil es keine feste Token-Größe der Buchstaben ist das könnte möglich Karte zu einem Phonem. Ich habe das Gefühl, dass etwas mit einer Markow-Kette zu tun, könnte der richtige Weg zu gehen.

Wie würden Sie das tun?

War es hilfreich?

Lösung

Das Problem genannt wird Graphem-Phonem-Umwandlung, ein Teilproblem von Natural Language Processing . Google bringt ein paar Papiere auf.

Andere Tipps

Nicht ganz mein Feld, aber vielleicht ein neuronales Netzwerk mit mehreren Schichten aufbauen -. Frühere Schichten, die die Spaltung der Worte in aufeinanderfolgenden Silben zu erraten, die späteren Schichten der pronounciation der genannten Silben erraten

ein ANFIS-lernenden neuralen Netzwerk einrichten, ist recht unkompliziert numerische Daten, für wörtliche / Laut Daten der Aufgabe mehr Aufträge ist zweifellos komplexer.

Lizenziert unter: CC-BY-SA mit Zuschreibung
Nicht verbunden mit StackOverflow
scroll top