Criptografía. Inglés “texto normal”?
-
08-10-2019 - |
Pregunta
Me pidieron hacer un software que va a cifrar y descifrar un texto "normal Inglés", basada en la letra frecuencias .
La pregunta es ¿dónde puedo encontrar algunos ejemplos de texto en donde las frecuencias oficiales coincidirán?
Hasta ahora, he tratado "Guerra y Paz" por Lev Tolstoi , que no funcionaba bien ..
LE: No necesito sólo una lista de palabras, necesito una muestra de texto para hacer algún tipo de procesamiento
.
LE2:. El objetivo es adivinar 20 de 26 en un 2000 caracteres de texto largo
Solución
Esta es la página de Inglés corpus , por ejemplo, http://faculty.washington.edu/ebender/corpora/corpora.html#modern . Fuera de lo que aparece allí, sé que el Proyecto Gutenberg es libre; muchos de los otros puede no serlo.
No estoy seguro de lo que quiere decir con las frecuencias oficiales - el punto de las frecuencias es para que coincida con lo que se encuentra en la naturaleza, y si no lo hacen, que es el problema de la tabla de frecuencias
.Otros consejos
Infochimps ; que tienen un grupo de conjuntos de datos libremente disponibles que pueden ser útiles.
Trate de esta lista de palabras en inglés:
http://www.openbsd.org/cgi-bin / cvsweb / src / share / dict /