Pregunta

Me pidieron hacer un software que va a cifrar y descifrar un texto "normal Inglés", basada en la letra frecuencias .

La pregunta es ¿dónde puedo encontrar algunos ejemplos de texto en donde las frecuencias oficiales coincidirán?

Hasta ahora, he tratado "Guerra y Paz" por Lev Tolstoi , que no funcionaba bien ..

LE: No necesito sólo una lista de palabras, necesito una muestra de texto para hacer algún tipo de procesamiento
. LE2:. El objetivo es adivinar 20 de 26 en un 2000 caracteres de texto largo

¿Fue útil?

Solución

Esta es la página de Inglés corpus , por ejemplo, http://faculty.washington.edu/ebender/corpora/corpora.html#modern . Fuera de lo que aparece allí, sé que el Proyecto Gutenberg es libre; muchos de los otros puede no serlo.

No estoy seguro de lo que quiere decir con las frecuencias oficiales - el punto de las frecuencias es para que coincida con lo que se encuentra en la naturaleza, y si no lo hacen, que es el problema de la tabla de frecuencias

.

Otros consejos

Infochimps ; que tienen un grupo de conjuntos de datos libremente disponibles que pueden ser útiles.

Trate de esta lista de palabras en inglés:

http://www.openbsd.org/cgi-bin / cvsweb / src / share / dict /

Licenciado bajo: CC-BY-SA con atribución
No afiliado a StackOverflow
scroll top