Pregunta

Actualmente estoy teniendo problemas con los valores de la diéresis alemanas en un documento XML que he recibido.

Muestra / guarda el valor como un " ü " en lugar de un " u ".

La codificación XML se define en UTF-8 que debe ser capaz de mostrar diéresis.

Además, no pude encontrar ninguna opción para configurar un escenario en el analizador SAX.

¿Hay alguna otra manera de hacer los valores ahorran correctamente?

BTW: Estoy usando Eclipse como IDE.

Todo tipo de ayuda es muy apreciada!

Gracias de antemano!

¿Fue útil?

Solución

El XML está codificado en UTF-8, pero que están decodificando con la norma ISO-8859-1.

Trate de usar InputStream y otras API -oriented "binario" para XML. Evitar el uso de un Reader, o tratando de convertir de byte[] a un String antes de analizar XML. Es mucho más probable que estropear la codificación de caracteres que el analizador es.

Otros consejos

Configuración de codificación XML a UTF-8 en la declaración XML es la única cosa pero otra cosa es la codificación física del decir documento XML, puede tener un archivo XML que dice <?xml version="1.0" encoding="utf-8"?> pero la misma aún podría estar ANSI codifica archivo (o lo que sea).

Licenciado bajo: CC-BY-SA con atribución
No afiliado a StackOverflow
scroll top