变音在Java中的SAX解析器
-
13-09-2019 - |
题
我目前具有我接收到的XML文档中与德国元音值麻烦。
它显示/保存值作为 “的那张强>”,而不是一个 “的ü强>”。
在XML编码设置为 UTF-8 强>这应该是能够显示元音变音的。
此外,我无法找到任何选项来设置一个区域上的SAX解析器。
有没有其他办法可以让这些值保存是否正确?
顺便说一句:我使用Eclipse作为IDE。
所有帮助是非常感激!
提前感谢!
解决方案
在XML被编码以UTF-8,但是与ISO-8859-1解码它。
尝试使用InputStream
和其他“二进制”取向的API为XML。避免使用Reader
,或试图从byte[]
解析XML之前转换为String
。你更容易弄乱的字符编码比解析器。
其他提示
设置XML编码设置为UTF-8 XML声明是一回事,但另一件事是XML文档,即物理编码,你可以有一个XML文件,上面写着<?xml version="1.0" encoding="utf-8"?>
但文件本身仍可能ANSI编码(或无论)。
不隶属于 StackOverflow