Java Sax Parser의 Umlaut
-
13-09-2019 - |
문제
나는 현재받은 XML 문서에서 독일 Umlaut 값에 문제가 있습니다.
값을 "로 표시 / 저장합니다.ü"대신"ü".
XML 인코딩이 설정됩니다 UTF-8 Umlauts를 표시 할 수 있어야합니다.
또한 색소폰 파서에서 로케일을 설정할 옵션을 찾을 수 없었습니다.
값을 올바르게 저장할 수있는 다른 방법이 있습니까?
BTW : Eclipse를 IDE로 사용하고 있습니다.
모든 도움은 대단히 감사합니다!
미리 감사드립니다!
해결책
XML은 UTF-8로 인코딩되지만 ISO-8859-1로 디코딩하고 있습니다.
사용하려고 노력하십시오 InputStream
및 XML에 대한 다른 "이진"-지향 API. a를 사용하지 마십시오 Reader
, 또는 전환하려고합니다 byte[]
a String
XML을 구문 분석하기 전에. 당신은 파서보다 캐릭터 인코딩을 엉망으로 만들 가능성이 훨씬 높습니다.
다른 팁
XML 선언에서 UTF-8로 XML 인코딩 설정은 한 가지이지만 또 다른 것은 XML 문서의 물리 인코딩, 즉 XML 파일을 가질 수 있습니다. <?xml version="1.0" encoding="utf-8"?>
그러나 파일 자체는 여전히 ANSI 인코딩 (또는 무엇이든) 일 수 있습니다.
제휴하지 않습니다 StackOverflow