Android에서 HTML을 구문 분석하는 방법은 무엇입니까?
문제
안드로이드에서 잘 형성되지 않은 HTML을 구문 분석하는 방법은 무엇입니까?
XOM과 Tagsoup을 사용하려고했지만 빌더를 만들 때 다음과 같은 오류가 발생합니다.
11-26 20:42:39.294: ERROR/dalvikvm(1298): Could not find method org.apache.xerces.impl.Version.getVersion, referenced from method nu.xom.Builder.
XOM을 사용하려면 XERCES를 설치해야합니까, 아니면 XOM없이 Tagsoup을 사용할 수 있습니까?
해결책
jtidy를 찾을 수 있습니다 (http://jtidy.sourceforge.net/) - 충분히 가벼운 htmltidy의 포트. 요청시 XHTML을 출력합니다
다른 팁
XOM은 Xerces가 클래스 경로에 있어야 할 수도 있습니다. Java 버전에 따라 다를 수 있습니다. 현재 우리는 사용합니다
xercesImpl-2.8.0.jar
제휴하지 않습니다 StackOverflow