如何在android中解析(格式不正确)HTML?
题
如何在android中解析格式不正确的HTML?
我尝试使用XOM和TagSoup,但在创建Builder时出现以下错误:
11-26 20:42:39.294: ERROR/dalvikvm(1298): Could not find method org.apache.xerces.impl.Version.getVersion, referenced from method nu.xom.Builder.
我必须安装Xerces才能使用XOM,或者我可以使用不带XOM的tagsoup吗?
解决方案
你可能会发现JTidy( http://jtidy.sourceforge.net/ ) - 一个端口HTMLTidy足够轻量级。它根据请求输出XHTML
其他提示
XOM可能要求Xerces位于类路径中 - 它可能取决于Java的版本。目前我们使用
xercesImpl-2.8.0.jar
不隶属于 StackOverflow