JTidy Node.findBody()—如何使用?
题
我正在尝试使用JTidy进行XHTML DOM解析,这似乎是违反直觉的任务。特别是,有一种解析HTML的方法:
Node Tidy.parse(Reader, Writer)
并获得< body />我假设该节点应该使用
Node Node.findBody(TagTable)
我应该在哪里获得该TagTable的实例? (构造函数受到保护,我还没有找到工厂来生产它。)
我使用JTidy 8.0-SNAPSHOT。
解决方案
我发现提取身体的很多更简单的方法:
tidy = new Tidy(); tidy.setXHTML(true); tidy.setPrintBodyOnly(true);
然后在Reader-Writer对上使用整洁。
应该很简单。
其他提示
您可以使用 parseDOM
方法,这将为您提供 org.w3c.dom.Document
:
Document document = Tidy.parseDOM(reader, writer);
Node body = document.getElementsByTagName("body").item(0);
不隶属于 StackOverflow