JTidy Node.findBody () & # 8212; ¿Cómo utilizar?
Pregunta
Estoy tratando de hacer XHTML DOM analizando con JTidy, y parece ser una tarea bastante contraintuitiva. En particular, hay un método para analizar HTML:
Node Tidy.parse(Reader, Writer)
Y para obtener < body / > de ese Nodo, supongo, debería usar
Node Node.findBody(TagTable)
¿Dónde debería obtener una instancia de esa TagTable? (El constructor está protegido y no he encontrado una fábrica para producirlo).
Uso JTidy 8.0-SNAPSHOT.
Solución
Encontré que hay mucho método más simple para extraer el cuerpo:
tidy = new Tidy(); tidy.setXHTML(true); tidy.setPrintBodyOnly(true);
Y luego usa tidy en el par Reader-Writer.
Simple como debería ser.
Otros consejos
En su lugar, puede usar el método parseDOM
, que le devolvería un org.w3c.dom.Document
:
Document document = Tidy.parseDOM(reader, writer);
Node body = document.getElementsByTagName("body").item(0);
Licenciado bajo: CC-BY-SA con atribución
No afiliado a StackOverflow