JTidy Node.findBody () - Como usar?
Pergunta
Eu estou tentando fazer XHTML DOM analisar com JTidy, e parece ser tarefa bastante intuitivo. Em particular, não há um método para analisar HTML:
Node Tidy.parse(Reader, Writer)
E para obter o
Node Node.findBody(TagTable)
Onde devo começar uma instância dessa TagTable? (Construtor é protegida, e eu não ter encontrado uma fábrica para produzi-lo.)
Eu uso JTidy 8.0-SNAPSHOT.
Solução
Eu encontrei há muito método mais simples para extrair o corpo:
tidy = new Tidy(); tidy.setXHTML(true); tidy.setPrintBodyOnly(true);
E, em seguida, usar arrumado no par de leitor-gravador.
Simples como deveria ser.
Outras dicas
Você pode usar o método parseDOM
vez, o que lhe daria uma volta org.w3c.dom.Document
:
Document document = Tidy.parseDOM(reader, writer);
Node body = document.getElementsByTagName("body").item(0);
Licenciado em: CC-BY-SA com atribuição
Não afiliado a StackOverflow