Pergunta

Olhando para desenvolver aplicativo do lado do servidor que irá processar documentos. Os documentos originais são principalmente MS-Word 2003, 2007, ou seja, a versão MS de Docx. Quer a aplicação de servidor para ser capaz de rodar em Linux ou Windows. Querendo saber o que é a melhor ferramenta ou biblioteca para ler e escrever arquivos do MS-Word no linux. A compatibilidade é a consideração mais importante. Deve preservar documento de origem formatação incluindo tabelas.

Eu vi uma espécie de post semelhante aqui mas era específico para python. Não me importa o que língua ou bibliotecas são usadas, desde que eles estão disponíveis para Windows e Linux.
não deve requer MS-Word para ler os arquivos do Word.
Estou ciente do Open Office, mas estou procurando uma solução que tem um alto grau de compatibilidade com arquivos do MS-Word. Também só deparei com esta solução, que parece promissor. . com Alguém já teve alguma experiência com Aspose.Words para Java ou pacotes 3rd party semelhantes? Parece promissor, mas é caro em mais de US $ 2K por uma assinatura OEM. Dito isto, se ele oferece como anunciado ainda pode ser a melhor solução para fora lá.

graças Houve algumas sugestões, mas nada até agora que se encaixa no projeto (ou orçamento).

Foi útil?

Solução

Você já pensou em usar b2xtranslator para converter .doc binário para .docx. (No Linux, você tem que executá-lo em mono)

Você pode então usar POI ou docx4j para manipular o docx. Não uma solução se você precisa salvar como .doc embora (a menos que você use OO para esse bit)

Outras dicas

Ok, eu vou ter outra chance em uma resposta; -)

Que tal usar unaconv

Pode converter todo o OpenOffice documento pode ler a qualquer documento OpenOffice pode escrever. Você deve ser capaz de usar isso para converter tanto para / de documentos MS-Word (desde que não está excessivamente complicado que eu encontrei escritório aberto não consegue lidar muito bem).

A única ressalva é que você precisa ter uma instância do OpenOffice em execução no servidor linux para unoconv para interagir com.

Mono adquiriu recentemente o suporte para a classe .net System.IO.Packaging, que permite algum grau de manipulação de arquivos docx. Se o tipo de coisa que você quer fazer é adicionar / remover e recursos recurse sobre o texto, é provavelmente a coisa certa.

Licenciado em: CC-BY-SA com atribuição
Não afiliado a StackOverflow
scroll top