Comment puis-je intégrer Tika dans mon projet Lucene?
-
26-10-2019 - |
Question
Je veux intégrer Apache Tika dans mon projet java. Je dois obtenir un texte à partir de différents formats de fichiers (Excel, doc, ppt, et plus ..) Après un peu de lecture, je comprends que la seule façon de construire tika est en téléchargeant le fichier src et construire avec Maven. J'execute "mvn install" dans le répertoire racine du Tika src (apache-tika-0,9-src), mais je reçois cette erreur:
[INFO] Scanning for projects...
Downloading: http://repo1.maven.org/maven2/org/apache/apache/6/apache-6.pom
[ERROR] The build could not read 1 project -> [Help 1]
[ERROR]
[ERROR] The project org.apache.tika:tika:0.9 (C:\Users\vexler\Documents\Instal
ls\apache-tika-0.9-src\apache-tika-0.9\pom.xml) has 1 error
[ERROR] Non-resolvable parent POM for org.apache.tika:tika-parent:0.9: Could
not transfer artifact org.apache:apache:pom:6 from/to central (http://repo1.mav
en.org/maven2): Error transferring file: Connection timed out: connect and 'pare
nt.relativePath' points at no local POM @ org.apache.tika:tika-parent:0.9, C:\Us
ers\vexler\Documents\Installs\apache-tika-0.9-src\apache-tika-0.9\tika-parent\po
m.xml, line 25, column 11 -> [Help 2]
J'appriciate vraiment d'aide avec cette erreur. Merci :-) Reuth
La solution
En supposant que vous utilisez Maven dans votre projet, alors la vie est beaucoup plus simple
Il suffit d'ajouter quelque chose comme
<dependency>
<groupId>org.apache.tika</groupId>
<artifactId>tika-parsers</artifactId>
<version>0.9</version>
<scope>provided</scope>
</dependency>
Et Maven téléchargera alors Tika et de dépendances pour vous
Sinon, si vous téléchargez la dernière Tika OSGi Pot Bundle (par exemple 0,9 ) et déballer, alors vous obtiendrez les dépendances Tika et le code dans cette