Pregunta

Estoy usando Tika Parser para indexar mis archivos en Solr. Creé mi propio analizador (que extiende XMLParser). Utiliza mi propio Mimetype. Creé un archivo jar que dentro se ve así:

src
|-main
    |-some_packages
        |-MyParser.java
    |resources
        |-META-INF
            |-services
                |-org.apache.tika.parser.Parser (which contains a line:some_packages.MyParser.java)
        |_org
            |-apache
                |-tika
                    |-mime
                        |-custom-mimetypes.xml 

En los mimetipos personalizados, pongo la definición de nuevo mimetipo porque mis archivos XML tienen algunas etiquetas especiales.

Ahora, ¿dónde está el problema? He estado probando análisis e indexación con Solr en peces de vidrio instalado en mi máquina local. Funcionó bien. Luego quería instalarlo en algún servidor remoto. Hay la misma versión de Glassfish instalada (3.1.1). Copié la aplicación Solr, es directorio de inicio con todas las bibliotecas (incluidos los frascos de tika y el frasco con mi analizador personalizado). Lamentablemente no funciona. Después de publicar archivos en Solr, puedo ver en el campo de tipo contenido que detectó mi tipo de MIME personalizado. Pero no hay campos que se suponan que estarán allí como si la clase MyParser nunca se haya ejecutado. Los únicos campos que obtengo son los de Dublin Core. Revisé (simplemente agregando algunas líneas de impresión) que Tika solo está usando XMLParser. ¿Alguien ha tenido un problema similar? ¿Cómo manejar esto?

No hay solución correcta

Licenciado bajo: CC-BY-SA con atribución
No afiliado a StackOverflow
scroll top