Dot Net: i necesidad de analizar el archivo PDF para obtener cada artículo con el título?

StackOverflow https://stackoverflow.com/questions/1058208

Pregunta

quiero analizar el archivo pdf de tal manera que yo pueda identificar el título de cada artículo y su description.so que puedo almacenar el texto del título y DescriptionText en caché para la búsqueda purpose.is Hay alguna biblioteca o herramienta para esto?

¿Fue útil?

Solución

En primer lugar se puede instalar PDF de Adobe IFilter DLL. A continuación, puede leer las propiedades de cualquier archivo .pdf utilizando esta biblioteca (usando IFilter Cía#). O, alternativamente, también se puede mirar en esta biblioteca (La implementación de un TextReader para extraer diversos archivos contenidos utilizando IFilter).

Licenciado bajo: CC-BY-SA con atribución
No afiliado a StackOverflow
scroll top