Dot Net: i necesidad de analizar el archivo PDF para obtener cada artículo con el título?

https://stackoverflow.com/questions/1058208

.net
pdf
parsing
title
ifilter

21-08-2019
|

Pregunta

quiero analizar el archivo pdf de tal manera que yo pueda identificar el título de cada artículo y su description.so que puedo almacenar el texto del título y DescriptionText en caché para la búsqueda purpose.is Hay alguna biblioteca o herramienta para esto?

Solución

En primer lugar se puede instalar PDF de Adobe IFilter DLL. A continuación, puede leer las propiedades de cualquier archivo .pdf utilizando esta biblioteca (usando IFilter Cía#). O, alternativamente, también se puede mirar en esta biblioteca (La implementación de un TextReader para extraer diversos archivos contenidos utilizando IFilter).

Licenciado bajo: CC-BY-SA con atribución

No afiliado a StackOverflow