Question

Y at-il un paquet / bibliothèque python qui me permettrait d'ouvrir un fichier PDF, et rechercher le texte de certains mots?

Était-ce utile?

La solution

Utilisation PyPdf2 vous pouvez utiliser extractText () méthode pour extraire le texte pdf et y travailler.

Mise à jour:. Texte modifié pour faire référence à PyPdf2, grâce à @Aditya Kumar pour heads-up

Autres conseils

Je ne pense pas que vous pouvez le faire en une seule étape, mais vous pouvez certainement obtenir le texte d'un pdf avec pdfminer . Ensuite, vous pouvez appliquer ce que le texte de recherche que les données récupérées.

Licencié sous: CC-BY-SA avec attribution
Non affilié à StackOverflow
scroll top