text-moi des fichiers PDF avec Python?
-
16-09-2019 - |
Question
Y at-il un paquet / bibliothèque python qui me permettrait d'ouvrir un fichier PDF, et rechercher le texte de certains mots?
La solution
Utilisation PyPdf2 vous pouvez utiliser extractText () méthode pour extraire le texte pdf et y travailler.
Mise à jour:. Texte modifié pour faire référence à PyPdf2, grâce à @Aditya Kumar pour heads-up
Autres conseils
Je ne pense pas que vous pouvez le faire en une seule étape, mais vous pouvez certainement obtenir le texte d'un pdf avec pdfminer . Ensuite, vous pouvez appliquer ce que le texte de recherche que les données récupérées.
Licencié sous: CC-BY-SA avec attribution
Non affilié à StackOverflow