Python이있는 텍스트 Mine PDF 파일?
-
16-09-2019 - |
문제
PDF를 열고 특정 단어를 검색 할 수있는 Python 용 패키지/라이브러리가 있습니까?
해결책
사용 pypdf2 당신이 사용할 수있는 ExtractText () PDF 텍스트를 추출하고 작업하는 방법.
업데이트 : @aditya kumar 덕분에 PYPDF2를 참조하도록 텍스트가 변경되었습니다.
다른 팁
나는 당신이 한 단계로 할 수 있다고 생각하지 않지만, 당신은 확실히 PDF에서 텍스트를 얻을 수 있습니다. PDFMINER. 그런 다음 복구 된 데이터에 어떤 텍스트 검색을 적용 할 수 있습니다.
제휴하지 않습니다 StackOverflow