Python이있는 텍스트 Mine PDF 파일?

문제

PDF를 열고 특정 단어를 검색 할 수있는 Python 용 패키지/라이브러리가 있습니까?

해결책

사용 pypdf2 당신이 사용할 수있는 ExtractText () PDF 텍스트를 추출하고 작업하는 방법.

업데이트 : @aditya kumar 덕분에 PYPDF2를 참조하도록 텍스트가 변경되었습니다.

다른 팁

나는 당신이 한 단계로 할 수 있다고 생각하지 않지만, 당신은 확실히 PDF에서 텍스트를 얻을 수 있습니다. PDFMINER. 그런 다음 복구 된 데이터에 어떤 텍스트 검색을 적용 할 수 있습니다.

라이센스 : CC-BY-SA ~와 함께 속성

제휴하지 않습니다 StackOverflow