使用Python pdfMiner每页提取文本?

前端之家收集整理的这篇文章主要介绍了使用Python pdfMiner每页提取文本?前端之家小编觉得挺不错的,现在分享给大家,也给大家做个参考。
我已经尝试了pyPdf和pdfMiner来从pdf文件提取文本.我有一些不友好的pdf,只有pdfMiner才能成功提取.我使用代码 here提取整个文件的文本.但是,我真的想在每页上提取文本,如pyPdf中的getPage(i).extractText()功能.有谁知道如何使用pdfMiner提取每页文本?

解决方法

for pageNumber,page in enumerate(PDFDocument.get_pages()):
    if pageNumber == 42:
        #do something with the page

有一篇非常好的文章here.

猜你在找的Python相关文章