代码来源:python处理PDF-通过关键词定位-截取PDF中的图表
最近需要对pdf做一些处理,在这篇文章的基础上进行了修改。
运行时出现一些报错:
AttributeError: ‘Matrix’ object has no attribute ‘preRotate’
AttributeError: ‘Page’ object has no attribute ‘getPixmap’
AttributeError: ‘Pixmap’ object has no attribute ‘writePNG’
调通要点:
1.先pip install fitz,后pip install pymupdf。
2.
trans = fitz.Matrix(zoom, zoom).preRotate(rotate)
pm = doc.getPixmap