大家好,又见面了,我是你们的朋友全栈君。
作用:处理PDF文档
提取文本,旋转页面,叠加页面
1.pdfFileObj = open(‘meetingminutes.pdf’,’rb’)#打开pdf文档
2.pdfReader = PyPDF2.PdfFileReader(pdfFileObj)#获取pdf文档数据
3.pdfReader.numPages#获取页数
4.pageObj = pdfReader.getPage(0)#获取指定页码的内容,从0开始
5.pageObj.extractText()#返回该页文本的字符串 注:难以做到全部提取
6.pageObj.rotateClockwise(90)#旋转页面。只能旋转90*x度
7.pageObj.mergePage(pdfReader.getPage(1))#将两页重叠
解密
1.pdfReader.isEncrypted#判断文档是否加密
2.pdfReader.decrypt(‘rosebud’)#对加密的文档进行解密
加密
1.pdfwriter = PyPDF2.PdfFileWriter()#新建PdfFileWriter对象
pdfwriter.encrypt(‘sdsd’)#加密
新建
1.无法世界添加内容,只能从其他pdf文档中拷贝过来加入
eg:
import PyPDF2
pdfFile = open(‘meetingminutes.pdf’,’rb’)#打开一个现有的文档
pdfReader = PyPDF2.PdfFileReader(pdfFile)#获取内容
pdfwriter = PyPDF2.PdfFileWriter()#新建PdfFileWriter对象
for pageNum in range(pdfReader.numPages):#向PdfFileWriter对象中添加内容
pageObj = pdfReader.getPage(pageNum)
pdfwriter.addPage(pageObj)
pdfOutputFile = open(‘newFile.pdf’,’wb’)#新建一个pdf文档
pdfwriter.write(pdfOutputFile)#向文档中写入内容
pdfOutputFile.close()
注:所有的修改操作均无法再原文件上操作,只能将修改结果写入新文件中
发布者:全栈程序员-用户IM,转载请注明出处:https://javaforall.cn/152397.html原文链接:https://javaforall.cn
【正版授权,激活自己账号】: Jetbrains全家桶Ide使用,1年售后保障,每天仅需1毛
【官方授权 正版激活】: 官方授权 正版激活 支持Jetbrains家族下所有IDE 使用个人JB账号...