python-PyPDF2

python-PyPDF2作用:处理PDF文档提取文本,旋转页面,叠加页面1.pdfFileObj=open(‘meetingminutes.pdf’,’rb’)#打开pdf文档2.pdfReader=PyPDF2.PdfFileReader(pdfFileObj)#获取pdf文档数据3.pdfReader.numPages#获取页数4.pageObj=pdfReader.getPage(0)#获取指定页码的内…

大家好,又见面了,我是你们的朋友全栈君。

作用:处理PDF文档

提取文本,旋转页面,叠加页面

1.pdfFileObj = open(‘meetingminutes.pdf’,’rb’)#打开pdf文档

2.pdfReader = PyPDF2.PdfFileReader(pdfFileObj)#获取pdf文档数据

3.pdfReader.numPages#获取页数

4.pageObj = pdfReader.getPage(0)#获取指定页码的内容,从0开始

5.pageObj.extractText()#返回该页文本的字符串 注:难以做到全部提取

6.pageObj.rotateClockwise(90)#旋转页面。只能旋转90*x度

7.pageObj.mergePage(pdfReader.getPage(1))#将两页重叠

  

  

解密

1.pdfReader.isEncrypted#判断文档是否加密

2.pdfReader.decrypt(‘rosebud’)#对加密的文档进行解密

加密

1.pdfwriter = PyPDF2.PdfFileWriter()#新建PdfFileWriter对象

    pdfwriter.encrypt(‘sdsd’)#加密

新建

1.无法世界添加内容,只能从其他pdf文档中拷贝过来加入

eg:

import PyPDF2

pdfFile = open(‘meetingminutes.pdf’,’rb’)#打开一个现有的文档

pdfReader = PyPDF2.PdfFileReader(pdfFile)#获取内容

pdfwriter = PyPDF2.PdfFileWriter()#新建PdfFileWriter对象

for pageNum in range(pdfReader.numPages):#向PdfFileWriter对象中添加内容

    pageObj = pdfReader.getPage(pageNum)

    pdfwriter.addPage(pageObj)

pdfOutputFile = open(‘newFile.pdf’,’wb’)#新建一个pdf文档

pdfwriter.write(pdfOutputFile)#向文档中写入内容

pdfOutputFile.close()

注:所有的修改操作均无法再原文件上操作,只能将修改结果写入新文件中

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 举报,一经查实,本站将立刻删除。

发布者:全栈程序员-用户IM,转载请注明出处:https://javaforall.cn/152397.html原文链接:https://javaforall.cn

【正版授权,激活自己账号】: Jetbrains全家桶Ide使用,1年售后保障,每天仅需1毛

【官方授权 正版激活】: 官方授权 正版激活 支持Jetbrains家族下所有IDE 使用个人JB账号...

(0)


相关推荐

  • 大数据概况及Hadoop生态系统总结

    大数据概况及Hadoop生态系统总结觉得有帮助的,请多多支持博主,点赞关注哦~文章目录大数据概况及Hadoop生态系统1、大数据概念理解1.1、什么是大数据?1.2、大数据特征(4V)?1.3、大数据应用场景?1.4、大数据部门业务流程分析?1.5、大数据部门组织结构?1.6、数据仓库与数据库的区别?2、职业简介2.1、大数据工程师2.1.1、简介2.1.2、职责2.1.3、所需技能2.1.4、工作方向2.2、大数据分析师2.2….

  • Android telephony_android获取真实时间

    Android telephony_android获取真实时间做一波获取手机卡LET的信息操作。看了一波源码写出来的一些东西首先需要的一些权限(危险权限动态获取一下,之前的里面有):<uses-permissionandroid:name=”android.permission.INTERNET”/><uses-permissionandroid:name=”android.permission.ACCESS_WIFI_ST…

  • python机器学习手写算法系列——线性回归「建议收藏」

    python机器学习手写算法系列——线性回归「建议收藏」本文致力于手把手教你实现一个最简单的机器学习模型–一元线性回归模型。短短的14行代码,就实现了。希望读完以后,你也能自己实现它。并对线性回归有更好的了解,或者从不了解到了解。

  • PHP判断点是否在多边形区域内外

    PHP判断点是否在多边形区域内外

  • 安卓长按复制_Android长按弹出选项框

    安卓长按复制_Android长按弹出选项框android:textIsSelectable=”true”重点写在最前面,只用在textView中加入这个属性就可以满足长按复制了一。网上查了下有两中方式可以实现长按复制粘贴1)使用setTextIsSelectable()方法 代码中直接对TextView使用setTextIsSelectable()方法,将TextView设置成可点按选择的即可. TextViewtv=

  • 用java实现笛卡尔积_Java实现笛卡尔积

    用java实现笛卡尔积_Java实现笛卡尔积publicclassSingleton{privatestaticSingletonintance;privateSingleton(){}publicstaticSingletongetInstance(){/**一开始多线程进来,遇到锁,一个线程进去,是为空,new对象;后续线程进入,不为空,不操作;最后直接返回*对象不为/***笛卡尔积工具类….

发表回复

您的电子邮箱地址不会被公开。

关注全栈程序员社区公众号