python学习笔记(27)——pdfplumber库提取文本及表格内容基础操作

pdfplumber库安装地址:Search results · PyPI
安装后pip安装即可 
1、提取文本:extract_text()解析文本
代码练习:
import pdfplumber#引进pdfplumber库
#print(pdfplumber.__version__)#通过测试证明pdfplumber库安装成功
pdf=pdfplumber.open('F://XX公告.PDF')#打开pdf文件,路径之间符号用//
pages=pdf.pages#通过pages属性获取所有页的信息,此时pages是一个列表
text_all=[]#创建一个空列表
for page in pages:#遍历所有页的数据
text = page.extract_text() # 用extract_text函数获取当前页的文本内容
text_all.append(text)#把遍历的数据加到text_all列表中
text_all=''.join(text_all)#把text_all的列表转化成字符串
print(t

python学习笔记(27)——pdfplumber库提取文本及表格内容基础操作最先出现在Python成神之路

版权声明:
作者:倾城
链接:https://www.techfm.club/p/20540.html
来源:TechFM
文章版权归作者所有,未经允许请勿转载。

THE END
分享
二维码
< <上一篇
下一篇>>