python学习笔记（27）——pdfplumber库提取文本及表格内容基础操作

倾城 • 2022-02-13 17:00 • 好物分享

pdfplumber库安装地址：Search results · PyPI
安装后pip安装即可
1、提取文本：extract_text()解析文本
代码练习：
import pdfplumber#引进pdfplumber库
#print(pdfplumber.__version__)#通过测试证明pdfplumber库安装成功
pdf=pdfplumber.open('F://XX公告.PDF')#打开pdf文件，路径之间符号用//
pages=pdf.pages#通过pages属性获取所有页的信息，此时pages是一个列表
text_all=[]#创建一个空列表
for page in pages:#遍历所有页的数据
text = page.extract_text() # 用extract_text函数获取当前页的文本内容
text_all.append(text)#把遍历的数据加到text_all列表中
text_all=''.join(text_all)#把text_all的列表转化成字符串
print(t

python学习笔记（27）——pdfplumber库提取文本及表格内容基础操作最先出现在Python成神之路。

版权声明：
作者：倾城
链接：https://www.techfm.club/p/20540.html
来源：TechFM
文章版权归作者所有，未经允许请勿转载。

THE END

二维码

以对方本性而不以信念交朋友

< <上一篇

《谈美》读书感想：读书于人生的意义

下一篇>>

搜索内容

python学习笔记（27）——pdfplumber库提取文本及表格内容基础操作

取消回复

共有 0 条评论

Ads