python学习笔记(27)——pdfplumber库提取文本及表格内容基础操作
pdfplumber库安装地址:Search results · PyPI
安装后pip安装即可
1、提取文本:extract_text()解析文本
代码练习:
import pdfplumber#引进pdfplumber库
#print(pdfplumber.__version__)#通过测试证明pdfplumber库安装成功
pdf=pdfplumber.open('F://XX公告.PDF')#打开pdf文件,路径之间符号用//
pages=pdf.pages#通过pages属性获取所有页的信息,此时pages是一个列表
text_all=[]#创建一个空列表
for page in pages:#遍历所有页的数据
text = page.extract_text() # 用extract_text函数获取当前页的文本内容
text_all.append(text)#把遍历的数据加到text_all列表中
text_all=''.join(text_all)#把text_all的列表转化成字符串
print(t
共有 0 条评论