Python爬虫学习——数据解析之Re解析(七)

Python爬虫学习

文章目录
Python爬虫学习前言一、正则表达式贪婪匹配和惰性匹配
二、Re模块

前言
三种解析方式: 1、re解析(正则表达式) 2、bs4解析 3、xpath解析
一、正则表达式
正则表达式是由一些具有特殊含义的字符组成的字符串,多用于查找、替换符合规则的字符串。在表单验证、Url映射等处都会经常用到。
优点:速度快、效率高、准确性高
正则的语法:使用元字符进行排列组合匹配字符串
一.常用正则表达式符号和语法:
'.' 匹配所有字符串,除/n以外
‘-’ 表示范围[0-9]

'^' 匹配字符串开头
‘$’ 匹配字符串结尾 re
'/d' 匹配数字,等于[0-9] re.findall('/d','电话:10086')结果['1', '0', '0', '8', '6']
'/D' 匹配非数字,等于[^0-9] re.findall('/D','电话:

Python爬虫学习——数据解析之Re解析(七)最先出现在Python成神之路

版权声明:
作者:lichengxin
链接:https://www.techfm.club/p/19368.html
来源:TechFM
文章版权归作者所有,未经允许请勿转载。

THE END
分享
二维码
< <上一篇
下一篇>>