Python爬虫学习——Re实战手刃电影排行榜(八)
Python爬虫学习
文章目录
Python爬虫学习一、查看页面源代码二、具体代码实现总结
一、查看页面源代码
首先我们需要看我们需要的内容是不是在豆瓣源代码里,如果在直接用url即可,如果不在还需要用抓包工具查看对应url
可以看到页面源代码里面是有相关信息,这个便是服务器渲染,我们可以通过此url和正则表达式提取我们想要的内容
二、具体代码实现
下面我们就根据分析进行实验, 第一步应该拿到页面源代码(requests) 第二步通过re来提取想要的信息(re模块)
import requests
import re
url='https://movie.douban.com/top250'
resp=requests.get(url)
print(resp.text)
发现是空的,这是一个反爬现象,我们需要伪装我们的代码
import requests
import r
版权声明:
作者:lichengxin
链接:https://www.techfm.club/p/20723.html
来源:TechFM
文章版权归作者所有,未经允许请勿转载。
THE END
二维码
共有 0 条评论