Python爬虫学习——Re实战手刃电影排行榜(八)

Python爬虫学习

文章目录
Python爬虫学习一、查看页面源代码二、具体代码实现总结

一、查看页面源代码
首先我们需要看我们需要的内容是不是在豆瓣源代码里,如果在直接用url即可,如果不在还需要用抓包工具查看对应url

可以看到页面源代码里面是有相关信息,这个便是服务器渲染,我们可以通过此url和正则表达式提取我们想要的内容
二、具体代码实现
下面我们就根据分析进行实验, 第一步应该拿到页面源代码(requests) 第二步通过re来提取想要的信息(re模块)
import requests
import re

url='https://movie.douban.com/top250'
resp=requests.get(url)
print(resp.text)

发现是空的,这是一个反爬现象,我们需要伪装我们的代码
import requests
import r

Python爬虫学习——Re实战手刃电影排行榜(八)最先出现在Python成神之路

版权声明:
作者:lichengxin
链接:https://www.techfm.club/p/20723.html
来源:TechFM
文章版权归作者所有,未经允许请勿转载。

THE END
分享
二维码
< <上一篇
下一篇>>