Python爬虫学习——Re实战手刃电影排行榜（八）

lichengxin • 2022-02-13 18:09 • 好物分享

Python爬虫学习

文章目录
Python爬虫学习一、查看页面源代码二、具体代码实现总结

一、查看页面源代码
首先我们需要看我们需要的内容是不是在豆瓣源代码里，如果在直接用url即可，如果不在还需要用抓包工具查看对应url

可以看到页面源代码里面是有相关信息，这个便是服务器渲染，我们可以通过此url和正则表达式提取我们想要的内容
二、具体代码实现
下面我们就根据分析进行实验，第一步应该拿到页面源代码（requests）第二步通过re来提取想要的信息（re模块）
import requests
import re

url='https://movie.douban.com/top250'
resp=requests.get(url)
print(resp.text)

发现是空的，这是一个反爬现象，我们需要伪装我们的代码
import requests
import r

版权声明：
作者：lichengxin
链接：https://www.techfm.club/p/20723.html
来源：TechFM
文章版权归作者所有，未经允许请勿转载。

THE END

二维码

搜索内容