python selenium 大众点评餐厅信息+用户评论 爬虫
这次爬取的目标是大众点评里餐厅的信息以及用户的评论。 大众点评的反爬内容比较丰富,这里也只是记录了如何通过selenium模拟访问大众点评,以及大众点评的woff文件构建字典并对加密文字进行替换。
目标url='http://www.dianping.com/shop/G7RgscHLjDjXY9hg'
进入目标网页,对我们想要的商店名进行分析,发现它在开发者工具与页面显示的并不一样, 同时发现这个字体的"font-family"属性为’PingFangSC-Regular-address’。 继续分析其他加密字体,可以发现这样一个规律:
不同位置有不同font-family:
(店)中文:PingFangSC-Regular-address
(店)数字:PingFangSC-Regular-num
(顾客)评价:PingFangSC-Regular-review
(店)营业时间 数字:PingFang
共有 0 条评论