【爬虫实践】获取某城市天气数据
功能需求
获取山东济南城市每天的天气情况。 需要获取四个数据:天气、温度、风向、风级。 url地址:http://www.weather.com.cn/weather/101120101.shtml
思路分析
该界面通过get请求,得到html数据,包含七天图示数据,故可用bs4对页面进行解析
功能一:获取今日天气
import os
import random
import time
from bs4 import BeautifulSoup
import re
import requests
# 得到网页并用bs4进行网页解析
def getHtml(url):
# 请求头被封,于是采用多个请求头,每次随机用一个,防止被服务器识别为爬虫
user_agent_list = [
"Mozilla/5.0 (Windows NT 10.0; WOW64) Apple
共有 0 条评论