python爬虫 中国大学排名
中国大学排名爬取
下面使用到了 xpath解析技术
import requests
from lxml import etree
def get_content(url ):
'''获取页面代码'''
try:
headers = {
'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/96.0.4664.110 Safari/537.36'
}
res = requests.get(url,headers=headers)
res.raise_for_status()
res.encoding = res.apparent_encodi
共有 0 条评论