爬虫第一课

爬虫入门
从今天开始让我们一起来学习一些爬虫的相关知识吧!这也是我在这个平台上第一次写博客来记录学习过程。有错误请大家多多指教!接下来就让我们一起开始吧!!!
(一) 什么是爬虫
1.1 爬虫的概念 爬虫用于爬取数据,又称为数据采集程序。 爬虫的数据来源于网络,而网络的数据可以有web服务器,数据库服务器云存储等等来提供。 注:利用爬虫去爬取数据当然要是合法的啦,比如你要爬取的数据必须是公开的而且是非盈利的。 1.2. python的爬虫 使用python编写的爬虫脚本(程序)可以完成定时,定量,指定目标(web站点)的数据爬取。主要使用多(单)线程/进程,网络请求库,数据解析,数据存储,任务调度等相关技术。 python爬虫工程师可以完成接口测试,功能性测试和集成测试。
(二 )爬虫与web后端服务之间的关系
爬虫使用网络请求库,相当于客户端请求,web后端服务器根据请求响应数据。(如下图)
爬虫

爬虫第一课最先出现在Python成神之路

版权声明:
作者:Mr李
链接:https://www.techfm.club/p/19877.html
来源:TechFM
文章版权归作者所有,未经允许请勿转载。

THE END
分享
二维码
< <上一篇
下一篇>>