爬虫从入门到入预(18)

今天学习的是如何爬取视频,回顾我们爬取网页文字小说或者图片的时候,大都是从主页面进入到子页面,然后图片就拿到它的src,文字小说大概是拿到某个节点的content.但是爬取视频和上述二者有较大的区别,视频在服务器中的存放是分清晰度和分切片的,以至于我们每次请求都只能请求较短的一小个切片,所以想要爬取一个完整的视频就需要不断请求各个切片的url。然后下载ts文件,并合并成为一个完整的mp4文件。

#这种形式写的url会让访问者访问速度特别慢,尤其是加载大视频的时候,会一次性全部加载,就需要等待很久
#视频网站的工作原理
#用户上传视频——转码(转换成不同分辨率的同时长视频,4K-2K/1K/1080P)——切片处理(把单个视频文件进行拆分)
#用户在拖动进度条的时候其实是选择哪个切片

#需要一个文件来记录信息:1.视频的播放顺序2.视频的存放路径
#m3u8 txt json----文本---可编码
#想要抓取一个视频:
#1.找到m3u8文件(各种手段)
#2.通过m3

爬虫从入门到入预(18)最先出现在Python成神之路

版权声明:
作者:ht
链接:https://www.techfm.club/p/27085.html
来源:TechFM
文章版权归作者所有,未经允许请勿转载。

THE END
分享
二维码
< <上一篇
下一篇>>