爬虫从入门到入预（18）

ht • 2022-03-25 01:02 • 好物分享

今天学习的是如何爬取视频，回顾我们爬取网页文字小说或者图片的时候，大都是从主页面进入到子页面，然后图片就拿到它的src，文字小说大概是拿到某个节点的content.但是爬取视频和上述二者有较大的区别，视频在服务器中的存放是分清晰度和分切片的，以至于我们每次请求都只能请求较短的一小个切片，所以想要爬取一个完整的视频就需要不断请求各个切片的url。然后下载ts文件，并合并成为一个完整的mp4文件。

#这种形式写的url会让访问者访问速度特别慢，尤其是加载大视频的时候，会一次性全部加载，就需要等待很久
#视频网站的工作原理
#用户上传视频——转码（转换成不同分辨率的同时长视频，4K-2K/1K/1080P）——切片处理（把单个视频文件进行拆分）
#用户在拖动进度条的时候其实是选择哪个切片

#需要一个文件来记录信息：1.视频的播放顺序2.视频的存放路径
#m3u8 txt json----文本---可编码
#想要抓取一个视频：
#1.找到m3u8文件（各种手段）
#2.通过m3

爬虫从入门到入预（18）最先出现在Python成神之路。

版权声明：
作者：ht
链接：https://www.techfm.club/p/27085.html
来源：TechFM
文章版权归作者所有，未经允许请勿转载。

THE END

二维码

windows定时任务备份MySQL数据库

< <上一篇

再谈MacOS的Homebrew安装问题

下一篇>>

搜索内容

爬虫从入门到入预（18）

取消回复

共有 0 条评论

Ads