推荐一个爬虫神器:You-Get,小白也会用
时间:2022-06-11
本文章向大家介绍推荐一个爬虫神器:You-Get,小白也会用,主要内容包括其使用实例、应用技巧、基本知识点总结和需要注意事项,具有一定的参考价值,需要的朋友可以参考一下。
作者:程序设计媛 微信公众号:Python网络爬虫与数据挖掘
都说Python很厉害,除了生孩子什么都可以做,这不,有一款爬虫神器 you-get 能爬取视频网站和图片网站,你无需写任何代码就能轻松把你喜欢的视频或者图片甚至音频文件扒下来,怎么玩,先看个简单的示例:
先爬个腾讯视频,就是上次在朋友圈疯传的程序员搏击产品经理的视频
>you-get https://v.qq.com/x/page/m0744tilyc0.html
Site: QQ.com
Title: 中果平安 产品经理给程序员提了个需求 然后就。。。干起来了
Type: MPEG-4 video (video/mp4)
Size: 2.96 MiB (3103096 Bytes)
Downloading 中果平安 产品经理给程序员提了个需求 然后就。。。干起来了.mp4 ...
100% ( 3.0/ 3.0MB) ├████████████████████████████████████████┤[1/1] 2 MB/s
简直不能再简单了,只要输入视频的链接就能爬下来。默认视频下载到当前目录。如果你不喜欢为了看一个30秒的视频还要忍受长达一分钟的广告,就把它下下来看吧。
怎么安装?
只要你安装了Python环境,然后通过pip管理包工具就可以使用该命令了。
$ pip3 install you-get
you-get 支持哪些网站?
国内的主流视频网站都支持,比如腾讯、搜狐、新浪、B站、央视网、芒果TV,乐视网、优酷、熊猫斗鱼等等,实在是太多了,完整列表可以查看: https://github.com/soimort/you-get#supported-sites
如果你很有兴趣you-get是怎么实现的,你还可以研究下它的源代码是怎么样,代码托管在GitHub: https://github.com/soimort/you-get
- JavaScript 教程
- JavaScript 编辑工具
- JavaScript 与HTML
- JavaScript 与Java
- JavaScript 数据结构
- JavaScript 基本数据类型
- JavaScript 特殊数据类型
- JavaScript 运算符
- JavaScript typeof 运算符
- JavaScript 表达式
- JavaScript 类型转换
- JavaScript 基本语法
- JavaScript 注释
- Javascript 基本处理流程
- Javascript 选择结构
- Javascript if 语句
- Javascript if 语句的嵌套
- Javascript switch 语句
- Javascript 循环结构
- Javascript 循环结构实例
- Javascript 跳转语句
- Javascript 控制语句总结
- Javascript 函数介绍
- Javascript 函数的定义
- Javascript 函数调用
- Javascript 几种特殊的函数
- JavaScript 内置函数简介
- Javascript eval() 函数
- Javascript isFinite() 函数
- Javascript isNaN() 函数
- parseInt() 与 parseFloat()
- escape() 与 unescape()
- Javascript 字符串介绍
- Javascript length属性
- javascript 字符串函数
- Javascript 日期对象简介
- Javascript 日期对象用途
- Date 对象属性和方法
- Javascript 数组是什么
- Javascript 创建数组
- Javascript 数组赋值与取值
- Javascript 数组属性和方法
- SAP Spartacus和product相关的标准normalizer
- 【Rust 日报】2020-09-09 引入“auditable”
- 听说MongoDB你很豪横?-------------MongoDB复制集以及管理优化
- 听说Memcache你很豪横?-------------深入剖析Memcache 安装及管理数据库操作
- 听说Memcache你很豪横?-------------深入剖析Memcache+keepalive高可用群集
- 排障集锦:九九八十一难之第十四难!------------- 安装magent时make编译报错
- 【Rust日报】2020-09-06 Evil_DLL 用来测试注入方法的DLL
- 【Rust日报】2020-09-05 微软在c++静态分析工具实现了一些rust的安全规则
- 一起来玩玩WebGL
- 自研网关:多项目的swagger聚合功能
- Prometheus 如何做到“活学活用”,大牛总结的避坑指南
- 文档驱动 —— 表单组件(一):表单元素组件 优点缺点选择文本类的Inputcheck 多选value的类型问题
- Vue3.0源码结构分析
- 【每周一库】- cached - 缓存结构型、辅助函数记忆化
- meta生成器 —— 表单元素组件 meta表单代码meta的模板data变幻