Python资源爬取

时间:2022-07-23
本文章向大家介绍Python资源爬取,主要内容包括其使用实例、应用技巧、基本知识点总结和需要注意事项,具有一定的参考价值,需要的朋友可以参考一下。

这个玩意之前也发过,大致用法就是输入资源名字,然后就会有一堆网盘资源跳出来了,但是讲道理,如果资源一多,那么就会很乱,所以改版了一次,用户想要哪一个的资源,就输入指定ID的资源,就可以获得那个资源了

后来又发现了一个新问题,就是一页只能由10个资源,而这个程序不支持翻页,所以又多def了一个,改版后的效果图如下

原本获取完直接问资源ID,改完后,获取之前会先在页面去查找是否存在下一页

next_page=schtml.select('a[class="next page-numbers"]')
 
if next_page == []:
 
    xxx
 
else:
 
    xxx
 

如果存在下一页,那么就交由另外一部分来处理,爬取完一页的资源后,若没有想要的资源,输入y (大小写都可以)就可以自动爬取下一页的资源内容了,如果这一页有想要的资源,输入N就可以退出,并输入资源ID后就可获得该资源的网盘链接了

当然,为了避免大小写的问题,我在获取了用户输入的东西后,自动全部大写

confirm = input("是否爬取下一页内容(Y/N):  ")
 
if confirm.upper() == ("Y"):
 
    xxx

下面是一个改版的流程

版本

功能

备注

v1.0

获取资源名和链接

第一小步

v1.1

自动获取百度网盘链接

基本完成

v1.2

顺便获取网盘链接密码

功能实现

v2.1

更改了结构,用户可选择指定的资源而不是全盘爬取,界面看起来更美观

美观了一下

v3.1

增加了翻页功能

Done

有需要的可以自行下载,但是希望不要传播,尽管这篇并不会有多少人,可能看也看不懂在说什么玩意,但主要是分享出来用,方便找电视或者电影资源之类的

下载链接: https://pan.baidu.com/s/12aTKMC1vLAfBTsZQixNu7Q 提取码:xi1b