用Python打造一款文件搜索工具,所有功能自己定义!
本文转自公众号:早起Python
一、前言
大家好,又到了Python办公自动化系列。
在日常的办公中,我们经常会从一堆不同格式的文件(夹)中搜索特定的文件,可能你是凭着记忆去找或是借助软件,但你有想过如何用Python实现吗?本文将基于几个常见的搜索操作讲解?
「如何使用Python制作一款简易的文件搜索工具」
二、扫描路径内的内容
有些时候我们会希望在当前文件夹的成百上千个文件中快速找到需要的文件,如果这个文件夹又包括很多个子文件夹,并不需要程序进去查找而无端耗费资源。这就是典型的「扫描一层搜索」
1. 基于 os.scandir()
需求说明
❝输出
C:Program Files (x86)
路径下名字包含“Windows”的文件夹名称,并统计个数 ❞
步骤分析
这是一个非遍历的需求,只需要在目的文件夹内扫描一圈判断即可。用到的方法是os.scandir()
,使用如下:
import os
path = ...
for file in os.scandir(path):
print(file.name, file.path, file.is_dir())
上面代码最后输出的是给定路径下各内容的名字、绝对路径,并判断其是否是文件夹
需要注意的是os.scandir()
只在路径下一级扫描,需求实现的代码如下(代码逻辑很简单,可以自己做相应调整):
import os
num = 0
for file in os.scandir(r'C:\Program Files (x86)'):
if file.is_dir():
if 'Windows' in file.name:
print(file.name)
num += 1
print('含有Windows的文件夹个数为:', num)
2. 基于 os.listdir()
需求说明
❝输出
C:Program Files (x86)
路径下所有可执行文件 (即后缀为 .exe) ❞
步骤分析
依然是非遍历的需求,这里使用os.listdir()
,它比os.scandir()
简单一些,可直接调用输出名称而非路径。后缀名可以用字符串的切片来判断,但难免失去灵活性。此时建议用字符串方法string.endswith()
来判断名称的结尾是否是.exe
,代码如下:
import os
for file in os.listdir(r'C:\Program Files (x86)'):
if file.endswith('.exe'):
print(file)
三、遍历文件夹搜索文件
更多时候我们希望给定一个大概的路径,在这个路径下的所有文件夹里一层一层找,找到特定文件或者符合要求的文件,这里需要遍历文件,有两种主要的方法:
1. 基于 os.walk()
os.walk 遍历后产生三个参数:当前文件夹路径, 包含文件夹名称 [列表形式]
, 包含文件名称[列表形式]
可以用如下代码完成简单遍历:
import os
for dirpath, dirnames, filenames in os.walk(r'C:\Program Files (x86)'):
print(f'打开文件夹{dirpath}')
if dirnames:
print(dirnames)
if filenames:
print(filenames)
print('-' * 10)
需求说明
❝遍历
C:Program Files (x86)
找出所有新版Excel文件 (即后缀为.xlsx
) ❞
步骤分析
只要理解了os.walk()
的工作模式,用endswith()
判断后缀即可。最后如果需要获得绝对路径可以把当前文件夹路径和文件名拼接,简单一点用 + 或者字符串格式化,也可以用os
模块内的方法
import os
for dirpath, dirnames, filenames in os.walk(r'C:\Program Files (x86)'):
if filenames:
for i in filenames:
if i.endswith('.xlsx'):
print(os.path.join(dirpath, i))
2. 基于非 os 方法:glob
glob
在之前的推文也反复提到遍历框架:
import glob
for file in glob.glob('**/*', recursive=True):
print(file)
**/*
的使用表示用通配符指代给定路径下的任何一层,recursive
参数允许遍历搜索 由于glob
可以使用「通配符」,大大拓宽了灵活程度,这里利用 glob 也来完成上面的需求
需求说明
❝遍历
C:Program Files (x86)
找出所有新版Excel文件(即后缀为.xlsx
) ❞
import glob
for file in glob.glob('**/*.xlsx', recursive=True):
print(file)
可以看到非常简单,在原有代码基础上加上后缀名就能够完成特定类型文件的搜索。如果需要搜索「特定文件」,如遍历C:Program Files (x86)
找到文件practice.txt
,「只需要后一个*
改成具体名称就行」
import glob
for file in glob.glob('**/practice.txt', recursive=True):
print(file)
四、写在最后
通过本文的Python自动化脚本制作过程,我们可以再次体会Python办公自动化的强大!如果对自动化代码和数据感兴趣可以在后台回复自动化获取。
当然本文只是基于几个简单的需求来讲解使用Python来制作搜索文件脚本的主要方法,接下来你可以结合之前的自动化案例或以根据自己的需求添加一些其他的规则或增加新的功能,打造出一款属于你的软件!
最后还是希望大家能够理解Python办公自动化的一个核心就是「批量操作-解放双手」,让复杂的工作自动化!
今天的文章就到这里,原创不易,如果喜欢的话请给我一波三连支持吧(在看、转发、留言)
-END-
- SQL注入测试神器sqlmap
- 人工智能也分强与弱?
- 【Scikit-Learn 中文文档】集成方法 - 监督学习 - 用户指南 | ApacheCN
- 2017黑科技 颠覆生活哪家强?
- ASP.NET Core中的依赖注入(5): ServiceProvider实现揭秘 【解读ServiceCallSite 】
- ASP.NET MVC的View是如何呈现出来的[实例篇]
- 把人类向机器人乞讨,变成对机器人征税
- 印度6大科技真相 会让很多人大吃一惊
- 了解ASP.NET MVC几种ActionResult的本质:HttpStatusCodeResult & RedirectResult/RedirectToRouteResult
- Python原创0基础入门一看几张图就学会了
- ASP.NET Core中的依赖注入(5):ServicePrvider实现揭秘【补充漏掉的细节】
- 了解ASP.NET MVC几种ActionResult的本质:FileResult
- ASP.NET Core管道深度剖析(1):采用管道处理HTTP请求
- 如何用Python和深度神经网络识别图像?
- JavaScript 教程
- JavaScript 编辑工具
- JavaScript 与HTML
- JavaScript 与Java
- JavaScript 数据结构
- JavaScript 基本数据类型
- JavaScript 特殊数据类型
- JavaScript 运算符
- JavaScript typeof 运算符
- JavaScript 表达式
- JavaScript 类型转换
- JavaScript 基本语法
- JavaScript 注释
- Javascript 基本处理流程
- Javascript 选择结构
- Javascript if 语句
- Javascript if 语句的嵌套
- Javascript switch 语句
- Javascript 循环结构
- Javascript 循环结构实例
- Javascript 跳转语句
- Javascript 控制语句总结
- Javascript 函数介绍
- Javascript 函数的定义
- Javascript 函数调用
- Javascript 几种特殊的函数
- JavaScript 内置函数简介
- Javascript eval() 函数
- Javascript isFinite() 函数
- Javascript isNaN() 函数
- parseInt() 与 parseFloat()
- escape() 与 unescape()
- Javascript 字符串介绍
- Javascript length属性
- javascript 字符串函数
- Javascript 日期对象简介
- Javascript 日期对象用途
- Date 对象属性和方法
- Javascript 数组是什么
- Javascript 创建数组
- Javascript 数组赋值与取值
- Javascript 数组属性和方法
- 面试官:考你几个简单的事件问题吧
- 如何创建Linux的swap交换分区文件的方法步骤
- Linux利用keepalived实现lvs的高可用性的操作方法
- Canvas系列(11):动画中级
- 使用autoconf生成Makefile并编译工程的步骤
- frida- registernatives获取so层动态注册函数
- Ubuntu下安装并配置VS Code编译C++的方法
- LInux下如何挂载光盘找rpm包的方法步骤
- Linux 改变文件大小的方法
- Canvas系列(9):其他API
- CentOS7将Nginx添加系统服务的方法步骤
- linux ss命令详解
- 如何在Linux中设置快捷方式图标
- foreman ubuntu16 快速安装
- Three.js教程(2):工具篇