glob 包是一个快速查找文件夹中内容的包,可以通过模糊查找的形式找到我们想要的内容。
导入包与模块
from glob import glob
使用方法
glob(任意目录)
返回内容:
指定路径下的内容列表,不存在的路径返回空列表。
代码示例如下:
# coding:utf-8 import os from glob import glob target = os.getcwd() result = glob(target) print(result) # 打印输出当前路径的文件夹 result = glob(target + '/*') print(result) # 打印输出当前路径的文件夹下的所有文件 result = glob(target + '/*.py') print(result) # 打印输出当前路径的文件夹下的所有以 "py" 结尾的文件 result = glob(target + '/*.zip') print(result) # 打印输出当前路径的文件夹下的所有以 "zip" 结尾的文件 result = glob(target + '/filetest*') print(result) # # 打印输出当前路径的文件夹下的所有以 "filetest" 开头的文件
运行结果如下:

已知条件:
想查找的文件名已经知道,但是目录在哪里并不知道。
实现方法:
利用 "glob" 从最上级目录开始查找,利用递归模式,不断的查找,直到找到为止。
代码示例如下:
# coding:utf-8
import glob
"""
获取当前路径下所有内容
判断每个内容的类型(文件夹还是文件)
若是文件夹则继续递归查找
"""
path = glob.os.path.join(glob.os.getcwd(), '*') # 获取当前文件夹下的所有内容
# glob 模块其实已经包含了 "os" 模块
final_result = [] # 定义一个空列表,用以存储 search() 函数查到的内容
def search(path, target): # 定义 search() 函数,传入 "path" 文件路径, "target" 要查找的目标文件
result = glob.glob(path)
for data in result: # for 循环判断递归查到的内容是文件夹还是文件
if glob.os.path.isdir(data): # 若是文件夹,继续将该文件夹的路径传给 search() 函数继续递归查找
_path = glob.os.path.join(data, '*')
search(_path, target)
else: # 若是文件,则将该查询到的文件所在路径插入 final_result 空列表
if target in data:
final_result.append(data)
return final_result
if __name__ == '__main__':
result = search(path, target='filetest.py')
print(result)
运行结果如下:

接下来我们看一下查找指定内容的文件:
已知条件:
文件中包含有某些关键字,但是不知道文件名和文件所在路径
实现方法:
利用 "glob" 从最上级目录开始查找,利用递归模式,不断的查找。如果是文件夹则进入继续查找,是文件则读取,判断是否包含该内容,返回该内容的文件名以及所在路径。
其实,基于文件内容查找文件实现的方式大体与上文的查找指定文件大体相似,只不过加入了读取文件的判断罢了。
代码示例如下:
# coding:utf-8
import glob
"""
获取当前路径下所有内容
判断每个内容的类型(文件夹还是文件)
若是文件夹则继续递归查找
"""
path = glob.os.path.join(glob.os.getcwd(), '*test04') # 因为下文捕获不可读文件格式太多,所以这里直接指定了 "test04" 路径
final_result = [] # 定义一个空列表,用以存储 search() 函数查到的内容
def search(path, target): # 定义 search() 函数,传入 "path" 文件路径, "target" 要查找的目标文件
result = glob.glob(path)
for data in result: # for 循环判断递归查到的内容是文件夹还是文件
if glob.os.path.isdir(data): # 若是文件夹,继续将该文件夹的路径传给 search() 函数继续递归查找
_path = glob.os.path.join(data, '*')
search(_path, target)
else: # 若是文件,则将该查询到的文件所在路径插入 final_result 空列表
f = open(data, 'r') # 利用 open() 函数读取文件,并通过 try...except... 捕获不可读的文件格式(.zip 格式)
try:
content = f.read()
if target in content:
final_result.append(data)
except:
print('这是不可读文件格式的文件的所在路径:{} '.format(data))
continue
finally:
f.close()
return final_result
if __name__ == '__main__':
result = search(path, target='测试文件')
print(result)
运行结果如下:

免责声明:本站发布的内容(图片、视频和文字)以原创、转载和分享为主,文章观点不代表本网站立场,如果涉及侵权请联系站长邮箱:mmqy2019@163.com进行举报,并提供相关证据,查实之后,将立刻删除涉嫌侵权内容。
长按识别二维码并关注微信
更方便到期提醒、手机管理