Bootstrap

glob库函数使用方法

glob模块是用来获取文件路径的一个常用模块。它可以根据用户指定的路径来搜索文件,然后返回符合规则的文件路径列表。

一、glob库函数的基本用法

glob库需调用glob.glob()函数并传入特定的路径规则。路径规则可以包含通配符,例如使用*来匹配任意个字符,使用?来匹配单个字符。以下是一个示例:

import glob

# 获取当前目录下所有的文本文件
files = glob.glob("*.txt")
print(files)

二、使用通配符进行模糊匹配

glob库函数中通配符匹配使用比较频繁,可以通过通配符匹配获取符合规则的文件路径列表。

import glob

# 获取当前目录下所有以.txt结尾的文件
files = glob.glob("*.txt")
print(files)

# 获取当前目录下以f开头,以.txt结尾的文件
files = glob.glob("f*.txt")
print(files)

# 获取当前目录下以任意字母开头,以.ppt或.pptx结尾的文件
files = glob.glob("[a-zA-Z]*.ppt*")
print(files)

# 获取当前目录下以数字为文件名的txt文件
files = glob.glob("[0-9]*.txt")
print(files)

# 获取当前目录下任意一级子目录下的txt文件
files = glob.glob("*/*.txt")
print(files)

三、使用递归匹配子目录中的文件

除了对当前目录下进行文件搜索,glob库函数还可以在子目录中递归搜索文件。可以通过传入特定的路径规则实现递归匹配。

import glob

# 获取当前目录及其子目录下所有的txt文件
files = glob.glob("**/*.txt", recursive=True)
print(files)

# 获取当前目录及其子目录下所有的py文件
files = glob.glob("**/*.py", recursive=True)
print(files)

以上代码中的**表示匹配任意层级的子目录。

四、使用glob函数结合其他库的实际应用

1. 读取文件夹下的图片文件

import glob
from PIL import Image

# 读取当前目录下所有的jpg和png文件,并显示图片
image_files = glob.glob("*.jpg") + glob.glob("*.png")
for file in image_files:
    img = Image.open(file)
    img.show()

2. 统计某文件夹中所有文本文件的行数

import glob

# 统计当前目录下所有的txt文件的行数总和
files = glob.glob("*.txt")
total_lines = 0
for file in files:
    with open(file, "r") as f:
        lines = f.readlines()
        total_lines += len(lines)
print("Total lines:", total_lines)

3. 批量处理文件

import glob
import shutil

# 将所有的txt文件移动到一个新的文件夹
files = glob.glob("*.txt")
for file in files:
    shutil.move(file, "new_folder")
;