前言
在数据分析和处理任务中,处理Excel文件是一个常见的需求,尤其是当我们需要对某些列的数据进行统计时。通过Python,我们可以轻松地读取和分析Excel文件,统计特定字段的数量,无论是IP地址、电子邮件、电话号码,还是任何其他列。今天,我们将编写一个灵活的Python脚本,帮助你统计Excel文件中某个指定列(字段)的数量。
1. 所需库
我们依然使用pandas
库来读取和处理Excel文件,并用os
库遍历文件夹中的文件。
首先,确保你已经安装了pandas
:
pip install pandas
2. 脚本设计
2.1 通用统计字段数量的函数
我们首先定义一个函数,用来统计Excel文件中指定列(字段)中不为空且唯一的值的数量。这个函数可以适应任何字段,不仅限于IP地址。
import pandas as pd
def count_unique_values_in_column(file_path,