Bootstrap

数据分析与数据处理实例(某银行数据)

掌握numpy、matplotlib、pandas模块为前提,kmeans算法为主要分析工具

数据分析与数据处理

数据及含义

这里先上截图,具体的数据及数据含义点击下边链接,自行获取! https://download.csdn.net/download/weixin_44423698/11737958
原始数据
数据含义

方法

探索数据、清洗数据、清洗过后的选择需要的数据、对数据进行转换(如果数据很清晰,而且没有联系,可以不写)、标准化数据、Kmeans聚类和绘图得出结果。

代码实现

#引入数据处理与科学分析的三大模块
import pandas as pd
import matplotlib.pyplot as plt
import numpy as np

#引入sklearn模块里的机器学习算法k_means(是个函数)
from sklearn.cluster import KMeans

class DiverCar():
    #探索数据
    def tansuo(self,filepath):
        '''
        :param filepath:   bank-all.csv文件所在位置
        :return:
        '''
        df = pd.read_csv(filepath,sep=';')
        df.to_ex
;