掌握numpy、matplotlib、pandas模块为前提,kmeans算法为主要分析工具
数据分析与数据处理
数据及含义
这里先上截图,具体的数据及数据含义点击下边链接,自行获取! https://download.csdn.net/download/weixin_44423698/11737958
方法
探索数据、清洗数据、清洗过后的选择需要的数据、对数据进行转换(如果数据很清晰,而且没有联系,可以不写)、标准化数据、Kmeans聚类和绘图得出结果。
代码实现
#引入数据处理与科学分析的三大模块
import pandas as pd
import matplotlib.pyplot as plt
import numpy as np
#引入sklearn模块里的机器学习算法k_means(是个函数)
from sklearn.cluster import KMeans
class DiverCar():
#探索数据
def tansuo(self,filepath):
'''
:param filepath: bank-all.csv文件所在位置
:return:
'''
df = pd.read_csv(filepath,sep=';')
df.to_ex