Bootstrap

python数据分析项目实战:餐厅订单数据分析

1.项目流程分析:


    1.什么菜最受欢迎

        1.先导入数据,对数据进行预处理:使用concat将三个表对行进行合并,在将有空值的列除,写%matplotlib inline是为了以后不需要写plt.show()。最后输出数据检查一下
import pandas as pd
import matplotlib.pyplot as plt
import numpy as np
# 解决中文乱码问题
plt.rcParams['font.sans-serif']='SimHei'
%matplotlib inline
# 加载数据
data1=pd.read_excel('meal_order_detail.xlsx',sheet_name='meal_order_detail1')
data2=pd.read_excel('meal_order_detail.xlsx',sheet_name='meal_order_detail2')
data3=pd.read_excel('meal_order_detail.xlsx',sheet_name='meal_order_detail3')
data=pd.concat([data1,data2,data3],axis=0)
data.dropna(axis=1,inplace=True)
round(data['amounts'].mean(),2) # 第一种方法,pandas自带的
round(np.mean(data['amounts']),2) # 第二种方法,numpy的方法,这种方法的速度比较快

print(data)
data.info()

        2.统计前十个最受欢迎的菜品,使用values_count()函数统计各个菜品的总和,用切片方式取前十个菜品,在用plot方法绘制图像,函数值kind是指定绘制那种图像,line是折线图,bar是柱状图,color是指定颜色。如果想要柱状图上面显示数据:先循环得到柱状图的坐标,在使用plt.text方法在画布上添加数据。ylabel是为y轴标记数据集,xlabel是为x轴标记数据集
# 统计钱十名菜品的名字
dishes_count=data['dishes_name'].value_counts()[:10]
# dishes_count
# 3.数据可视化(将数据转化为图表,更加直观)
dishes_count.plot(kind='line',color='r')
dishes_count.plot(kind=
;