#检测数据编码格式
import chardet
with open('附件1.csv', 'rb') as f:
result = chardet.detect(f.read()) # 读取一定量的数据进行编码检测
print(result['encoding']) # 打印检测到的编码
在读取文件时会遇到各种问题,
UnicodeDecodeError: 'utf-8' codec can't decode byte 0xb7 in position 0: invalid start byte
我们只需要将代码改成如下即可:
# 读取数据
Data_day = pd.read_csv('附件1.csv',encoding='gb2312')
#Data_day = pd.read_csv('附件1.csv')