Bootstrap

文件编码检测-Python解决UnicodeDecodeError: ‘utf-8‘ codec can‘t decode byte 0xb7 in position 0: invalid start

#检测数据编码格式
import chardet
with open('附件1.csv', 'rb') as f:
    result = chardet.detect(f.read())  # 读取一定量的数据进行编码检测
print(result['encoding'])  # 打印检测到的编码

在读取文件时会遇到各种问题,

UnicodeDecodeError: 'utf-8' codec can't decode byte 0xb7 in position 0: invalid start byte

我们只需要将代码改成如下即可:

# 读取数据
Data_day = pd.read_csv('附件1.csv',encoding='gb2312')
#Data_day = pd.read_csv('附件1.csv')

 

;