Bootstrap

文件读取错误

错误码:UnicodeDecodeError: ‘gbk‘ codec can‘t decode byte 0x80 in position 2: illegal multibyte sequence


出错代码

f = open('西游记.txt').read()

但是在执行的时候会报错:
UnicodeDecodeError: ‘gbk’ codec can’t decode byte 0x80 in position 2: illegal multibyte sequence


问题

可能是读取的文本的编码格式不对,或者有特殊的非法字符


解决方法

  1. 编码转换
f = open('西游记.txt' ,encoding='utf-8'.read()
  1. 添加属性忽略非法字符内容
f = open('西游记.txt', encoding='utf-8', errors='ignore' )

;