第八章 文件、异常和模块
实际应用中,我们绝大多数的数据都是通过文件的交互完成的
8.1 文件的读写
8.1.1 文件的打开
- 文件的打开通用格式
with open("文件路径", "打开模式", encoding = "操作文件的字符编码") as f:
"对文件进行相应的读写操作"
使用with 块的好处:执行完毕后,自动对文件进行close操作。
【例1】一个简单的文件读取
with open("E:\ipython\测试文件.txt", "r", encoding = "gbk") as f: # 第一步:打开文件
text = f.read() # 第二步:读取文件
print(text)
我是一个测试文件
1、文件路径
-
完整路径,如上例所示
-
程序与文件在同一文件夹,可简化成文件名
with open("测试文件.txt", "r", encoding = "gbk") as f: # 第一步:打开文件
text = f.read() # 第二步:读取文件
print(text)
我是一个测试文件
2、打开模式
-
“r” 只读模式,如文件不存在,报错
-
“w” 覆盖写模式,如文件不存在,则创建;如文件存在,则完全覆盖原文件
-
“x” 创建写模式,如文件不存在,则创建;如文件存在,报错
-
“a” 追加写模式,如文件不存在,则创建;如文件存在,则在原文件后追加内容
-
“b” 二进制文件模式,不能单独使用,需要配合使用如"rb",“wb”,“ab”,该模式不需指定encoding
-
“t” 文本文件模式,默认值,需配合使用 如"rt",“wt”,“at”,一般省略,简写成如"r",“w”,“a”
-
“+”,与"r",“w”,“x”,"a"配合使用,在原功能基础上,增加读写功能
-
打开模式缺省,默认为只读模式
3、字符编码
- 万国码 utf-8
包含全世界所有国家需要用到的字符
- 中文编码 gbk
专门解决中文编码问题
-
windows系统下,如果缺省,则默认为gbk(所在区域的编码)
-
为清楚起见,除了处理二进制文件,建议不要缺省encoding
8.1.2 文件的读取
1、读取整个内容——f.read()
with open("三国演义片头曲_utf.txt", "r", encoding="utf-8") as f: # 第一步:打开文件
text = f.read() # 第二步:读取文件
print(text)
临江仙·滚滚长江东逝水
滚滚长江东逝水,浪花淘尽英雄。
是非成败转头空。
青山依旧在,几度夕阳红。
白发渔樵江渚上,惯看秋月春风。
一壶浊酒喜相逢。
古今多少事,都付笑谈中。
with open("三国演义片头曲_utf.txt", encoding="utf-8") as f: # "r",可缺省,为清晰起见,最好写上
text = f.read()
print(text)
临江仙·滚滚长江东逝水
滚滚长江东逝水,浪花淘尽英雄。
是非成败转头空。
青山依旧在,几度夕阳红。
白发渔樵江渚上,惯看秋月春风。
一壶浊酒喜相逢。
古今多少事,都付笑谈中。
- 解码模式不匹配
with open("三国演义片头曲_utf.txt", "r", encoding="gbk") as f:
text = f.read()
print(text)
---------------------------------------------------------------------------
UnicodeDecodeError Traceback (most recent call last)
<ipython-input-6-8e9ea685585d> in <module>
1 with open("三国演义片头曲_utf.txt", "r", encoding="gbk") as f:
----> 2 text = f.read()
3 print(text)
UnicodeDecodeError: 'gbk' codec can't decode byte 0x80 in position 50: illegal multibyte sequence
with open("三国演义片头曲_utf.txt", "r") as f: # encoding缺省,windows系统默认为"gbk"
text = f.read()
print(text)
---------------------------------------------------------------------------
UnicodeDecodeError Traceback (most recent call last)
<ipython-input-7-480622bc01aa> in <module>
1 with open("三国演义片头曲_utf.txt", "r") as f: # encoding缺省,windows系统默认为"gbk"
----> 2 text = f.read()
3 print(text)
UnicodeDecodeError: 'gbk' codec can't decode byte 0x80 in position 50: illegal multibyte sequence
2、逐行进行读取——f.readline()
with open("三国演义片头曲_gbk.txt", "r", encoding="gbk") as f:
for i in range(3):
text = f.readline() # 每次只读取一行
print(text)
临江仙·滚滚长江东逝水
滚滚长江东逝水,浪花淘尽英雄。
是非成败转头空。
with open("三国演义片头曲_gbk.txt", "r", encoding="gbk") as f:
while True:
text = f.readline()
if not text:
# print(text is "")
break
else:
# print(text == "\n")
print(text, end="") # 保留原文的换行,使print()的换行不起作用
临江仙·滚滚长江东逝水
滚滚长江东逝水,浪花淘尽英雄。
是非成败转头空。
青山依旧在,几度夕阳红。
白发渔樵江渚上,惯看秋月春风。
一壶浊酒喜相逢。
古今多少事,都付笑谈中。
3、读入所有行,以每行为元素 形成一个列表——f.readlines()
with open("三国演义片头曲_gbk.txt", "r", encoding="gbk") as f:
text = f