深度之眼 - Python学习笔记——第八章文件、异常和模块

第八章文件、异常和模块

实际应用中，我们绝大多数的数据都是通过文件的交互完成的

8.1 文件的读写

8.1.1 文件的打开

文件的打开通用格式

with open("文件路径", "打开模式", encoding = "操作文件的字符编码") as f:
    "对文件进行相应的读写操作"
使用with 块的好处：执行完毕后，自动对文件进行close操作。

【例1】一个简单的文件读取

with open("E:\ipython\测试文件.txt", "r", encoding = "gbk") as f:     # 第一步：打开文件
    text = f.read()                                                   # 第二步：读取文件
    print(text)

我是一个测试文件

1、文件路径

完整路径，如上例所示
程序与文件在同一文件夹，可简化成文件名

with open("测试文件.txt", "r", encoding = "gbk") as f:     # 第一步：打开文件
    text = f.read()                                        # 第二步：读取文件
    print(text)

我是一个测试文件

2、打开模式

“r” 只读模式，如文件不存在，报错
“w” 覆盖写模式，如文件不存在，则创建；如文件存在，则完全覆盖原文件
“x” 创建写模式，如文件不存在，则创建；如文件存在，报错
“a” 追加写模式，如文件不存在，则创建；如文件存在，则在原文件后追加内容
“b” 二进制文件模式，不能单独使用，需要配合使用如"rb"，“wb”，“ab”，该模式不需指定encoding
“t” 文本文件模式，默认值，需配合使用如"rt"，“wt”，“at”，一般省略，简写成如"r"，“w”，“a”
“+”，与"r",“w”,“x”,"a"配合使用，在原功能基础上，增加读写功能
打开模式缺省，默认为只读模式

3、字符编码

万国码 utf-8

包含全世界所有国家需要用到的字符

中文编码 gbk

专门解决中文编码问题

windows系统下，如果缺省，则默认为gbk（所在区域的编码）
为清楚起见，除了处理二进制文件，建议不要缺省encoding

8.1.2 文件的读取

1、读取整个内容——f.read()

with open("三国演义片头曲_utf.txt", "r", encoding="utf-8") as f:       # 第一步：打开文件
    text = f.read()                                                    # 第二步：读取文件
    print(text)

临江仙·滚滚长江东逝水
滚滚长江东逝水，浪花淘尽英雄。
是非成败转头空。
青山依旧在，几度夕阳红。
白发渔樵江渚上，惯看秋月春风。
一壶浊酒喜相逢。
古今多少事，都付笑谈中。

with open("三国演义片头曲_utf.txt", encoding="utf-8") as f:     # "r"，可缺省，为清晰起见，最好写上
    text = f.read()                                                   
    print(text)

临江仙·滚滚长江东逝水
滚滚长江东逝水，浪花淘尽英雄。
是非成败转头空。
青山依旧在，几度夕阳红。
白发渔樵江渚上，惯看秋月春风。
一壶浊酒喜相逢。
古今多少事，都付笑谈中。

解码模式不匹配

with open("三国演义片头曲_utf.txt", "r", encoding="gbk") as f:     
    text = f.read()                                                    
    print(text)

---------------------------------------------------------------------------

UnicodeDecodeError                        Traceback (most recent call last)

<ipython-input-6-8e9ea685585d> in <module>
      1 with open("三国演义片头曲_utf.txt", "r", encoding="gbk") as f:
----> 2     text = f.read()
      3     print(text)
UnicodeDecodeError: 'gbk' codec can't decode byte 0x80 in position 50: illegal multibyte sequence

with open("三国演义片头曲_utf.txt", "r") as f:     # encoding缺省，windows系统默认为"gbk"
    text = f.read()                                                    
    print(text)

---------------------------------------------------------------------------

UnicodeDecodeError                        Traceback (most recent call last)

<ipython-input-7-480622bc01aa> in <module>
      1 with open("三国演义片头曲_utf.txt", "r") as f:     # encoding缺省，windows系统默认为"gbk"
----> 2     text = f.read()
      3     print(text)
UnicodeDecodeError: 'gbk' codec can't decode byte 0x80 in position 50: illegal multibyte sequence

2、逐行进行读取——f.readline()

with open("三国演义片头曲_gbk.txt", "r", encoding="gbk") as f:     
    for i in range(3):
        text = f.readline()                                                   # 每次只读取一行
        print(text)

临江仙·滚滚长江东逝水

滚滚长江东逝水，浪花淘尽英雄。

是非成败转头空。

with open("三国演义片头曲_gbk.txt", "r", encoding="gbk") as f:     
    while True:
        text = f.readline()
        if not text:
            # print(text is "")
            break
        else:
            # print(text == "\n")
            print(text, end="")      # 保留原文的换行，使print()的换行不起作用

临江仙·滚滚长江东逝水
滚滚长江东逝水，浪花淘尽英雄。
是非成败转头空。

青山依旧在，几度夕阳红。
白发渔樵江渚上，惯看秋月春风。
一壶浊酒喜相逢。
古今多少事，都付笑谈中。

3、读入所有行，以每行为元素 形成一个列表——f.readlines()

with open("三国演义片头曲_gbk.txt", "r", encoding="gbk") as f:
    text = f

深度之眼 - Python学习笔记——第八章 文件、异常和模块

第八章 文件、异常和模块

8.1 文件的读写

8.1.1 文件的打开

8.1.2 文件的读取

悦读

深度之眼 - Python学习笔记——第八章文件、异常和模块

第八章文件、异常和模块