Bootstrap

Python基础学习笔记-8.文件、异常和模块

8.文件、异常和模块

8.1.文件的读写

8.1.1.文件的打开

实际应用中,我们绝大多数的数据都是通过文件的交互完成的

首先,来看文件打开的通用格式

with open("文件路径", "打开模式", encoding = "操作文件的字符编码") as f:

"对文件进行相应的读写操作"

#使用with 块的好处:执行完毕后,自动对文件进行close操作。

例如:一个简单的文件读取

with open("E:\ipython\测试文件.txt", "r", encoding = "gbk") as f:     # 第一步:打开文件

    text = f.read()                                                   # 第二步:读取文件

    print(text)

我是一个测试文件

文件路径

完整路径,如上例所示

程序与文件在同一文件夹,可使用相对路径

with open("测试文件.txt", "r", encoding = "gbk") as f:     # 第一步:打开文件

    text = f.read()                                        # 第二步:读取文件

    print(text)

我是一个测试文件

打开模式

"r"  只读模式,如文件不存在,报错

"w" 覆盖写模式,如文件不存在,则创建;如文件存在,则完全覆盖原文件

"x" 创建写模式,如文件不存在,则创建;如文件存在,报错

"a"  追加写模式,如文件不存在,则创建;如文件存在,则在原文件后追加内容

"b" 二进制文件模式,不能单独使用,需要配合使用如"rb","wb","ab",该模式不需指定encoding

"t" 文本文件模式,默认值,需配合使用 如"rt","wt","at",一般省略,简写成如"r","w","a"

"+",与"r","w","x","a"配合使用,在原功能基础上,增加读写功能

打开模式缺省,默认为只读模式

字符编码

万国码 utf-8

包含全世界所有国家需要用到的字符

中文编码 gbk

专门解决中文编码问题

windows系统下,如果缺省,则默认为gbk(所在区域的编码)

为清楚起见,除了处理二进制文件,建议不要缺省encoding

8.1.2.文件的读取

1、读取整个内容——f.read()

with open("三国演义片头曲_utf.txt", "r", encoding="utf-8") as f:       # 第一步:打开文件

    text = f.read()                                                    # 第二步:读取文件

    print(text)

临江仙·滚滚长江东逝水

滚滚长江东逝水,浪花淘尽英雄。

with open("三国演义片头曲_utf.txt", encoding="utf-8") as f:     # "r",可缺省,为清晰起见,最好写上

    text = f.read()                                                   

    print(text)

临江仙·滚滚长江东逝水

滚滚长江东逝水,浪花淘尽英雄。

解码模式不匹配

with open("三国演义片头曲_utf.txt", "r", encoding="gbk") as f:     

    text = f.read()                                                    

    print(text)

UnicodeDecodeError: 'gbk' codec can't decode byte 0x80 in position 50: illegal multibyte sequence

with open("三国演义片头曲_utf.txt", "r") as f:     # encoding缺省,windows系统默认为"gbk"

    text = f.read()                                                    

    print(text)

UnicodeDecodeError: 'gbk' codec can't decode byte 0x80 in position 50: illegal multibyte sequence

2、逐行进行读取——f.readline()

with open("三国演义片头曲_gbk.txt", "r", encoding="gbk") as f:     

    for i in range(2):

        text = f.readline()                                                   # 每次只读取一行

        print(text)

临江仙·滚滚长江东逝水

 

滚滚长江东逝水,浪花淘尽英雄。

with open("三国演义片头曲_gbk.txt", "r", encoding="gbk") as f:     

    while True:

        text = f.readline()

        if not text:

            # print(text is "")

            break

        else:

            # print(text == "\n")

            print(text, end="")      # 保留原文的换行,使print()的换行不起作用

临江仙·滚滚长江东逝水

滚滚长江东逝水,浪花淘尽英雄。

3、读入所有行,以每行为元素形成一个列表——f.readlines()

with open("三国演义片头曲_gbk.txt", "r", encoding="gbk") as f:

    text = f.readlines()              # 注意每行末尾有换行符

    print(text)    

['临江仙·滚滚长江东逝水\n', '滚滚长江东逝水,浪花淘尽英雄。\n']

with open("三国演义片头曲_gbk.txt", "r", encoding="gbk") as f:     

    for text in f.readlines():                                                   

        print(text)                # 不想换行则用print(text, end="")       

临江仙·滚滚长江东逝水

 

滚滚长江东逝水,浪花淘尽英雄。

4、文本文件读取小结

文件比较大时,read()和readlines()占用内存过大,不建议使用

readline用起来又不太方便

可以直接对读取的对象进行迭代

with open("三国演义片头曲_gbk.txt", "r", encoding="gbk") as f:     

;