Bootstrap

搬砖15、Python图像和办公文档处理

Python图像和办公文档处理

用程序来处理图像和办公文档经常出现在实际开发中,Python的标准库中虽然没有直接支持这些操作的模块,但我们可以通过Python生态圈中的第三方模块来完成这些操作。

操作图像

计算机图像相关知识
  1. 颜色。如果你有使用颜料画画的经历,那么一定知道混合红、黄、蓝三种颜料可以得到其他的颜色,事实上这三种颜色就是被我们称为美术三原色的东西,它们是不能再分解的基本颜色。在计算机中,我们可以将红、绿、蓝三种色光以不同的比例叠加来组合成其他的颜色,因此这三种颜色就是色光三原色,所以我们通常会将一个颜色表示为一个RGB值或RGBA值(其中的A表示Alpha通道,它决定了透过这个图像的像素,也就是透明度)。

    名称RGBA值名称RGBA值
    White(255, 255, 255, 255)Red(255, 0, 0, 255)
    Green(0, 255, 0, 255)Blue(0, 0, 255, 255)
    Gray(128, 128, 128, 255)Yellow(255, 255, 0, 255)
    Black(0, 0, 0, 255)Purple(128, 0, 128, 255)
  2. 像素。对于一个由数字序列表示的图像来说,最小的单位就是图像上单一颜色的小方格,这些小方块都有一个明确的位置和被分配的色彩数值,而这些一小方格的颜色和位置决定了该图像最终呈现出来的样子,它们是不可分割的单位,我们通常称之为像素(pixel)。每一个图像都包含了一定量的像素,这些像素决定图像在屏幕上所呈现的大小。

用Pillow操作图像

Pillow是由从著名的Python图像处理库PIL发展出来的一个分支,通过Pillow可以实现图像压缩和图像处理等各种操作。可以使用下面的命令来安装Pillow。

pip install pillow

Pillow中最为重要的是Image类,读取和处理图像都要通过这个类来完成。

>>> from PIL import Image
>>>
>>> image = Image.open('./res/guido.jpg')
>>> image.format, image.size, image.mode
('JPEG', (500, 750), 'RGB')
>>> image.show()
  1. 剪裁图像

    >>> image = Image.open('./res/guido.jpg')
    >>> rect = 80, 20, 310, 360
    >>> image.crop(rect).show()
    
  2. 生成缩略图

    >>> image = Image.open('./res/guido.jpg')
    >>> size = 128, 128
    >>> image.thumbnail(size)
    >>> image.show()
    
  3. 缩放和黏贴图像

    >>> image1 = Image.open('./res/luohao.png')
    >>> image2 = Image.open('./res/guido.jpg')
    >>> rect = 80, 20, 310, 360
    >>> guido_head = image2.crop(rect)
    >>> width, height = guido_head.size
    >>> image1.paste(guido_head.resize((int(width / 1.5), int(height / 1.5))), (172, 40))
    
  4. 旋转和翻转

    >>> image = Image.open('./res/guido.png')
    >>> image.rotate(180).show()
    >>> image.transpose(Image.FLIP_LEFT_RIGHT).show()
    
  5. 操作像素

    >>> image = Image.open('./res/guido.jpg')
    >>> for x in range(80, 310):
    ...     for y in range(20, 360):
    ...         image.putpixel((x, y), (128, 128, 128))
    ... 
    >>> image.show()
    
  6. 滤镜效果

    >>> from PIL import Image, ImageFilter
    >>>
    >>> image = Image.open('./res/guido.jpg')
    >>> image.filter(ImageFilter.CONTOUR).show()
    

处理Excel电子表格

Python的openpyxl模块让我们可以在Python程序中读取和修改Excel电子表格,当然实际工作中,我们可能会用LibreOffice Calc和OpenOffice Calc来处理Excel的电子表格文件,这就意味着openpyxl模块也能处理来自这些软件生成的电子表格。关于openpyxl的使用手册和使用文档可以查看它的官方文档

处理Word文档

利用python-docx模块,Pytho 可以创建和修改Word文档,当然这里的Word文档不仅仅是指通过微软的Office软件创建的扩展名为docx的文档,LibreOffice Writer和OpenOffice Writer都是免费的字处理软件。

处理PDF文档

PDF是Portable Document Format的缩写,使用.pdf作为文件扩展名。接下来我们就研究一下如何通过Python实现从PDF读取文本内容和从已有的文档生成新的PDF文件。

跟视频学习

import os
import time

'''
角色管理:姓名,性别,职业
    进入管理系统
    添加角色
    删除角色
    修改角色
    查询角色:   单个角色查询输一个人名,找到角色相关的介绍
                遍历角色,显示所有角色
    退出管理系统
'''
print('***************欢迎来到王者荣耀****************')
# name = input('请输入管理员账号:')
# while True:
#     if (name.isdigit() and len(name) == 11) or (name.islower() and len(name) >= 6):
#         password = input('请输入密钥:')
#         if password.isdigit() and len(password) == 6:
#             if (name == 'admin123' or name == '15811119999') and password == '202409':
#                 break
#             else:
#                 print('登录失败,请重新登录')
#                 name = input('请输入用户名/手机号码:')
#         else:
#             password = input('密码格式错误,请重新输入密码:')
#     else:
#         name = input('输入用户名/手机号码格式有误,请重新输入:')
# print('恭喜您,登陆成功,进入管理系统!')

box = '''
管理选项,依据类型选择管理项:
    1:添加角色;
    2:删除角色;
    3:修改角色;
    4:查询角色;
    5:退出管理系统。
'''
# playlist = [name, man, play]
all_role = []
while True:
    print(box)
    flag = input('请输入管理选项:')
    if flag == '1':
        print('添加角色模块:\n')
        name = input('姓名:')
        sex = input('性别:')
        job = input('职业:')
        role = [name, sex, job]
        # 将角色添加到大的容器中
        all_role.append(role)

        print('***成功添加添加角色: {}\n'.format(role))
    elif flag == '2':
        print('删除角色模块:\n')
        role_name = input('输入角色名称:')
        for role in all_role:
            if role_name in role:
                answer = input('是否删除角色Y/N:')
                if answer == 'Y':
                    all_role.remove(role)
                else:
                    print('不删除角色"{}"角色OK \n'.format(role_name))
                break
        else:  # 本系统不存在的角色,跳出进行提示
            print('角色“{}”不存在\n'.format(role_name))
    elif flag == '3':
        pass
        # name = input('姓名:')
        # sex = input('性别:')
        # job = input('职业:')
        # # 通过 index找到位置,,直接修改即可
        # all_role[all_role.index(role)] = [name, sex, job]
        # print('删除角色"{}"角色OK \n'.format(role_name))
    elif flag == '4':
        print('显示所有角色模块:')
        for role in all_role:
            print('{}\t{}\t{}\t\n'.format(role[0].center(10), role[1].center(10), role[2]).center(10))
    elif flag == '5':
        # 时间等待
        time.sleep(3)
        break
    else:
        break

members = {
    'account1': 13,
    'account2': 12,
    'account3': 15,
}

for account, level in members.items():
    print(f'account:{account}, level:{level}')

# 创建集合的字面量语法,Python中的集合跟数学上的集合是一致的,不允许有重复元素,而且可以进行交集、并集、差集等运算。
set1 = {1, 2, 3, 3, 3, 2}
print(set1)

# 创建字典的字面量语法
scores = {'YJW': 95, '白元芳': 78, '狄仁杰': 82}
print(scores)
# 创建字典的构造器语法
items1 = dict(one=1, two=2, three=3, four=4)
# 通过zip函数将两个序列压成字典
items2 = dict(zip(['a', 'b', 'c'], '123'))
# 创建字典的推导式语法
items3 = {num: num ** 2 for num in range(1, 10)}
print(items1, items2, items3)
# 通过键可以获取字典中对应的值
print(scores['YJW'])
print(scores['狄仁杰'])
# 对字典中所有键值对进行遍历
for key in scores:
    print(f'{key}: {scores[key]}')
# 更新字典中的元素
scores['白元芳'] = 65
scores['诸葛王朗'] = 71
scores.update(冷面=67, 方启鹤=85)
print(scores)
if '武则天' in scores:
    print(scores['武则天'])
print(scores.get('武则天'))
# get方法也是通过键获取对应的值但是可以设置默认值
print(scores.get('武则天', 60))
# 删除字典中的元素
print(scores.popitem())
print(scores.popitem())
print(scores.pop('YJW', 100))
# 清空字典
scores.clear()
print(scores)

import os

'''
books = [],能放多本书
书:{}
书名 作者 价格
1、添加书
    不能添加同名书
    [{书名:‘aaa’……},{书名:‘aaa’……},{书名:‘aaa’……}]
'''

books = []

while True:
    answer = input('是否要添加书籍?(y、n)')
    if answer == 'y':
        book, name, money = input('书名作者价格:')
        for book1 in books:
            if book == book1.get('name'):
                print('书名重复!!!')
            else:
                books.append({
                    'book': book,
                    'name': name,
                    'money': money})
        print(books)
    else:
        break

;