Bootstrap

《Python内置函数手册》Python老吕编著

《Python内置函数手册》Python老吕编著

《Python内置函数手册》Python老吕编著

1. 前言

1.1 Python内置函数概述

Python是一种高级的、解释型的编程语言,以其清晰的语法和代码可读性而受到广泛欢迎。Python的内置函数是Python语言核心的一部分,它们不需要导入任何模块即可直接使用。这些函数覆盖了从基本的数学运算到复杂的文件操作等多种功能,极大地方便了程序员的日常工作。

内置函数通常分为以下几类:

  • 数学运算:提供基本的算术运算、幂运算、对数和三角函数等。
  • 类型转换:允许在不同的数据类型之间进行转换,如将字符串转换为整数。
  • 序列操作:对列表、元组、字典和集合等数据结构进行操作。
  • 文件和I/O操作:处理文件的读写和标准输入输出。
  • 字符串处理:包括字符串的格式化、查找、替换、分割和合并等。
  • 日期和时间:获取和格式化日期时间,以及时区处理。
  • 迭代器和生成器:使用迭代器和生成器进行高效的数据迭代。
  • 异常处理:捕获和抛出异常,处理程序中的错误。
  • 模块和包:导入模块和使用包来扩展程序功能。
  • 系统函数和属性:获取系统信息和操作环境变量。
  • 内存管理:涉及内存分配和垃圾回收。
  • 高级函数和装饰器:使用如mapfilter等高级函数,以及装饰器来增强函数功能。
  • 并发和多线程:创建和管理线程,实现程序的并发执行。
  • 网络编程:使用套接字进行网络通信。
  • 正则表达式:使用正则表达式进行字符串的匹配、搜索和替换。
  • Python 3新特性:介绍Python 3相对于Python 2的新增功能和迁移指南。

1.2 如何使用 Python老吕编著的《Python内置函数手册》

《Python内置函数手册》旨在为Python程序员提供一个快速参考和指南,帮助他们了解和使用Python的内置函数。以下是一些使用《Python内置函数手册》的建议:

  • 快速查找:如果你需要快速查找某个特定的内置函数,可以直接浏览到相应的章节。
  • 按需学习:如果你是Python的初学者,可以按照章节顺序逐步学习每个类别的内置函数。
  • 实践应用:在学习每个函数时,尝试编写一些简单的代码示例来加深理解。
  • 参考索引:附录中的内置函数索引可以作为查找特定函数的快速途径。
  • 解决疑问:如果在使用过程中遇到问题,可以查看附录中的常见问题解答部分寻找答案。

使用本手册时,建议结合Python的官方文档和社区资源,以获得更深入的理解和更广泛的应用场景。

2. 数学运算函数

2.1 基本数学运算

基本数学运算包括加、减、乘、除等,Python提供了以下内置函数来执行这些操作:

  • abs(x): 返回x的绝对值。
  • round(x[, n]): 返回x四舍五入后的值,n表示小数点后的位数,默认为0。
  • divmod(a, b): 返回一个包含商和余数的元组(a // b, a % b)。

2.2 幂运算和对数

幂运算允许你计算一个数的幂次方,对数函数则用于计算对数:

  • pow(x, y): 返回xy次幂,也可以使用第三个参数作为模数,即pow(x, y, mod)
  • **: 幂运算符,例如x ** y
  • math.sqrt(x): 返回x的平方根,需要导入math模块。
  • math.log(x[, base]): 返回以base为底x的对数,如果base未指定,则默认为自然对数。

2.3 三角函数

三角函数是数学中处理角度和三角形的函数,Python的math模块提供了以下三角函数:

  • math.sin(x): 返回角x的正弦值,x以弧度为单位。
  • math.cos(x): 返回角x的余弦值。
  • math.tan(x): 返回角x的正切值。
  • math.asin(x): 返回正弦值为x的角度,返回值以弧度为单位。
  • math.acos(x): 返回余弦值为x的角度。
  • math.atan(x): 返回正切值为x的角度。
  • math.atan2(y, x): 返回从x轴到点(x, y)的线段与x轴正半轴的夹角。

使用这些函数时,通常需要先导入math模块,例如使用import math。这些函数可以帮助你进行科学计算和工程问题解决。

3. 类型转换函数

类型转换函数允许你将数据从一种类型转换为另一种类型,这对于处理不同类型的数据至关重要。

3.1 整数转换

整数转换函数可以将其他类型的数据转换为整数类型:

  • int(x[, base]): 将x转换为整数类型。如果x是一个字符串或数字,则直接转换。如果x是一个浮点数,则会截断小数部分。如果指定了base,则x将被视为该进制的数进行转换。

3.2 浮点数转换

浮点数转换函数可以将其他类型的数据转换为浮点数类型:

  • float(x): 将x转换为浮点数类型。如果x是一个整数或字符串,并且字符串表示有效的浮点数,则可以转换。如果xbool类型,True将转换为1.0False将转换为0.0

3.3 字符串转换

字符串转换函数可以将其他类型的数据转换为字符串类型:

  • str(x): 将x转换为字符串类型。几乎所有Python对象都有__str__()方法,该方法定义了对象的字符串表示形式。如果对象没有__str__()方法,将使用__repr__()方法。
  • repr(x): 返回对象的官方字符串表示形式,通常用于调试。如果对象没有__repr__()方法,将回退到使用__str__()

类型转换函数在数据清洗、格式化输出、错误处理等场景中非常有用。例如,当你从用户那里接收输入并需要将其转换为特定类型以进行进一步处理时,类型转换就显得尤为重要。

4. 序列操作函数

序列是Python中的一种基本数据结构,用于存储有序的数据集合。Python内置了多种序列类型,包括列表、元组、字典和集合,每种类型都有其特定的操作函数。

4.1 列表操作

列表是Python中非常灵活的数据结构,可以包含不同类型的元素,并且可以被修改。

  • list(): 将可迭代对象转换为列表。
  • len(s): 返回列表s的长度。
  • min(s): 返回列表s中的最小值。
  • max(s): 返回列表s中的最大值。
  • sorted(s): 返回列表s的新列表,元素按排序顺序排列。
  • sum(s[, start]): 返回列表s中所有元素的总和,可选参数start指定起始值。

4.2 元组操作

元组是不可变序列,一旦创建就不能更改。

  • tuple(): 将可迭代对象转换为元组。
  • len(t): 返回元组t的长度。
  • min(t): 返回元组t中的最小值。
  • max(t): 返回元组t中的最大值。

4.3 字典操作

字典是一种可变的映射类型,存储键值对。

  • dict(): 创建一个新的空字典。
  • len(d): 返回字典d中的元素数量。
  • str(d): 返回字典d的字符串表示形式。
  • repr(d): 返回字典d的官方字符串表示形式,可用于调试。
  • dict.get(key, default): 返回字典中key对应的值,如果key不存在,则返回default
  • dict.keys(): 返回字典中的所有键。
  • dict.values(): 返回字典中的所有值。
  • dict.items(): 返回字典中的所有键值对。

4.4 集合操作

集合是一个无序的不重复元素序列。

  • set(): 创建一个新的空集合。
  • frozenset(): 创建一个不可变集合。
  • len(s): 返回集合s中的元素数量。
  • set.add(x): 向集合s添加元素x
  • set.remove(x): 从集合s中移除元素x
  • set.discard(x): 从集合s中移除元素x,如果x不存在则不抛出异常。
  • set.pop(): 从集合s中移除并返回一个元素,如果集合为空则抛出KeyError
  • set.union(*iterables): 返回一个新的集合,包含s和所有可迭代对象的元素。
  • set.intersection(*iterables): 返回一个新的集合,包含s和其他所有可迭代对象共有的元素。
  • set.difference(*iterables): 返回一个新的集合,包含s中有而其他可迭代对象中没有的元素。
  • set.symmetric_difference(other): 返回一个新的集合,包含sother中不重叠的元素。

这些序列操作函数是处理数据集合的基础,无论是进行数据分析、算法实现还是日常编程任务,它们都是不可或缺的工具。

5. 文件和输入输出

5.1 文件操作

文件操作是编程中常见的任务之一,Python提供了丰富的内置函数来处理文件:

  • open(file, mode): 打开一个文件,并返回文件对象。file是文件名,mode是打开模式,如'r'(只读)、'w'(写入)、'b'(二进制模式)等。
  • read(size): 从文件中读取size个字符,默认为整个文件。
  • readline(): 从文件中读取一行。
  • readlines(): 读取所有行并返回一个列表,每行作为列表的一个元素。
  • write(str): 将字符串str写入文件。
  • writelines(sequence): 将序列中的每个字符串写入文件。
  • seek(offset, whence): 将文件的读取/写入位置移动到指定的偏移量offsetwhence决定如何解释偏移量(0为文件开头,1为当前位置,2为文件末尾)。
  • tell(): 返回当前文件的读取/写入位置。
  • close(): 关闭文件,释放系统资源。
  • isatty(): 如果文件连接到一个终端,返回True
  • fileno(): 返回文件的文件描述符。

5.2 标准输入输出

标准输入输出是程序与用户交互的一种方式,Python提供了以下内置函数:

  • input([prompt]): 从标准输入读取一行,返回一个字符串。如果提供了prompt字符串,则在读取之前输出它。
  • print(*objects, sep=' ', end='\n', file=sys.stdout, flush=False): 将对象发送到标准输出(默认)。sep指定对象之间的分隔符,默认为空格;end指定行尾字符,默认为换行符;file指定输出到哪个文件对象;flush表示是否立即刷新输出。
  • sys.stdin: 标准输入流。
  • sys.stdout: 标准输出流。
  • sys.stderr: 标准错误流,通常用于输出错误信息。

使用文件操作和标准输入输出函数,你可以创建交互式程序,读取用户输入,写入文件,以及从文件中读取数据。这些功能是进行数据处理和自动化任务的基础。

6. 字符串处理函数

字符串是Python中的一种基本数据类型,用于表示文本数据。Python提供了多种内置函数来处理字符串。

6.1 字符串格式化

字符串格式化是将数据转换为字符串并嵌入到文本中的过程:

  • str.format(*args, **kwargs): 使用花括号{}作为占位符,将argskwargs中的值插入到字符串中。
  • f-string (f'{expression}'): Python 3.6+中引入的格式化字符串字面值,允许直接在字符串中嵌入表达式。
  • %-formatting: 使用百分号%进行格式化,例如"Hello, %s" % name

6.2 字符串查找和替换

查找和替换是字符串处理中常见的操作:

  • find(sub): 返回子串sub在字符串中第一次出现的位置,如果不存在则返回-1。
  • index(sub): 类似于find(),但如果子串不存在,则抛出ValueError
  • count(sub): 返回子串sub在字符串中出现的次数。
  • replace(old, new): 返回一个新字符串,其中所有的old子串被替换为new
  • split(sep=None, maxsplit=-1): 按照分隔符sep分割字符串,maxsplit指定最大分割次数,默认为-1表示无限制。

6.3 字符串分割和合并

分割和合并是处理字符串集合的基本操作:

  • join(iterable): 将可迭代对象中的元素以字符串作为连接符连接起来。
  • partition(sub): 将字符串分割成三部分,即(head, sep, tail)sub是分隔符。
  • rpartition(sub): 类似于partition(),但是从右侧开始分割。
  • strip(): 移除字符串开头和结尾的空白字符。
  • rstrip(): 移除字符串结尾的空白字符。
  • lstrip(): 移除字符串开头的空白字符。
  • lower(): 将字符串中的所有大写字母转换为小写字母。
  • upper(): 将字符串中的所有小写字母转换为大写字母。
  • capitalize(): 将字符串的首字母转换为大写,其余字母转换为小写。
  • title(): 将字符串中每个单词的首字母转换为大写。
  • swapcase(): 交换字符串中的大写字母和小写字母。

这些字符串处理函数是文本处理和数据清洗中不可或缺的工具,它们可以帮助你格式化输出、搜索和替换文本、以及分割和合并字符串。

7. 日期和时间函数

日期和时间处理是编程中的一个重要领域,Python 提供了多种内置函数和模块来处理日期和时间。

7.1 日期和时间获取

获取当前的日期和时间是常见的需求,Python 中可以使用以下函数:

  • time.time(): 返回当前时间的时间戳(自1970年1月1日以来的秒数)。
  • time.localtime([secs]): 将时间戳转换为本地时间,如果没有提供时间戳,则使用当前时间。
  • time.gmtime([secs]): 将时间戳转换为格林威治标准时间(UTC)。
  • time.ctime([secs]): 将时间戳转换为可读的字符串格式。
  • datetime.datetime.now(): 返回当前本地日期和时间的datetime对象。
  • datetime.date.today(): 返回当前日期的date对象。

7.2 日期和时间格式化

格式化日期和时间是显示和处理数据时的重要步骤:

  • strftime(format): 将日期时间对象格式化为字符串,format是一个指定格式的字符串。
  • strptime(string[, format]): 将字符串解析为日期时间对象,format指定字符串的日期时间格式。
  • time.strftime(format[, t]): 类似于strftime,但是t是一个时间元组,而不是从gmtimelocaltime获取。
  • datetime.datetime.isoformat(): 返回一个ISO 8601格式的日期时间字符串。

7.3 时区处理

处理不同时区的日期和时间是全球化应用中的常见需求:

  • time.timezone: 表示当前时区的偏移量(东八区为28800秒,即3600*8)。
  • time.altzone: 如果夏令时生效,则表示当前时区的偏移量,否则为None
  • time.tzname: 返回本地时区的名称。
  • datetime.timezone: 一个表示固定偏移的时区的类。
  • pytz: 第三方库,提供了更全面的时区支持。

使用这些日期和时间函数,你可以获取当前日期和时间,将其格式化为易读的字符串,以及处理不同时区的时间转换。这对于日志记录、时间跟踪、计划任务等应用至关重要。

8. 迭代器和生成器

迭代器和生成器是Python中处理数据集合的强大工具,它们允许你以一种非常灵活和高效的方式遍历数据。

8.1 迭代器使用

迭代器是实现了__iter__()__next__()方法的对象,它们允许你使用for循环或next()函数进行迭代。

  • iter(obj): 返回对象obj的迭代器。
  • next(iterable): 返回迭代器的下一个元素。
  • iterable: 任何支持迭代的容器对象,如列表、元组、字典、集合或自定义的迭代器对象。

迭代器协议包含以下方法:

  • __iter__(): 返回迭代器对象本身。
  • __next__(): 返回迭代序列中的下一个元素。

使用迭代器的好处包括:

  • 惰性计算:元素在需要时才生成,节省内存。
  • 可迭代对象:易于使用for循环和其他迭代协议。

8.2 生成器函数

生成器是一种特殊的迭代器,它允许你使用yield语句返回一个值并记住当前函数的状态,以便下次从停止的地方继续执行。

  • yield: 暂停函数的执行并将值返回给调用者,保留当前函数的状态。
  • generator.send(value): 向生成器函数发送一个值,它将成为yield表达式的返回值。
  • generator.close(): 关闭生成器,释放资源。
  • generator.throw(type[, value[, traceback]]): 向生成器抛出一个异常。

生成器的优点包括:

  • 惰性生成:按需生成值,节省内存。
  • 简洁的语法:使用yield可以写出简洁的代码。
  • 状态保持:在生成器函数中保持状态,无需额外的数据结构。

生成器函数示例:

def count_up_to(max):
    count = 1
    while count <= max:
        yield count
        count += 1

# 使用生成器
for number in count_up_to(5):
    print(number)

迭代器和生成器是处理大数据集、实现协程和编写高效循环的有力工具。它们使得Python代码更加简洁、易读和高效。

9. 异常处理

异常处理是程序设计中用于处理程序执行过程中出现的意外情况的一种机制。在Python中,异常处理通过tryexceptelsefinally语句来实现。

9.1 异常捕获

异常捕获允许你捕获并处理可能发生的错误,防止程序因未处理的异常而意外终止。

  • try: 指定一个代码块,在其中尝试执行可能引发异常的代码。
  • except: 捕获try块中发生的异常,并指定一个代码块来处理它。可以同时捕获多种类型的异常。
  • else: 如果try块中没有异常发生,则执行else块中的代码。
  • finally: 无论是否发生异常,都执行finally块中的代码,常用于执行清理工作。

异常捕获示例:

try:
    # 尝试执行的代码
    result = 10 / 0
except ZeroDivisionError:
    # 处理特定异常
    print("不能除以零!")
else:
    # 如果没有异常发生
    print("计算完成。")
finally:
    # 无论是否发生异常都会执行
    print("这是 finally 块。")

9.2 异常抛出

异常抛出用于在检测到错误条件时,主动引发异常,将错误处理的责任转移给调用者。

  • raise: 引发一个指定的异常。可以使用内置异常类型,也可以是用户定义的异常类型。
  • raise-from: 与raise类似,但允许你将一个异常作为原因链到另一个异常。

异常抛出示例:

def divide(x, y):
    if y == 0:
        raise ValueError("除数不能为零。")
    return x / y

try:
    result = divide(10, 0)
except ValueError as e:
    print(e)

使用异常处理的好处包括:

  • 鲁棒性:程序能够优雅地处理错误情况。
  • 可维护性:集中处理错误,使主逻辑更清晰。
  • 用户友好:提供有用的错误信息,改善用户体验。

正确使用异常处理可以提高程序的稳定性和可靠性,同时使得错误处理更加灵活和强大。

10. 模块和包

模块和包是Python中代码组织和重用的基本单元。模块是包含Python定义和语句的文件,而包则是包含多个模块的层次结构。

10.1 模块导入

导入模块允许你使用其他文件中定义的函数、类和变量。

  • import module_name: 导入指定的模块。
  • import module_name as alias: 导入模块,并为其设置别名,以缩短名称或避免命名冲突。
  • from module_name import object_name: 从模块中导入特定的函数、类或变量。
  • from module_name import *: 导入模块中定义的所有对象(不推荐,因为它可能导致命名冲突)。

模块导入示例:

# 导入整个模块
import math

# 使用模块中的功能
print(math.sqrt(16))

# 导入模块并设置别名
import math as m
print(m.sqrt(16))

# 从模块中导入特定函数
from math import sqrt
print(sqrt(16))

# 从模块中导入所有名称(不推荐)
from math import *
print(sqrt(16))

10.2 包的使用

包是包含多个模块的目录,它们允许你组织大型应用程序。

  • 创建包:创建一个包含__init__.py文件的目录,该文件可以为空,但它告诉Python这个目录应该被视为包。
  • 包的导入:与模块导入类似,但路径需要反映包的层次结构。

包的使用示例:

# 假设有一个名为 `package` 的包,里面有一个名为 `module` 的模块

# 导入包中的模块
from package import module

# 使用模块中的功能
module.some_function()

# 导入包中的特定函数
from package.module import some_function
some_function()

使用模块和包的好处包括:

  • 代码组织:将代码组织成逻辑单元,提高可读性和可维护性。
  • 重用性:允许在不同项目中重用代码。
  • 命名空间管理:通过别名和从模块中导入特定名称,避免命名冲突。

正确使用模块和包可以提高代码的模块化程度,使得代码更加易于管理和扩展。

11. 系统函数和属性

系统函数和属性允许Python程序与操作系统交互,获取系统信息,以及操作环境变量。

11.1 系统信息获取

获取系统信息是许多应用程序的基本需求,Python提供了一些内置模块来实现这一点:

  • platform模块:提供了许多函数来获取有关操作系统和硬件的信息。

    • platform.system(): 返回操作系统的名称。
    • platform.release(): 返回操作系统的发行版本。
    • platform.machine(): 返回机器的类型(如x86_64)。
    • platform.python_version(): 返回Python解释器的版本。
  • os模块:提供了许多函数来与操作系统交互。

    • os.name: 返回正在使用的操作系统的名称(‘posix’, ‘nt’, 'java’等)。
    • os.uname(): 返回一个包含系统信息的元组。

系统信息获取示例:

import platform

# 获取操作系统名称
print(platform.system())

# 获取Python版本
print(platform.python_version())

import os

# 检查操作系统类型
print(os.name)

11.2 环境变量操作

环境变量是存储在操作系统中的变量,通常用于配置应用程序的运行环境。

  • os.environ: 一个代表当前用户环境变量的字典对象。
    • os.environ['VAR_NAME']: 获取名为VAR_NAME的环境变量的值。
    • os.environ['VAR_NAME'] = 'value': 设置环境变量VAR_NAME的值为value

环境变量操作示例:

import os

# 获取环境变量的值
path = os.environ.get('PATH')

# 设置环境变量
os.environ['MY_VARIABLE'] = 'some_value'

# 输出环境变量
print(f'PATH: {path}')
print(f'MY_VARIABLE: {os.environ["MY_VARIABLE"]}')

使用系统函数和属性的好处包括:

  • 系统兼容性:编写能够适应不同操作系统的程序。
  • 配置灵活性:通过环境变量提供配置选项,而无需修改代码。
  • 信息获取:获取必要的系统信息,以适应不同的运行环境。

正确使用系统函数和属性可以提高程序的可移植性和灵活性,同时使得程序能够更好地适应不同的运行环境。

12. 内存管理

内存管理是编程中的一个重要方面,尤其是在资源受限的环境中。Python提供了一些工具和函数来帮助开发者理解和控制内存使用。

12.1 内存分配

内存分配涉及到为程序的数据结构和变量分配内存空间。在Python中,内存分配通常是自动管理的,但开发者可以通过以下方式进行一些基本的内存管理:

  • 数据结构选择:选择适当的数据结构可以减少内存使用。例如,列表(list)比元组(tuple)更灵活,但可能占用更多内存,因为它们是可变的。
  • 对象创建:在Python中创建对象会自动分配内存。使用局部变量而不是全局变量可以减少内存占用,因为局部变量的生命周期更短。
  • 内存分析工具:使用像tracemalloc这样的库可以帮助追踪内存分配和查找内存泄漏。

内存分配示例(使用tracemalloc):

import tracemalloc

tracemalloc.start()

# 进行一些内存分配操作
a = [1] * 1000000  # 分配一个大列表

current, peak = tracemalloc.get_traced_memory()
print(f'当前内存使用: {current} 字节')
print(f'峰值内存使用: {peak} 字节')

tracemalloc.stop()

12.2 垃圾回收

Python使用自动垃圾回收来管理内存,主要通过引用计数和垃圾收集器来实现:

  • 引用计数:每个对象都有一个引用计数,当引用计数降到0时,对象占用的内存会被释放。
  • 垃圾收集器:Python的垃圾收集器可以识别并清除循环引用,这些循环引用无法通过引用计数来释放。
  • gc模块:提供了垃圾收集功能和与垃圾回收相关的实用工具。

垃圾回收示例(使用gc模块):

import gc

# 启用垃圾收集
gc.enable()

# 禁用垃圾收集
gc.disable()

# 手动触发垃圾收集
gc.collect()

# 获取垃圾收集器的状态
print(gc.isenabled())
print(gc.get_count())

# 清理循环引用
class A:
    def __init__(self, b):
        self.b = b

class B:
    def __init__(self, a):
        self.a = a

a = A(B(a))  # 创建循环引用
del a  # 删除引用,但循环引用仍然存在

# 触发垃圾收集以清理循环引用
gc.collect()

使用内存管理的好处包括:

  • 优化性能:通过减少不必要的内存使用,提高程序的性能。
  • 避免内存泄漏:通过垃圾回收机制,防止内存泄漏导致的性能问题。
  • 资源效率:在资源受限的环境中,有效的内存管理可以延长设备的使用寿命。

正确使用内存管理工具和策略可以提高程序的效率和稳定性,尤其是在处理大量数据或长时间运行的应用程序时。

13. 高级函数和装饰器

高级函数和装饰器是Python中的两个强大特性,它们可以提高代码的可读性、复用性和灵活性。

13.1 高级函数使用

高级函数是一些接受函数作为参数或返回函数作为结果的函数。Python提供了几个内置的高级函数:

  • map(function, iterable, ...): 将给定的函数应用于可迭代对象的每个元素,并返回一个新的迭代器。
  • filter(function, iterable): 将给定的函数应用于可迭代对象的每个元素,只返回使得函数返回True的元素。
  • reduce(function, iterable[, initializer]): 将一个二元操作函数累计地应用到元素上,返回一个单一的结果。
  • all(iterable): 如果可迭代对象中的所有元素都为True,则返回True。
  • any(iterable): 如果可迭代对象中至少有一个元素为True,则返回True。

高级函数使用示例:

numbers = [1, 2, 3, 4, 5]

# 使用map函数将列表中的每个数字平方
squared = map(lambda x: x**2, numbers)
print(list(squared))

# 使用filter函数筛选出大于2的数字
filtered = filter(lambda x: x > 2, numbers)
print(list(filtered))

# 使用all函数检查所有数字是否都大于0
print(all(numbers))

# 使用any函数检查是否有数字大于0
print(any(numbers))

13.2 装饰器应用

装饰器是一种设计模式,用于修改或增强函数、方法或类的行为,而不需要改变其本身的代码。

  • 使用@decorator_name语法将装饰器应用于函数或方法。
  • 装饰器本质上是一个返回函数的函数。

装饰器应用示例:

def my_decorator(func):
    def wrapper():
        print("Something before")
        func()
        print("Something after")
    return wrapper

@my_decorator
def say_hello():
    print("Hello!")

say_hello()

使用装饰器的好处包括:

  • 代码复用:通过装饰器,可以在多个函数之间共享功能。
  • 功能解耦:将功能逻辑从业务逻辑中分离出来,提高代码的模块化。
  • 动态修改行为:可以在不修改函数本身的情况下,动态地修改其行为。

正确使用高级函数和装饰器可以使代码更加简洁、灵活和易于维护。

14. 并发和多线程

并发和多线程编程是提高程序性能和响应能力的重要方式,尤其是在多核处理器上。Python提供了一些工具和模块来支持并发和多线程编程。

14.1 线程创建和管理

Python的threading模块使得线程的创建和管理变得简单:

  • threading.Thread(group=None, target=None, name=None, args=(), kwargs={}): 创建一个新线程,target是线程将要运行的函数,argskwargs是传递给该函数的参数。
  • start(): 启动线程的运行。
  • join([timeout]): 等待线程终止,timeout是可选的超时时间。
  • is_alive(): 返回线程是否仍然活跃。
  • getName(): 返回线程的名称。
  • setName(): 设置线程的名称。

线程创建和管理示例:

import threading
import time

def print_numbers():
    for i in range(1, 6):
        print(i)
        time.sleep(1)

# 创建线程
thread = threading.Thread(target=print_numbers)

# 启动线程
thread.start()

# 等待线程结束
thread.join()

print("线程执行完毕。")

14.2 线程同步

由于线程之间共享内存空间,因此需要同步机制来避免竞态条件和数据不一致的问题:

  • threading.Lock(): 创建一个锁对象,用于线程同步。
  • acquire(): 获取锁,如果锁被其他线程占用,则等待。
  • release(): 释放锁。
  • threading.RLock(): 可重入锁,允许同一线程多次获取同一个锁。
  • threading.Semaphore(value=1): 信号量,用于控制一定数量的线程访问某个资源。
  • threading.Condition(): 条件变量,允许线程在某些条件不满足时挂起,并在条件满足时唤醒。

线程同步示例(使用锁):

import threading

# 共享资源
shared_resource = 0

# 锁
lock = threading.Lock()

def modify_resource():
    global shared_resource
    with lock:  # 进入同步块
        local_copy = shared_resource
        local_copy += 1
        time.sleep(0.1)  # 模拟长时间运算
        shared_resource = local_copy

# 创建线程列表
threads = []
for _ in range(10):
    thread = threading.Thread(target=modify_resource)
    threads.append(thread)
    thread.start()

# 等待所有线程完成
for thread in threads:
    thread.join()

print(f"最终资源值: {shared_resource}")

使用并发和多线程的好处包括:

  • 提高性能:通过并行执行任务,提高程序的执行效率。
  • 改善响应性:在执行长时间运行的任务时,保持应用程序的响应性。
  • 资源利用:更好地利用多核处理器的计算能力。

正确使用线程创建和管理以及线程同步机制,可以构建高效、可靠的并发应用程序。

15. 网络编程

网络编程是允许程序与远程计算机或设备进行通信的技术。Python提供了丰富的库来支持网络编程,包括用于底层网络通信的套接字编程和更高级的网络通信功能。

15.1 套接字编程

套接字是网络通信的端点,Python的socket模块提供了创建和使用套接字的功能:

  • socket.socket_family: 指定套接字家族(如IPv4的AF_INET)。
  • socket.socket_type: 指定套接字类型(如流式套接字的SOCK_STREAM)。
  • socket.gethostbyname(host): 将主机名转换为对应的IP地址。
  • `socket.socket()``: 创建一个新的套接字对象。

套接字编程示例(创建服务器):

import socket

# 创建套接字对象
server_socket = socket.socket(socket.AF_INET, socket.SOCK_STREAM)

# 绑定地址和端口
server_socket.bind(('localhost', 12345))

# 监听连接
server_socket.listen(5)

while True:
    # 接受客户端连接
    client_socket, addr = server_socket.accept()
    print(f"连接地址: {addr}")

    # 接收数据
    data = client_socket.recv(1024)
    print(f"收到数据: {data.decode()}")

    # 发送数据
    client_socket.sendall(b'收到你的数据')

    # 关闭连接
    client_socket.close()

15.2 网络通信

除了底层的套接字编程,Python还提供了用于网络通信的高级库和模块:

  • http.client: 用于发送HTTP请求。
  • ftplib: 用于与FTP服务器交互。
  • smtplib: 用于发送SMTP邮件。
  • urllib.request: 用于处理URL请求。

网络通信示例(使用http.client发送HTTP请求):

import http.client
import json

# 创建连接对象
conn = http.client.HTTPSConnection("api.example.com")

# 发送GET请求
conn.request("GET", "/resource")

# 获取响应
response = conn.getresponse()
print(response.status, response.reason)

# 读取数据
data = response.read()
print(json.loads(data.decode()))

# 关闭连接
conn.close()

使用网络编程的好处包括:

  • 远程访问:能够访问远程服务器和资源。
  • 数据交换:与Web服务和其他网络应用进行数据交换。
  • 分布式系统:构建分布式应用程序和服务。

正确使用网络编程技术可以构建强大的网络应用,实现数据的远程访问和交换。

16. 正则表达式

正则表达式是一种强大的文本处理工具,用于搜索、替换、切割和分析字符串。Python 的 re 模块提供了丰富的正则表达式功能。

16.1 正则表达式匹配

匹配操作用于确定一个字符串是否符合某个正则表达式模式:

  • re.match(pattern, string): 从字符串的开始位置匹配模式,如果匹配成功返回匹配对象,否则返回None
  • re.search(pattern, string): 扫描字符串,寻找第一个位置的匹配,匹配成功返回匹配对象。
  • re.fullmatch(pattern, string): 要求整个字符串符合正则表达式模式。
  • re.findall(pattern, string): 查找字符串中所有匹配的模式,并返回它们作为列表。
  • re.finditer(pattern, string): 返回一个迭代器,每次迭代返回一个匹配对象。

正则表达式匹配示例:

import re

# 匹配简单的模式
match = re.match(r'Hello', 'Hello, World!')
if match:
    print(f"匹配起始位置: {match.start()}")

# 搜索任意位置的匹配
search = re.search(r'\d+', '123 abc 456')
if search:
    print(f"找到数字: {search.group()}")

# 查找所有匹配项
findalls = re.findall(r'\b\w+\b', 'Hello World. This is a test.')
print(findalls)  # 输出: ['Hello', 'World', 'This', 'is', 'a', 'test']

# 迭代所有匹配项
for match in re.finditer(r'\w+', 'Hello World.'):
    print(f"匹配: {match.group()}")

16.2 正则表达式搜索和替换

搜索和替换操作允许你查找字符串中符合正则表达式的部分,并进行替换:

  • re.sub(pattern, repl, string): 在字符串中查找所有匹配的模式,并用repl替换它们。
  • re.subn(pattern, repl, string): 类似于re.sub,但返回一个元组,包含替换后的字符串和替换次数。

正则表达式搜索和替换示例:

import re

# 替换操作
sub_result = re.sub(r'\b\w+\b', '[WORD]', 'Hello World. This is a test.')
print(sub_result)  # 输出: [WORD] [WORD]. [WORD] [WORD] [WORD] [WORD]

# 替换并返回替换次数
subn_result, count = re.subn(r'\d+', 'NUM', '123 abc 456')
print(subn_result, count)  # 输出: NUM abc NUM 2

使用正则表达式的好处包括:

  • 模式匹配:能够识别和处理复杂的文本模式。
  • 灵活性:正则表达式提供了高度的灵活性,可以适应各种文本处理需求。
  • 效率:对于复杂的文本匹配任务,正则表达式通常比简单的字符串操作更高效。

正确使用正则表达式可以极大地提高文本处理的能力和效率。

17. Python 3 新特性

Python 3 相对于 Python 2 引入了许多新特性和改进,包括语法的更新、性能的提升和库的改进。

17.1 新增函数和特性

Python 3 中的一些重要新增函数和特性包括:

  • 字典推导式:允许快速创建字典。
    {key: value for (key, value) in iterable}
    
  • 集合推导式:允许快速创建集合。
    {element for element in iterable}
    
  • 函数注解:允许为函数参数和返回值添加类型提示。
    def complex_function(a: int, b: str) -> bool:
        pass
    
  • 新的print()函数print()现在是函数,而不是语句。
    print("Hello, World!", end="")
    
  • bytesstr类型区分:Python 3 中,字符串默认为 Unicode,字节数据使用bytes类型。
    s = "Hello"  # str
    b = b"Hello"  # bytes
    
  • //运算符:整数除法,结果向下取整。
    result = 7 // 3  # 结果为2
    
  • 新的math模块函数:如math.isclose()用于比较两个数是否足够接近。
  • 新增的collections模块:提供了defaultdictOrderedDictCounter等有用的容器类型。
  • 新增的itertools模块功能:如accumulate()函数。

17.2 Python 2 到 Python 3 的迁移指南

从 Python 2 迁移到 Python 3 需要注意以下几个方面:

  • 语法变化:Python 3 中许多语法已经改变,如print()函数、异常捕获语法等。
  • Unicode支持:Python 3 默认使用 Unicode,需要确保字符串处理正确处理 Unicode 字符。
  • 整数除法:Python 2 中的除法在两个整数之间会得到一个浮点数,而在 Python 3 中,整数除法会进行向下取整。
  • 库的变化:一些库在 Python 3 中已经被废弃或替换,需要更新为新的库或模块。
  • 模块重命名:一些模块在 Python 3 中被重命名,如urlliburllib2urlparse模块的变化。
  • 异常处理except语句的语法在 Python 3 中有所改变,需要使用except SomeException as e的形式。
  • 迭代器和生成器:Python 3 改进了迭代器和生成器的语法和性能。

迁移示例(Python 2 到 Python 3):

# Python 2
for key, value in dict.iteritems():
    print key, value

# Python 3
for key, value in dict.items():
    print(key, value)

使用 Python 3 的好处包括:

  • 现代化的语言特性:Python 3 引入了许多新的语言特性,使得代码更加简洁和易于理解。
  • 更好的性能:Python 3 在许多方面提供了性能上的改进。
  • 持续的社区支持:Python 3 是活跃的开发版本,得到了社区的持续支持和更新。

正确使用 Python 3 的新特性和遵循迁移指南,可以帮助开发者编写更高效、更现代的 Python 代码。

18. 附录

18.1 Python内置函数大全表(索引)

Python内置函数大全表(索引)提供了一个快速参考,列出了Python中所有内置函数及其简要说明。

  • abs(): 返回数的绝对值。
  • all(): 如果迭代器中所有元素都为真,则返回True。
  • any(): 如果迭代器中至少有一个元素为真,则返回True。
  • ascii(): 返回对象的字符串表示,类似于repr()
  • bin(): 将整数转换为二进制表示的字符串。
  • bool(): 将值转换为布尔类型。
  • bytearray(): 创建可变的字节序列。
  • bytes(): 创建不可变的字节序列。
  • callable(): 检查对象是否是可调用的。
  • chr(): 将整数转换为对应的Unicode字符。
  • classmethod(): 用作类方法的装饰器。
  • compile(): 编译源代码或字符串为代码或字节码对象。
  • complex(): 创建一个值为realimag的复数。
  • delattr(): 删除对象的属性。
  • dict(): 创建一个新字典。
  • dir(): 返回对象的属性和方法列表。
  • divmod(): 返回除法和取模的元组。
  • enumerate(): 将可迭代对象组合为枚举对象。
  • eval(): 计算字符串中的有效Python表达式,并返回结果。
  • exec(): 执行存储在字符串或对象中的Python代码。
  • filter(): 使用函数过滤迭代器,并返回结果。
  • float(): 将值转换为浮点数。
  • format(): 格式化对象。
  • frozenset(): 创建不可变的集合。
  • getattr(): 从对象中获取属性值。
  • globals(): 返回当前全局符号表的字典。
  • hasattr(): 检查对象是否有指定的属性或方法。
  • hash(): 返回对象的哈希值。
  • help(): 执行帮助系统。
  • hex(): 将整数转换为十六进制字符串。
  • id(): 返回对象的身份。
  • input(): 从标准输入读取一行。
  • int(): 将值转换为整数。
  • isinstance(): 检查对象是否是类的实例。
  • issubclass(): 检查一个类是否是另一个类的子类。
  • iter(): 返回对象的迭代器。
  • len(): 返回对象的长度。
  • list(): 将可迭代对象转换为列表。
  • locals(): 返回当前局部符号表的字典。
  • map(): 将函数应用于可迭代对象的每个元素,并返回结果。
  • max(): 返回可迭代对象中的最大值。
  • memoryview(): 返回对象的内存视图。
  • min(): 返回可迭代对象中的最小值。
  • next(): 从迭代器返回下一个项目。
  • object(): 用于创建对象的基类。
  • oct(): 将整数转换为八进制字符串。
  • open(): 打开文件并返回文件对象。
  • ord(): 将单个字符转换为它的整数值。
  • pow(): 返回x的y次幂。
  • print(): 打印对象。
  • property(): 用于创建托管属性。
  • range(): 创建一个整数序列。
  • repr(): 返回对象的官方字符串表示。
  • reversed(): 反转可迭代对象。
  • round(): 四舍五入到指定的小数位数。
  • set(): 创建一个新集合。
  • setattr(): 设置对象的属性值。
  • slice(): 创建一个切片对象。
  • sorted(): 返回可迭代对象的新排序列表。
  • staticmethod(): 用作静态方法的装饰器。
  • str(): 将对象转换为字符串。
  • sum(): 求和可迭代对象中的元素。
  • super(): 返回表示超级对象的代理。
  • tuple(): 将可迭代对象转换为元组。
  • type(): 返回对象的类型。
  • vars(): 返回对象的__dict__属性。
  • zip(): 将多个可迭代对象压缩成一个元组列表。

18.2 常见问题解答

常见问题解答部分提供了对Python编程中常见问题及其解决方案的快速访问。

  • Q: 如何在Python中进行异常处理?
    A: 使用tryexcept语句来捕获和处理异常。使用finally语句来执行无论是否发生异常都需要执行的代码。

  • Q: 如何在Python中实现多线程编程?
    A: 使用threading模块创建线程对象,并通过调用它们的start()方法来启动线程。

  • Q: 如何在Python中使用正则表达式?
    A: 使用re模块提供的函数,如re.match()re.search()re.findall()等,来进行正则表达式匹配和搜索。

  • Q: 如何在Python中进行内存管理?
    A: 利用gc模块提供的垃圾回收功能,以及使用适当的数据结构和算法来减少内存使用。

  • Q: 如何在Python 3中处理Python 2的代码?
    A: 使用2to3工具将Python 2代码转换为Python 3代码,并根据迁移指南更新语法和库的使用。

  • Q: 如何在Python中实现网络编程?
    A: 使用socket模块进行底层网络通信,或使用http.clientftplib等模块进行特定协议的网络操作。

  • Q: 如何在Python中实现装饰器?
    A: 定义一个包装函数,它返回另一个函数,并在调用原始函数之前和/之后执行额外的代码。

  • Q: 如何在Python中使用生成器?
    A: 使用yield语句定义一个生成器函数,并使用next()函数或for循环来迭代生成的值。

  • Q: 如何在Python中处理并发和异步编程?
    A: 使用asyncio模块来编写单线程并发代码,使用awaitasync关键字来定义和调用异步函数。

通过这些索引和解答,Python开发者可以快速找到解决问题的方法,提高编程效率。

;