Bootstrap

Python字符串 转义符正则表达

python基础回顾

BIF Build-In Function 内置函数可以方便快速编写脚本程序。
在IDLE中输入dir(__builtins__)可以看到python的内置函数

>>> dir(__builtins__)
['ArithmeticError', 'AssertionError', 'AttributeError', 'BaseException', 'BlockingIOError', 'BrokenPipeError', 'BufferError', 'BytesWarning', 'ChildProcessError', 'ConnectionAbortedError', 'ConnectionError', 'ConnectionRefusedError', 'ConnectionResetError', 'DeprecationWarning', 'EOFError', 'Ellipsis', 'EncodingWarning', 'EnvironmentError', 'Exception', 'False', 'FileExistsError', 'FileNotFoundError', 'FloatingPointError', 'FutureWarning', 'GeneratorExit', 'IOError', 'ImportError', 'ImportWarning', 'IndentationError', 'IndexError', 'InterruptedError', 'IsADirectoryError', 'KeyError', 'KeyboardInterrupt', 'LookupError', 'MemoryError', 'ModuleNotFoundError', 'NameError', 'None', 'NotADirectoryError', 'NotImplemented', 'NotImplementedError', 'OSError', 'OverflowError', 'PendingDeprecationWarning', 'PermissionError', 'ProcessLookupError', 'RecursionError', 'ReferenceError', 'ResourceWarning', 'RuntimeError', 'RuntimeWarning', 'StopAsyncIteration', 'StopIteration', 'SyntaxError', 'SyntaxWarning', 'SystemError', 'SystemExit', 'TabError', 'TimeoutError', 'True', 'TypeError', 'UnboundLocalError', 'UnicodeDecodeError', 'UnicodeEncodeError', 'UnicodeError', 'UnicodeTranslateError', 'UnicodeWarning', 'UserWarning', 'ValueError', 'Warning', 'ZeroDivisionError', '_', '__build_class__', '__debug__', '__doc__', '__import__', '__loader__', '__name__', '__package__', '__spec__', 'abs', 'aiter', 'all', 'anext', 'any', 'ascii', 'bin', 'bool', 'breakpoint', 'bytearray', 'bytes', 'callable', 'chr', 'classmethod', 'compile', 'complex', 'copyright', 'credits', 'delattr', 'dict', 'dir', 'divmod', 'enumerate', 'eval', 'exec', 'exit', 'filter', 'float', 'format', 'frozenset', 'getattr', 'globals', 'hasattr', 'hash', 'help', 'hex', 'id', 'input', 'int', 'isinstance', 'issubclass', 'iter', 'len', 'license', 'list', 'locals', 'map', 'max', 'memoryview', 'min', 'next', 'object', 'oct', 'open', 'ord', 'pow', 'print', 'property', 'quit', 'range', 'repr', 'reversed', 'round', 'set', 'setattr', 'slice', 'sorted', 'staticmethod', 'str', 'sum', 'super', 'tuple', 'type', 'vars', 'zip']

python字符串

python变量variable并没有把值存储在变量中,而是把名字“贴”在值的上边。

  • 使用变量前需要对变量进行赋值
  • 变量名不能以数字开头,可以由字母、数字、下划线组成。大小写敏感。

字符串是python中最为常用的数据类型之一。可以用""''包裹python的字符串。在字符串中间使用\作为转义字符也可以在字符串之前加一个英文字母r表示原始字符串。但需要注意的是无论是原始字符串还是转义字符都不能以\作为结尾。
""" content """,可以保留多行输入字符串的格式。

>>> string = 'C:\now'
>>> print(string)
C:
ow
>>> string = 'C:\\now'
>>> print(string)
C:\now
>>> string = r'C:\now'
>>> string
'C:\\now'
>>> print(string)
C:\now
符号描述
%c格式化字符及其ASCII码
%s格式化字符串
%d格式化整型
%u格式化无符号整型
%o格式化无符号八进制
%x格式化无符号十六进制
%X格式化无符号十六进制
%f格式化浮点数字,可指定小数点后的精度
%e用科学计数法格式化浮点数
%E上同,用科学计数法格式化浮点数
%g根据值的大小决定使用%f或%e
%G上同,根据值的大小决定使用%f或%e
%p用十六进制数格式化变量的地址
%%如果要在字符串中输出“%”,需要使用“%%”
#格式化字符串
str1 = "version"
num = 1.0
format = "%s %d"%(str1,num)
print(format)

out:
str1 = "version"...
version 1
#带精度的格式化
print("浮点型数字:%f" %1.25)
print("浮点型数字:%.1f" %1.25)
print("浮点型数字:%.2f" %1.254)

out:
print("浮点型数字:%f" %1.25)...
浮点型数字:1.250000
浮点型数字:1.2
浮点型数字:1.25
使用字典格式化字符串
#使用字典格式化字符串
print("%(version)s:%(num).1f" %{"version":"versions","num":2})

out
versions: 2.0
方法描述参数
str.center(width[, fillchar])返回一个原字符串居中,并使用空格填充至长度 width 的新字符串。默认填充字符为空格。width – 字符串的总宽度。 fillchar – 填充字符。
str.ljust(width[, fillchar])返回一个原字符串左对齐,并使用空格填充至长度 width 的新字符串如果指定的长度小于字符串的长度则返回原字符串fillchar – 填充字符,默认为空格。
str.rjust(width[, fillchar])返回一个原字符串右对齐,并使用空格填充至长度 width 的新字符串如果指定的长度小于字符串的长度则返回原字符串fillchar – 填充的字符,默认为空格。
%30s()先输出30个空格,再输出变量word的值,类似于word.rjust(30)的作用。
word = "version 3.0"
print(word.center(20))  #调用center()输出变量word的值,在变量word两侧各输出5个空格
print(word.center(20,"*"))  #调用center()输出变量word的值,并指定第二个参数的值为"*",在变量word两侧各输出5个"*"
print(word.ljust(20,"*"))
print(word.rjust(20,"*"))
print("%30s"%word)

out

word = "version 3.0"...
    version 3.0     
****version 3.0*****
version 3.0*********
*********version 3.0
                   version 3.0

Python转义符及其含义

符号描述
\’单引号
\"双引号
\a发出系统响铃
\b退格符
\n换行符
\t横向制表符
\v纵向制表符
\r回车符
\f换页符
\o八进制数代表的字符
\x十进制数代表的字符
\000终止符,\000后面的字符全部忽略
标记描述
%a英文星期简写
%A英文星期完整拼写
%b英文月份的简写
%B英文月份的完整拼写
%c显示本地的日期和时间
%j显示从本年第一天开始到当天的天数
%w显示今天是星期几,0表示星期天
%W显示当天属于本年的第几周,以星期一作为一周的第一天进行计算
%d日期数,取值为1~31
%H小时数,取值为00~23
%I小时数,取值为01~12
%m月份,取值为01~12
%M分钟数,取值为01~59
%x本地的当天日期
%X本地的当天时间
%y年份,取值为00~99
%Y年份完整的数字
#
import time, datetime
print(time.strftime("%Y-%m-%d %W %w %X" ,time.localtime()))
print(time.strftime("%c"))
print(time.strftime("今天是%Y年"),time.strftime("第%j天"))
t = time.strptime("2021-10-01", "%Y-%m-%d")
y,m,d = t[0:3]
print(datetime.datetime(y,m,d))


out

2021-03-29 13 1 11:45:53
Mon Mar 29 11:45:53 2021
今天是2021年 第088天
2021-10-01 00:00:00

正则表达式中的特殊字符

符号描述
^正则表达式的开始符
$正则表达式的结束符
\w匹配字母、数字、下划线、汉字
\W匹配不是字母、数字、下划线、汉字
\s匹配空白字符
\S匹配不是空白字符
\d匹配数字
\D匹配非数字的字符
\b匹配单词的开始和结束的字符
\B匹配不是单词的开始和结束的字符
.匹配任意字符,包括汉字
[m]匹配单个字符串
[m1m2…n]匹配多个字符串
[m-n]匹配m到n区间内的数字,字母
[^m]匹配除m以外的字符串
()对正则表达式进行分组,一对圆括号表示一组
;