正则表达式的简单说明:
正则表达式,由普通字符和元字符组成
摘自:正则表达式
re.split方法
注:使用前需要引入包(import re)
功能:split能够按照所能匹配的字串将字符串进行切分,返回切分后的字符串列表
形式:
re.split(pattern, string[, maxsplit=0, flags=0])
pattern:匹配的字符串
string:需要切分的字符串
maxsplit:分隔次数,默认为0(即不限次数)
flags:标志位,用于控制正则表达式的匹配方式,比如:是否区分大小写,,,如下图所示
实例1:
import re
s='abc, abc, defg, dds'
re.split('\W+',s)
运行结果:
['abc', 'abc', 'defg', 'dds']
说明:\W匹配任何非单词字符
实例2:
import re
s='abc, abc, defg, dds'
re.split('(\W+)',s)
运行结果:
['abc', ', ', 'abc', ', ', 'defg', ', ', 'dds']
说明:如果加上括号,结果会同时返回去掉的值
实例3:
import re
s='abc, abc, defg, dds'
re.split('(\W+)',s,1)
实验结果:
['abc', ', ', 'abc, defg, dds']
说明:当前字符串只切分1次
实例4:
import re
s='abc, abc, defg, dds'
re.split('wxy*',s)
实验结果:
['abc, abc, defg, dds']
说明:没有可匹配的项,返回原来的字符串。