Bootstrap

python正则表达式匹配汉字

[\u4e00-\u9fa5]

以上正则表达式只匹配一个汉字

如果要匹配指定个数可用

[\u4e00-\u9fa5]{n}

n是具体的数字

例子:

import re
b="中国河南省郑州市"
a=re.search('((?P<国家>[\u4e00-\u9fa5]{2})(?P<省份>[\u4e00-\u9fa5]{3})(?P<城市>[\u4e00-\u9fa5]{3}))',b)
print(a.groupdict())

执行结果:

 注意:

(?P<id>):与(...)类似匹配圆括号中的正则表达式并指定一个组,且改组获得名称id

groupdict():返回一个字典,包含所有经命名的匹配子群,键值是子群名

 

;