Bootstrap

【python正则匹配字符串的数字和中文】


正则表达式正则函数用处
‘[^(0-9)]’re.sub提取字符串中所有数字
‘[\u4e00-\u9fa5]*’re.search匹配字符中的第一个连续的中文片段
‘[\u4e00-\u9fa5]’re.findall匹配字符串中的所有中文字符
‘[\u4e00-\u9fa5]+’re.findall匹配字符串中的所有中文字符并一起输出

1.匹配数字

1.1提取字符串中所有的数字

import re

num_var = '23r4g'
num_spl = re.sub('[^(0-9)]', '', num_var)

print(num_spl)
# 234

2.匹配中文

2.1匹配字符串中的第一个连续的中文片段

import re

char_var = '小兔子,xiaotuzi'
char_spl = re.search('[\u4e00-\u9fa5]*', char_var)

print(char_spl)
# <re.Match object; span=(0, 3), match='小兔子'>

2.2匹配字符串中的所有中文字符

import re

char_var = '小兔子,xiaotuzi'
char_all = re.findall('[\u4e00-\u9fa5]', char_var)

print(char_all)
# ['小', '兔', '子']

2.3匹配字符串中的所有中文字符并一起输出

import re

char_var = '小兔子,xiaotuzi'
char_all_out = re.findall('[\u4e00-\u9fa5]+', char_var)

print(char_all_out)
# ['小兔子']
;