1.python判断文字是中文
部分参考:https://blog.csdn.net/QFire/article/details/82753726
2.字符串中的判断方法
(1)str中的方法是否可以判断中文
3.方法示例:
def is_not_en_word(self, word:str):
'''
判断一个词是否是非英文词,只要包含一个中文,就认为是非英文词汇
:param word:
:return:
'''
count = 0
for s in word.encode('utf-8').decode('utf-8'):
if u'\u4e00' <= s <= u'\u9fff':
count += 1
break
if count > 0:
return True
else:
return False
def is_en_mail(self, mail_text:str):
'''
判断一个词是否是非英文词,只要包含一个中文,就认为是非英文词汇
:param word:
:return:
'''
tmp_text = ''.join(mail_text.split())
count = 0
print('tmp_text:', tmp_text)
for s in tmp_text.encode('utf-8').decode('utf-8'):
if u'\u4e00' <= s <= u'\u9fff':
count += 1
if float(count/(tmp_text.__len__())) > 0.1:
return False
else:
return True