Bootstrap

python中判断字符是否为中文

最近在学习一点爬虫的知识,虽然只有一点基础,但是学起来还是很有趣的,hhhhh

步入正题,在爬虫中有可能需要用户输入然后搜索其所需要的内容,这个时候我们就要考虑一下用户输入的是否是中文了,因为url中不允许用户输入的是中文,如果是中文,就需要进行转义

def is_Chinese(word):
    for ch in word:
        if '\u4e00' <= ch <= '\u9fff':
            return True
    return False
print(is_Chinese("中文"))

如果是中文的,进行转义:

import string
import urllib.parse


keyword = input("请输入需要查找的内容: ")
url = "http://www.baidu.com/s?wd=%s"%keyword
if is_Chinese(keyword):
    url = urllib.parse.quote(url, safe = string.printable)

 

;