前言
文章中间所提到的解决方案皆可一试,能解决大部分人的问题,只是我的问题比较离谱所以一开始没解决。
正文
今天上午在爬取b站视频弹幕时,抛出了这样一个异常:
requests.exceptions.ProxyError: HTTPSConnectionPool(host='api.bilibili.com', port=443)
代码如下:
import requests
url = "https://api.bilibili.com/x/v2/dm/history?type=1&oid=258846147&date=2020-11-23"
headers = {
'user-agent': 'Mozilla/5.0 (Windows NT 6.1; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/87.0.4280.66 Safari/537.36',
'cookie': "XXXXXX",
}
response = requests.get(url=url,headers=headers,verify=False)
html = etree.HTML(response.content)
print(html)
代码很简单,但我确确实实被这个问题困扰了一天,毕竟昨天晚上运行代码时还好好的。
通常情况下,写了 verify=False 就可以解决这个异常,但是这次并不一般。
然后我尝试了以下解决方案:
-
方案1
一开始我以为是ip代理的问题。于是去找了一个代理ip,使用代理ip重新进行了一次请求。
运行结果果然没有让我失望,并没有什么卵用…
-
方案2
在发起请求前添加如下代码:session = requests.Session() session.trust_env = False response = session.get(url=url, headers=headers, verify=False)
如图所示:
-
方案3
尝试了以上两个方案,异常依旧,一如初见时候固执的样子。忽然想起,之前搜索解决方案的时候,有个博主说可能是因为requests版本低的问题。
好!那我就卸载重新装!pip uninstall requests
pip install requests -i https://pypi.tuna.tsinghua.edu.cn/simple一顿操作猛如虎,结果它…报错了
好家伙,连模块都不让我安装了。看下报错吧,这错误不看不知道,一看吓一跳,是真眼熟啊。难不成是我pycharm的问题?
于是我把目标转移到pycharm身上,终于还是对它下手了。我把pycharm卸掉重装,嘿,还是不能解决。好么~我不用你了还不行吗。
转身下载vscode,安装,打开项目,一气呵成!因为vscode运行python文件需要安装python的扩展,然后就是这个让我发现了问题所在.VSCode报错:
We connot connect to the extensions Marketplace at this time,please try again later
在网上搜索发现可能是代理服务器的问题,然后我去检查了下我的电脑是否使用了代理服务器,以下是查看步骤:
打开IE浏览器 -----> 右上角设置 -----> Internet 选项 -----> 连接 -----> 局域网设置
修改完之后,回到最初的起点,我把代码改成一开始的样子,运行没报错,成功获取到我想要的东西,皆大欢喜!
补充:
最后这里是一个警告,意思是:
InsecureRequestWarning:正在向主机“ api.bilibili.com”发出未经验证的HTTPS请求。强烈建议添加证书验证。请参阅:https://urllib3.readthedocs.io/en/latest/advanced-usage.html#ssl-warnings
不安全的请求警告。
是因为我在发送request请求时添加了verify=False,去掉即可。