Bootstrap

python3 爬虫入门(一)urlib库基本使用

1.什么是urlib?

Urllib是python内置的HTTP请求库
包括以下模块
urllib.request 请求模块
urllib.error 异常处理模块
urllib.parse url解析模块
urllib.robotparser robots.txt解析模块

2.关于urllib.request.urlopen参数的介绍:
urlopen一般常用的有三个参数,它的参数如下:
urllib.requeset.urlopen(url,data,timeout)
response.read()可以获取到网页的内容

例:通过请求百度的get请求获得百度

import urllib.request

response = urllib.request.urlopen('http://www.ba

;