requests库的get()方法
r = request.get(url)
r表示response
返回一个包含服务器资源的Response对象
request
构造一个向服务器请求资源的Request对象
具体方式
request.get(url,params=None,**kwaargs)
url
拟获取页面的url链接
params
url中的额外控制参数,字典或字节流格式,可选
**kwargs
12个控制访问的参数
Respnse
对象包含爬虫返回的全部内容
示例代码段
import requests
r = requests.get("http://www.baidu.com")
print(r.status_code)#显示r的状态码
type(r)#检测r的类型
r.headers#返回get请求获得页面的头部信息
Response对象的属性
r.status_code
HTTP请求的返回状态,200表示连接成功,404表示连接失败
r.text
HTTP响应内容的字符串形式,即url对应的页面内容
r.encoding
从HTTP header中猜测响应内容的编码方式
r.apparent_encoding
从内容中分析出响应内容编码方式(备选编码方式)
r.content
HTTP响应内容的二进制形式
r.encoding
如果header中不存在charset,则认为编码为ISO-8859-1