1_requests库的get()方法

requests库的get()方法

r = request.get(url)

r表示response 返回一个包含服务器资源的Response对象

request 构造一个向服务器请求资源的Request对象

request.get(url,params=None,**kwaargs)

url 拟获取页面的url链接

params url中的额外控制参数，字典或字节流格式，可选

**kwargs 12个控制访问的参数

Respnse 对象包含爬虫返回的全部内容

示例代码段

import requests
r = requests.get("http://www.baidu.com")
print(r.status_code)#显示r的状态码
type(r)#检测r的类型
r.headers#返回get请求获得页面的头部信息

Response对象的属性

r.status_code HTTP请求的返回状态，200表示连接成功，404表示连接失败

r.text HTTP响应内容的字符串形式，即url对应的页面内容

r.encoding 从HTTP header中猜测响应内容的编码方式

r.apparent_encoding 从内容中分析出响应内容编码方式（备选编码方式）

r.content HTTP响应内容的二进制形式

r.encoding 如果header中不存在charset，则认为编码为ISO-8859-1