requests是python的一个HTTP客户端库,跟urllib,urllib2类似。它比 urllib 更加方便,可以节约我们大量的工作,它比 urllib 更加 Pythoner。
安装 Requests
通过pip安装
$ pip install requests
# End www.jb51.cc
或者,下载代码后安装:
$ wget https://github.com/requests/requests/tarball/master
$ mv master requests.tgz
$ tar xzf requests.tgz
$ cd requests-requests-3dc84cd
$ python setup.py install
# End www.jb51.cc
发送请求
使用Requests发送网络请求非常简单。
# @param Python Requests模块快速入门
# @author 编程之家 jb51.cc|jb51.cc
>>> import requests #导入Requests模块
>>> result = requests.get('http://jb51.cc') # 生成Response 对象
>>> result.status_code # 返回码
200
>>> result.headers['content-type'] # 返回头部信息
'text/html; charset=utf8'
>>> result.encoding # 编码信息
'utf-8'
>>> result.content #内容部分
# End www.jb51.cc
为URL传递参数
你也许经常想为URL的查询字符串(query string)传递某种数据。如果你是手工构建URL,那么数据会以键/值 对的形式置于URL中,跟在一个问号的后面。例如,jb51.cc?version=python3 。 Requests允许你使用 params 关键字参数,以一个字典来提供这些参数。举例来说,如果你想传递 version=python3 和 keywords=512pic 到 jb51.cc ,那么你可以使用如下代码:
# @param Python Requests模块快速入门
# @author 编程之家 jb51.cc|jb51.cc
>>> data = {'version': 'python3','keywords': '512pic'}
>>> result = requests.get("http://jb51.cc",params=data)
>>> print result.status_code
200
# End www.jb51.cc
原始响应内容
在罕见的情况下你可能想获取来自服务器的原始套接字响应,那么你可以访问 r.raw 。 如果你确实想这么干,那请你确保在初始请求中设置了 stream=True 。具体的你可以这么做:
# @param Python Requests模块快速入门
# @author 编程之家 jb51.cc|jb51.cc
>>> result = requests.get('http://jb51.cc',stream=True)
>>> result.raw
<requests.packages.urllib3.response.HTTPResponse object at 0x101194810>
>>> result.raw.read(10)
'\x1f\x8b\x08\x00\x00\x00\x00\x00\x00\x03'
# End www.jb51.cc
定制请求头
如果你想为请求添加HTTP头部,只要简单地传递一个 dict 给 headers 参数就可以了。
例如,在前一个示例中我们没有指定content-type:
# @param Python Requests模块快速入门
# @author 编程之家 jb51.cc|jb51.cc
>>> import requests
>>> url = 'http://jb51.cc'
>>> data = {'version': 'python3','keywords': '512pic'}
>>> headers = {'content-type': 'application/json'}
>>> result = requests.post(url,data=json.dumps(data),headers=headers)
# End www.jb51.cc
错误与异常
遇到网络问题(如:DNS查询失败、拒绝连接等)时,Requests会抛出一个ConnectionError 异常。
遇到罕见的无效HTTP响应时,Requests则会抛出一个 HTTPError 异常。
若请求超时,则抛出一个 Timeout 异常。
若请求超过了设定的最大重定向次数,则会抛出一个 TooManyRedirects 异常。
所有Requests显式抛出的异常都继承自 requests.exceptions.RequestException 。
其他常用方法
result.json() #JSON响应内容
result.headers #响应头内容
result.cookies #cookie内容
result.history #请求历史