博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
python:requests模块
阅读量:5339 次
发布时间:2019-06-15

本文共 1072 字,大约阅读时间需要 3 分钟。

requests模块是我在学习爬虫时学到的一个模块,它的api比较简单好用,这里简介下使用方法。

其实这个很好使用,几行代码就可以获取一个网页的内容:

import requestsurl = 'http://www.juzimi.com/ju/252304'response = requests.get(url)print (response.text)

它支持很多http请求类型:getpostputdeleteheadoptions

其中获取的响应内容有2中显示方法

.content  以字节的方式显示,中文显示为字符

.text     以文本的方式显示,放两张图就能明白了

这是content

 

 

这是text

 

 

Requests 会自动解码来自服务器的内容。大多数 unicode 字符集都能被无缝地解码。

可以通过.encoding 查看requests使用了什么编码

也可以手动改变其使用的编码r.encoding= ‘gbk2312’

Get请求可以传递参数

import requestsurl = 'http://www.juzimi.com/article/33125'payload = {'page':'1'}response = requests.get(url,params=payload)print (response.text)

可以打印.url,查看构造后的url

 

 

定制请求头部

传一个dictheads参数

headers = {'user-agent': 'my-app/0.0.1'}

r = requests.get(url, headers=headers)

发送post请求

payload = {'key1': 'value1', 'key2': 'value2'}

r = requests.post("http://httpbin.org/post", data=payload)

get方法还有一个cookies参数

timeout参数

访问代理

proxies = {           "http": "http://10.10.10.10:8888",           "https": "http://10.10.10.100:4444",          }r = requests.get('http://m.ctrip.com', proxies=proxies)

 

 

转载于:https://www.cnblogs.com/GH-D/p/8306649.html

你可能感兴趣的文章
hdu2824(欧拉函数)
查看>>
C#-在主线程中创建子线程
查看>>
2012-7-29Joomla自带的文章模块+K2文章模块+ZT文章模块
查看>>
bzoj1018[SHOI2008]堵塞的交通traffic
查看>>
day22_1-课前上节复习+os模块
查看>>
python (五)小数据池、集合、copy、文件操作
查看>>
Nginx rewrite URL examples with and without redirect address
查看>>
浮点类型的特殊性知多少
查看>>
继承(一)
查看>>
【NOIP模拟】花花森林
查看>>
copy和mutableCopy
查看>>
这是我的第一篇播客,多多指教
查看>>
C语言编程经典100例
查看>>
Python3——根据m3u8下载视频(上)之urllib.request
查看>>
使用Visual Studio Code开发Asp.Net Core WebApi学习笔记(四)-- Middleware
查看>>
Java实现快速排序
查看>>
小程序的生命周期
查看>>
linux之 文本编辑 的基础知识点
查看>>
Android系统下,用adb实现自动获取应用性能数据
查看>>
微信小程序采坑之scroll-view
查看>>