侯体宗的博客
  • 首页
  • 人生(杂谈)
  • 技术
  • 关于我
  • 更多分类
    • 文件下载
    • 文字修仙
    • 中国象棋ai
    • 群聊
    • 九宫格抽奖
    • 拼图
    • 消消乐
    • 相册

Python使用cookielib模块操作cookie的实例教程

Python  /  管理员 发布于 7年前   273

cookielib是一个自动处理cookies的模块,如果我们在使用爬虫等技术的时候需要保存cookie,那么cookielib会让你事半功倍!他最常见的搭档模块就是python下的urllib和request。

核心类
1.Cookie
该类实现了Netscape and RFC 2965 cookies定义的cookie标准,基本可以理解为某一条cookie数据。
部分代码如下,很多属性是不是很眼熟?

    self.domain_initial_dot = domain_initial_dot    self.path = path    self.path_specified = path_specified    self.secure = secure    self.expires = expires    self.discard = discard    self.comment = comment    self.comment_url = comment_url    self.rfc2109 = rfc2109

2.CookiePolicy
该类的主要功能是收发cookie,即确保正确的cookie发往对应的域名,反之一样。
3.DefaultCookiePolicy
该类实现了CookiePolicy的接口。
4.CookieJar
CookieJar是cookie的集合,可以包含有很多Cookie类,是我们的主要操作对象。里面有一系列的方法可以支持更加细致的操作!
5.FileCookieJar
该类继承自CookieJar,CookieJar只是在内存中完成自己的生命周期,FileCookieJar的子类能够实现数据持久化,定义了save、load、revert三个接口。
6.MozillaCookieJar & LWPCookieJar
两个实现类,继承关系如下:

实例:登录人人网
在firefox下使用httpFox插件来查到人人网的登录时需要POST的地址是http://www.renren.com/ajaxLogin

而且查看到需要POST的DATA有email和password
python通过cookielib来处理cookie,以下是简单的代码

>>> import urllib>>> import urllib2,cookielib>>> login_page = "http://www.renren.com/ajaxLogin">>> cj = cookielib.CookieJar()>>> opener = urllib2.build_opener(urllib2.HTTPCookieProcessor(cj))>>> opener.add_handler = [('User-agent','Mozilla/4.0 (compatible; MSIE 6.0; Windows NT 5.1)')]>>> data = urllib.urlencode({"email":'username',"password":'password'}) >>> opener.open(login_page,data)<addinfourl at 53653216 whose fp = <socket._fileobject object at 0x03307B70>>>>> if cj:... for index,cookie in enumerate(cj):...  print index,':',cookie...  0 : <Cookie _de=90D533AE20EB964CA96710977F452897 for .renren.com/>1 : <Cookie anonymid=hlehtdzg-8359yw for .renren.com/>2 : <Cookie first_login_flag=1 for .renren.com/>3 : <Cookie id=224967207 for .renren.com/>4 : <Cookie loginfrom=null for .renren.com/>5 : <Cookie p=9beb60859c004bcaf0a32ff2c973473d7 for .renren.com/>6 : <Cookie societyguester=86b6a6006002ab6316f708521ab50bfc7 for .renren.com/>7 : <Cookie t=86b6a6006002ab6316f708521ab50bfc7 for .renren.com/>8 : <Cookie xnsid=fa53da51 for .renren.com/>9 : <Cookie t=30af9ffe774f4d6f242e92da1ccd6670 for .renren.com/xtalk/>10 : <Cookie feedType=224967207_hot for .www.renren.com/>11 : <Cookie JSESSIONID=abc3IP9kEhTExblxcRfeu for www.renren.com/>>>>

可以和firebug或者httpFox中得到的cookie进行对比,值可能不一致,但key基本上是一致的,你每次登录应该都不一致

我也尝试过使用fidder模拟发送没有cookie的POST数据,但是没有得到想要的返回值

而加上cookie信息以后就可以正常的跳转到自己的主页了

好了,基本上了解了python中使用cookie来发送登录信息,现在我们来写一个小脚本来登录自己人人网。

#encoding=utf-8import urllib2import urllibimport cookielibdef renrenBrower(url,user,password):  login_page = "http://www.renren.com/ajaxLogin"  try:        cj = cookielib.CookieJar()        opener=urllib2.build_opener(urllib2.HTTPCookieProcessor(cj))    opener.addheaders = [('User-agent','Mozilla/4.0 (compatible; MSIE 6.0; Windows NT 5.1)')]    data = urllib.urlencode({"email":user,"password":password})    opener.open(login_page,data)    op=opener.open(url)    data= op.read()    return data  except Exception,e:    print str(e)print renrenBrower("http://www.renren.com/home","用户名","密码")

这样就可以将自己首页的信息显示出来了,其实在登录完以后,还可以接着写脚本来获取自己想要的信息,如朋友的新鲜事等,这里就不作过多说明了~

您可能感兴趣的文章:

  • Python get获取页面cookie代码实例
  • Python Selenium Cookie 绕过验证码实现登录示例代码
  • python爬虫中get和post方法介绍以及cookie作用
  • Python爬虫番外篇之Cookie和Session详解
  • 利用selenium 3.7和python3添加cookie模拟登陆的实现
  • Python HTTP客户端自定义Cookie实现实例
  • python模拟登录并且保持cookie的方法详解
  • Python爬虫利用cookie实现模拟登陆实例详解
  • qpython3 读取安卓lastpass Cookies
  • python3实现读取chrome浏览器cookie
  • 玩转python爬虫之cookie使用方法
  • Python中urllib+urllib2+cookielib模块编写爬虫实战
  • Python3中关于cookie的创建与保存


  • 上一条:
    Python的面向对象编程方式学习笔记
    下一条:
    Python网络编程中urllib2模块的用法总结
  • 昵称:

    邮箱:

    0条评论 (评论内容有缓存机制,请悉知!)
    最新最热
    • 分类目录
    • 人生(杂谈)
    • 技术
    • linux
    • Java
    • php
    • 框架(架构)
    • 前端
    • ThinkPHP
    • 数据库
    • 微信(小程序)
    • Laravel
    • Redis
    • Docker
    • Go
    • swoole
    • Windows
    • Python
    • 苹果(mac/ios)
    • 相关文章
    • 在python语言中Flask框架的学习及简单功能示例(0个评论)
    • 在Python语言中实现GUI全屏倒计时代码示例(0个评论)
    • Python + zipfile库实现zip文件解压自动化脚本示例(0个评论)
    • python爬虫BeautifulSoup快速抓取网站图片(1个评论)
    • vscode 配置 python3开发环境的方法(0个评论)
    • 近期文章
    • 在go语言中实现字符串可逆性压缩及解压缩功能(0个评论)
    • 使用go + gin + jwt + qrcode实现网站生成登录二维码在app中扫码登录功能(0个评论)
    • 在windows10中升级go版本至1.24后LiteIDE的Ctrl+左击无法跳转问题解决方案(0个评论)
    • 智能合约Solidity学习CryptoZombie第四课:僵尸作战系统(0个评论)
    • 智能合约Solidity学习CryptoZombie第三课:组建僵尸军队(高级Solidity理论)(0个评论)
    • 智能合约Solidity学习CryptoZombie第二课:让你的僵尸猎食(0个评论)
    • 智能合约Solidity学习CryptoZombie第一课:生成一只你的僵尸(0个评论)
    • 在go中实现一个常用的先进先出的缓存淘汰算法示例代码(0个评论)
    • 在go+gin中使用"github.com/skip2/go-qrcode"实现url转二维码功能(0个评论)
    • 在go语言中使用api.geonames.org接口实现根据国际邮政编码获取地址信息功能(1个评论)
    • 近期评论
    • 122 在

      学历:一种延缓就业设计,生活需求下的权衡之选中评论 工作几年后,报名考研了,到现在还没认真学习备考,迷茫中。作为一名北漂互联网打工人..
    • 123 在

      Clash for Windows作者删库跑路了,github已404中评论 按理说只要你在国内,所有的流量进出都在监控范围内,不管你怎么隐藏也没用,想搞你分..
    • 原梓番博客 在

      在Laravel框架中使用模型Model分表最简单的方法中评论 好久好久都没看友情链接申请了,今天刚看,已经添加。..
    • 博主 在

      佛跳墙vpn软件不会用?上不了网?佛跳墙vpn常见问题以及解决办法中评论 @1111老铁这个不行了,可以看看近期评论的其他文章..
    • 1111 在

      佛跳墙vpn软件不会用?上不了网?佛跳墙vpn常见问题以及解决办法中评论 网站不能打开,博主百忙中能否发个APP下载链接,佛跳墙或极光..
    • 2016-10
    • 2016-11
    • 2018-04
    • 2020-03
    • 2020-04
    • 2020-05
    • 2020-06
    • 2022-01
    • 2023-07
    • 2023-10
    Top

    Copyright·© 2019 侯体宗版权所有· 粤ICP备20027696号 PHP交流群

    侯体宗的博客