python脚本根据cookies自动登录网站_Python爬虫连载6-cookie深入使用实例化实现自动登录...

news/2024/5/11 23:12:58/文章来源:https://blog.csdn.net/weixin_40004081/article/details/110114574

一、使用cookie登录

1.直接把cookie复制下去,然后手动放到请求头

2.http模块包含一些关于cookie的模块,通过他们我们可以自动使用cookie

(1)cookieJar

管理存储cookie,向传出的http请求添加cookie;cookie存储在内存中,CookieJar实例回收后cookie​将消失;

(2)FileCookieJar(filename,delayload=None,policy=Nnone)

使用文件管理cookie​;filename是保存cookie的文件

filename是保存cookie的文件

(3)MozillaCookieJar(filename,delayload=None,policy=None)

创建于mocilla浏览器cookie,txt兼容的FileCookieJar实例

(4)LwpCookieJar(filename,delayload-None,policy=None)

创建与libww-perl标准兼容的FileCookieJar实例

(5)​他们的关系是:CookieJar-->FileCookirJar-->MozillaCookieJar & LwpCookieJa

3.利用cookiejar访问人人网

自动使用cookie登录,​大致流程为:(1)打开登陆页面后自动通过用户名密码登录​;(2)自动提取反馈回来的cookie​;(3)利用提取的cookie登录隐私页面​;

4.handler是Handler的实例,常用参看案例代码

(1)用来处理复杂请求

#生成cookie的管理器

cookie_handler=request.HTTPCookieProcessor(cookie)#创建http请求管理器

http_handler=request.HTTPHandler()#生成https管理器

https_handler= request.HTTPHandler()

(2)创立handler后,使用opener打开,打开后相应的业务由相应的handler处理

(3)cookie作为一个变量,打印出来

cookie的属性​:

name:名称 value​:值 domain:可以访问此cookie的域名 expires:过期时间 size:大小 Http字段

from urllib importrequest,parsefrom http importcookiejar#创建cookiejar实例

cookie=cookiejar.CookieJar()#生成cookie的管理器

cookie_handler=request.HTTPCookieProcessor(cookie)#创建http请求管理器

http_handler=request.HTTPHandler()#生成https管理器

https_handler=request.HTTPHandler()#创建请求管理器

opener=request.build_opener(http_handler,https_handler,cookie_handler)

​deflogin():"""负责初次登录

需要输入用户名密码

:return:"""url= "http://www.renren.com/PLogin.do"data={"email":"1215217867@qq.com","password":"481648541615485"}#把数据进行编码

data=parse.urlencode(data)#创建一个请求对象

req= request.Request(url,data=data.encode())#使用opener发起请求

rep=opener.open(req)

​defgetHomePage():

url= "http://www.renren.com/965187997/profile"

#如果已经执行了login函数,则opener自动已经包含相应的cookie值

rsp=opener.open(url)

html=rsp.read().decode()

with open("rsp.html","w") as f:

f.write(html)

​if __name__ == "__main__":"""执行完login之后,会得到授权之后的cookie

我们尝试把cookie打印出来"""login()print(cookie)for item incookie:print(type(item))print(item)for i indir(item):print(i)

getHomePage()

1707435-20200210002315693-1104463438.jpg

1707435-20200210002329178-924374978.jpg

二、源码

Reptitle6_CookieJar.py

https://github.com/ruigege66/PythonReptile/blob/master/Reptitle6_CookieJar.py​

2.CSDN:https://blog.csdn.net/weixin_44630050

3.博客园:https://www.cnblogs.com/ruigege0000/

4.欢迎关注微信公众号:傅里叶变换,个人公众号,仅用于学习交流,后台回复”礼包“,获取大数据学习资料

1707435-20200210002341314-462748252.jpg

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.luyixian.cn/news_show_741479.aspx

如若内容造成侵权/违法违规/事实不符,请联系dt猫网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

每个人都可以学会WordPress建站

Step by Step 快速 简单明了 低成本 不管你建站的目的是做一个企业的官网还是个人生活记录或展示,或者利用网站来赚钱,采用Wordpress建站是最佳选择(据统计,全球网站差不多25%的网站都是采用wordpress,实在了不起&am…

网站图片优化的十五个原则

现在的网站大量的使用图片,那么这些图片如何优化才好呢?1)在网站设计之初,就先要做好规划,比如背景图片如何使用等等,做到心中有数。2)编辑图片的时候,要做好裁剪,之展示必要的,重要的&#xf…

python 利用Beautifulsoup爬取笑话网站

2019独角兽企业重金招聘Python工程师标准>>> 利用Beautifulsoup爬取知名笑话网站 首先我们来看看需要爬取的网站:http://xiaohua.zol.com.cn/ 1.开始前准备 1.1 python3,本篇博客内容采用python3来写,如果电脑上没有安装python3请…

服务器跑网站用nigx还是apache,Apache和IIS及nginx三大web服务器,新手站长该如何选择?...

网站上线时第一件事就是搭建运行环境,首先要选择的就在服务器上使用哪一个web服务器,现在win系统默认自带IIS而Linux则自带Apache,如果需要使用nginx则需要单独安装。困扰新手站长的就是web服务到底该使用哪一个,目前流行的3大web…

网站注册的域名服务器,网站域名注册和服务器

网站域名注册和服务器 内容精选换一换购买服务及配置特性时,操作步骤中未框选的配置项请保持默认值。申请服务时,未开通企业管理的用户页面无“企业项目”参数项,无需进行配置。如需开通企业项目,请参考如何开通企业项目/企业多账…

MOSS2007的网站和工作区

11.7 网站和工作区 在Microsoft Office Server 2007站点中,可使用顶级网站和子网站将网站内容划分为明确的、单独的可管理网站。顶级网站可以拥有多个子网站,而这些子网站自己也可以拥有多个子网站,可根据用户需要向下建设无限层次的子网站。…

如何使用Orchard搭建敏捷个人的网站(2)

在如何使用Orchard搭建敏捷个人的网站(1)中讲解了如何使用Orchard搭建一个简易的敏捷个人内容网站,第一篇主要讲解了如何下载安装主题、增加blog、制作菜单等,今天我们继续讲解一下如何增加搜索功能、增加自定义的内容类型以及显示…

12306订票候补是个坑_买票请认准12306!铁路部门:从未授权其他网站售票

春运首日的火车票已经可以在中国铁路官方APP铁路12306上购买。来源 网络截图华龙网-新重庆客户端12月16日14时30分讯(记者 姜念月)据成都铁路12306消息,2020年铁路春运为期为40天,其中节前为15天,节后25天,按照铁路春运火车票互联…

如何优化企业网站

大部分的中小企业网站却又都存在着这样的问题:网站新,内容少,缺少专业维护人员,这样的网站怎么样才能在互联网中生存下去呢?觉得对于中小企业网站的天生的劣势,我们就应该从各个细节上分析每个要点,这样才…

Arcgis更换布局模板_响应式网站作用+模板用法科普

随着移动端网站访问需求增加,“响应式网站”越来越受到用户欢迎。到底什么叫响应式网站呢?其实就是网站效果可以随着屏幕尺寸大小而自适应,不会发生变形、扭曲、缺失的现象。不管你是在使用手机、iPad,还是电脑,页面都…

全文搜索引擎有哪些?_五色时光教大家SEO搜索引擎优化方案

菜鸟请留言讨论,老鸟们请点评不足。谢谢最近开始了我的学习生涯—SEO搜索引擎优化的学习,之前看过很多的资料,也一直在学习,现在我的导师带着我一步一步的去学习,还给了我一个网站去实操,现在我总结了一下我…

刷网站关键字_毛刷厂的互联网营销之路——网站推广SEO篇

毛刷厂的互联网营销之路——网站推广SEO篇来源:安徽享搜互联科技有限公司官网谈起营销,若简单理解多数人想到的会是商品和渠道,营销的概念很广泛但不仅仅只限于上述两方面。目前国内大多数毛刷厂多是靠老客户介绍、业务员联系而来的订单&…

如何让网站打开更快第三弹--开启压缩篇

老鸟请直接看开启压缩进阶篇。菜鸟还是慢慢随着老夫的思路看吧,哇哈哈。什么是压缩?大家还记得我们第一次接触winzip软件吗?非常神奇,一个文件,经过winzip压缩后,大小可以压缩成原来的30%左右。记得当年&am…

Web设计师应该收藏的11个网站

今天,本文与大家分享11个Web设计师应该收藏的网站,这些都是我最喜爱的寻找设计灵感的网站。我很喜欢Dribbble,可以花很长的时间只是为了浏览网页,欣赏那些耀眼的设计,也很喜欢One Page Love,这是我见过的最…

腾讯云iis8.5新建网站无法访问_云服务器可以用来做什么?

随着云计算产业链的不断延伸,虚拟化、分布式、运维管理等技术渐趋发展成熟,高大上的云计算首次走向平民化,常态化,互联网企业上云已经不再是什么高门槛的技术,引发全民上云热潮!云服务器作为云计算的重要衍…

百度收录支持ajax吗,百度收录网站的要求是什么?

提到百度收录的网站的要求,最开始我不得不说的就是搜索引擎爬虫的抓取。如果搜索引擎爬虫不能抓取你的网站,或者爬虫无法识别网页内容的话,那百度几乎不会收录你的网站了。爬虫抓取的可识别性在爬虫抓取网页时,如果根本不知道你的…

时尚的不仅仅是它们的服装,还有它们的网站设计

2019独角兽企业重金招聘Python工程师标准>>> 随着互联网的发展,越来越多的人选择甚至依赖于网上购物,“网店”已经成为时尚服装界的大生意。截止2017年,全球服装市场价值达3万亿美元,但不是那么容易就能做成在线的服装…

云服务器 ECS 建站教程:快速搭建 Moodle 课程管理系统

快速搭建 Moodle 课程管理系统Moodle 是一个开源课程管理系统,采用 PHP MySQL 方式运行的自由开源软件,遵循 GNU 公共许可协议。世界各地教育工作者越来越喜欢使用 Moodle 为学生建立网上动态网站。Moodle 平台界面简单、精巧,您可以根据需要…

jsp mysql 音乐网站_Maven+JSP+SSM+Mysql实现的音乐网站

项目简介本系统基于MavenJSPSSMMysql实现的音乐网站。主要实现的功能有音乐播放、下载、上传等几个模块。难度等级:中等技术栈编辑器Eclipse Version: 2020-03 (4.15.0)前端技术基础:htmlcssJavaScript后端技术SpringSpringMVCmybatis模板引擎&#xff1…