Python基础教程学习:遇到需要的登录的网站怎么办?学好python,用这3招轻松搞定

news/2024/5/10 9:27:56/文章来源:https://blog.csdn.net/chen801090/article/details/92660328

Python基础教程学习:遇到需要的登录的网站怎么办?学好python,用这3招轻松搞定

你好

由于你是游客

无法查看本文

请你登录再进

谢谢合作。。。。。


当你在爬某些网站的时候

需要你登录才可以获取数据

咋整?

莫慌

把这几招传授给你

让你以后从容应对

在这里插入图片描述
登录的常见方法无非是这两种

1、让你输入帐号和密码登录

在这里插入图片描述
2、让你输入帐号密码+验证码登录

在这里插入图片描述
今天

先跟你说说第一种

需要验证码的咱们下一篇再讲

第一招

在这里插入图片描述
Cookie大法

你平常在上某个不为人知的网站的时候

是不是发现你只要登录一次

就可以一直看到你想要的内容

过了一阵子才需要再次登录

这就是因为 Cookie 在做怪

简单来说

就是每一个使用这个网站的人

服务器都会给他一个 Cookie

那么下次你再请求数据的时候

你顺带把这个 Cookie 传过去

服务器一看

诶,小伙子是老客户啊

在这里插入图片描述
有登录过

直接返回数据给他吧

在服务中还可以设置 Cookie 的有效时间

也就是说

当你下次携带一个过期了的 Cookie 给服务器的时候

服务器虽然知道你是老客户

但是还是需要你重新再登录一次

然后再给你一个有效的 Cookie

Cookie 的时长周期是服务器那边定的

ok

了解了这一点之后

我们就来玩一下吧

我们以「逼乎」为例

https://biihu.cc/account/login/

输入地址之后

按一下 F12

点击 network 标签

然后登录你的帐号

然后点击其中一个

你就可以看到在 Request Headers 有你的 Cookie

在这里插入图片描述
有了 Cookie 之后

我们在代码中直接获取我的个人信息

import requests
headers = {# 假装自己是浏览器'User-Agent': 'Mozilla/5.0 (X11; Linux x86_64) AppleWebKit/537.36 (KHTML, like Gecko) Ubuntu Chromium/73.0.3683.75 Chrome/73.0.3683.75 Safari/537.36',# 把你刚刚拿到的Cookie塞进来'Cookie': 'eda38d470a662ef3606390ac3b84b86f9; Hm_lvt_f1d3b035c559e31c390733e79e080736=1553503899; biihu__user_login=omvZVatKKSlcXbJGmXXew9BmqediJ4lzNoYGzLQjTR%2Fjw1wOz3o4lIacanmcNncX1PsRne5tXpE9r1sqrkdhAYQrugGVfaBICYp8BAQ7yBKnMpAwicq7pZgQ2pg38ZzFyEZVUvOvFHYj3cChZFEWqQ%3D%3D; Hm_lpvt_f1d3b035c559e31c390733e79e080736=1553505597',
}
session = requests.Session()
response = session.get('https://biihu.cc/people/wistbean%E7%9C%9F%E7%89%B9%E4%B9%88%E5%B8%85', headers=headers)
print(response.text)

运行后可以发现不用登录就可以直接拿到自己的个人信息了

<!DOCTYPE html>
<html>
<head>
<meta content="text/html;charset=utf-8" http-equiv="Content-Type" />
<meta content="width=device-width, initial-scale=1.0, maximum-scale=1.0, user-scalable=no" name="viewport" />
<meta http-equiv="X-UA-Compatible" content="IE=edge,Chrome=1" />
<meta name="renderer" content="webkit" />
<title>小帅b真特么帅 的个人主页 - 逼乎</title>
<meta name="keywords" content="逼乎,问答,装逼,逼乎网站" />
<meta name="description" content="逼乎 ,与世界分享你的装逼技巧与见解" />
<base href="https://biihu.cc/" /><!--[if IE]></base><![endif]-->
<link rel="stylesheet" type="text/css" href="https://biihu.cc/static/css/bootstrap.css" />
<link rel="stylesheet" type="text/css" href="https://biihu.cc/static/css/icon.css" />
<link href="https://biihu.cc/static/css/default/common.css?v=20180831" rel="stylesheet" type="text/css" />
<link href="https://biihu.cc/static/css/default/link.css?v=20180831" rel="stylesheet" type="text/css" />
<link href="https://biihu.cc/static/js/plug_module/style.css?v=20180831" rel="stylesheet" type="text/css" />
<link href="https://biihu.cc/static/css/default/user.css?v=20180831" rel="stylesheet" type="text/css" />
<link href="https://biihu.cc/static/css/mood/mood.css" rel="stylesheet" type="text/css" />
<script type="text/javascript">var _02AEC94D5CA08B39FC0E1F7CC220F9B4="a5359326797de302bfc9aa6302c001b8";var G_POST_HASH=_02AEC94D5CA08B39FC0E1F7CC220F9B4;var G_INDEX_SCRIPT = "";var G_SITE_NAME = "逼乎";var G_BASE_URL = "https://biihu.cc";var G_STATIC_URL = "https://biihu.cc/static";var G_UPLOAD_URL = "/uploads";var G_USER_ID = "188";var G_USER_NAME = "666";var G_UPLOAD_ENABLE = "Y";var G_UNREAD_NOTIFICATION = 0;var G_NOTIFICATION_INTERVAL = 100000;var G_CAN_CREATE_TOPIC = "1";var G_ADVANCED_EDITOR_ENABLE = "Y";var FILE_TYPES = "jpg,jpeg,png,gif,zip,doc,docx,rar,pdf,psd";
</script>
<script src="https://biihu.cc/static/js/jquery.2.js?v=20180831" type="text/javascript"></script>

第二招

在这里插入图片描述
表单请求大法

很简单

就是通过抓包

获取请求登录的时候需要用到的用户名密码参数

然后以表单的形式请求服务器

如果你细心一点的话应该会知道之前说过拉

具体在这

去看下

我就不多说了

第三招

在这里插入图片描述
Selenium 自动登录法

获取到两个输入框的元素

再获取到登录按钮

往输入框写你的帐号密码

然后自动点击一下登录

username = WAIT.until(EC.presence_of_element_located((By.CSS_SELECTOR, "帐号的selector")))
password = WAIT.until(EC.presence_of_element_located((By.CSS_SELECTOR, "密码的selector")))
submit = WAIT.until(EC.element_to_be_clickable((By.XPATH, '按钮的xpath')))
username.send_keys('你的帐号')
password.send_keys('你的密码')
submit.click()

登录完之后拿到 Cookie

cookies = webdriver.get_cookies()

有了 Cookie 你就可以拿到你想要的数据了,希望对你有帮助

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.luyixian.cn/news_show_747935.aspx

如若内容造成侵权/违法违规/事实不符,请联系dt猫网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

jquery mobile_15个令人兴奋的jQuery Mobile网站示例

jquery mobile有数百个&#xff08;甚至数千个&#xff09;使用jQuery mobile构建的网站&#xff0c;所以今天我们将与您分享15个令人兴奋的jQuery mobile网站的集合&#xff0c;以获取您的想法和灵感。 陷入困境并享受乐趣&#xff01; 相关文章&#xff1a; 50个jQuery Mob…

15个令人兴奋的jQuery Mobile网站示例

有数百个&#xff08;甚至数千个&#xff09;使用jQuery mobile构建的网站&#xff0c;所以今天我们将与您分享15个令人兴奋的jQuery mobile网站的集合&#xff0c;以获取您的想法和灵感。 陷入困境并享受乐趣&#xff01; 相关文章&#xff1a; 50个jQuery Mobile开发技巧 聚…

python爬虫反反爬,你几乎可以横扫大部分 css 字体加密的网站

你已经知道了对方是 如何自定义字体加密的了 你要想去反反爬 你就要先站在对方的角度去思考问题 有句话这么说来着 “知己知彼&#xff0c;才能那啥” 那么对于像猫眼电影、大众点评等等 那样的 css 自定义字体加密 应该怎么破呢&#xff1f; 接下来就是 学习 python 的…

比较好的Java 网站

比较好的Java 网站javaboys 51cto技术博客[%title%][%count%]票 [[%percent%]&#xff05;] 比较好的Java 网站1. The Source for Java Technology Collaboration(JAVA开发的官方网站) [url]http://www.java.net/[/url] - 外文 2. jGuru: FAQ Home Page 推荐 [url]http://www…

爬取某网站所有的乌云漏洞公共文章,并保存为pdf文件

鼎鼎大名的乌云网站&#xff0c;仅存在6年左右&#xff0c;就停摆&#xff0c;真是可惜。。。 从某网站爬取所有公开的乌云漏洞文章&#xff0c;保存为pdf格式&#xff0c;以作纪念学习使用 首先创建一个文件夹wooyun&#xff0c;把下面代码保存为test.py&#xff0c;然后放在该…

Nginx基础篇(八);Nginx访问认证、网站展示目录结构浏览网页

Table of Contents 一、参数说明 二、实现访问认证步骤 三、Nginx访问认证出现状态码403 forbidden的原因 四、在网站展示目录结构 需求&#xff1a;在实际工作企业中有时需要我们为网站设置访问账号和密码权限&#xff0c;这样操作后&#xff0c;只有拥有账号密码的人才能…

wp 新窗口插件_适用于您的WP网站的10个令人兴奋的新jQuery插件

wp 新窗口插件今天&#xff0c;我们将向您分享我们的jQuery驱动插件集合&#xff0c;这些集合为您喜欢的WordPress网站增加了凉爽和交互式效果。 请享用&#xff01; 另请参阅&#xff1a; 100个WordPress jQuery插件 1.破坏性谈话 它是一个phono小部件&#xff0c;可让Word…

Nginx架构篇(三);LNMP架构实现discuz和wordpress搭建:MySQL多实例、主主及主从复制、读写分离及nfs网站代码集中式管理(后续可以为数据库添加MHA,DRBD)

文章目录一、环境搭建及主从复制基础知识二、NFS服务器的配置三、Nginx服务器的配置四、PHP服务器需要做的配置&#xff08;两个PHP都是一样的配置&#xff09;五、MySQL多实例&#xff1a;主主、主从复制&#xff0c;读写分离先给3307数据库和3308数据库做主主复制再给3307数据…

LNMP+zabbix监控平台部署(采用阿里云服务器一体化部署监控wordpress网站)

部署前须知&#xff1a; 一般情况下&#xff0c;我们是将其中Zabbix-Server、Zabbix-Proxy、Zabbix-Web、Zabbix-Database专门部署在一台独立服务器上,Zabbix-Agent一般部署在需要被监控的网站的服务器上。 由于资金限制&#xff0c;本人只有一台阿里云服务器&#xff0c;所以…

jQuery网站/博客-全球最佳

这是Internet上最好的jQuery网站和博客的集合&#xff08;或者至少是到目前为止我发现的博客&#xff09;。如果您想出现在此列表中&#xff0c;请发表评论并证明自己的理由。 相关文章&#xff1a; 进入互联网的十大jQuery Gurus blog.jquery.com 写更少&#xff0c;做更多&am…

2019升级版最新Python学习路线:关于电影购票网站实现的讲解

这次的Python学习路线跟大家讲一下关于电影购票网站的实现。这几天咱们国产的哪吒很火嘛&#xff01; 1. 用户功能 同前面所有项目的用户功能&#xff0c;利用AjaxDjango系统认证QQ邮箱实现登陆注册 2. 用户未登陆会跳转到注册登录界面&#xff0c;登录后会返回至主页&#…

jquerymobile_使用jQueryMobile从桌面到移动网站的转换

jquerymobilejQuery Mobile是用于制作移动Web应用程序的强大框架。 但是&#xff0c;我们可以使用它将现有的桌面网站转换为移动形式吗&#xff1f; 可以使用MobilizeToday.com在线服务。 它们提供了基于小部件的模型&#xff0c;该模型将任何现有HTML内容表示到移动视图中。 …

使用jQueryMobile从桌面到移动网站的转换

jQuery Mobile是用于制作移动Web应用程序的强大框架。 但是&#xff0c;我们可以使用它将现有的桌面网站转换为移动形式吗&#xff1f; 可以使用MobilizeToday.com在线服务。 它们提供了基于小部件的模型&#xff0c;该模型将任何现有HTML内容表示到移动视图中。 背后的技术是X…

eyoucms 网站原创文章要怎样进行优化?

互联网一直都是在变化中的&#xff0c;而且百度、搜狗等搜索引擎的抓取方式也在不断的进行改变&#xff0c;这些都导致了网站优化手法的改变&#xff0c;如果说唯一没有变化的话就是对于原创文章的编写以及发布。但是要写出一个高质量原创的文章可不是一件简单的事情&#xff0…

用Python清理收藏夹里已失效的网站,快测试一下你的收藏夹吧

最近打开好多以前收藏的网站&#xff0c;发现好多都已经失效了&#xff0c;好多以前想看还没来得及看的内容&#xff0c;也找不见了。。。 失效的书签们 我们日常浏览网站的时候&#xff0c;时不时会遇到些新奇的东西&#xff0c;于是我们就默默的点了个收藏或者加书签。然而…

SEO删除网站的旧内容,对目前已有的排名有影响吗?

搜索引擎是一个动态变化的过程&#xff0c;而相对于网站而言&#xff0c;对于过往的内容&#xff0c;它都是一沉不变的&#xff0c;这就是为什么网站需要持续的推陈出新&#xff0c;才能使得整站排名保持长期的稳定。 但这里有一个问题&#xff0c;垂直行业的内容资源库是有限…

大型网站系统架构分析

千万级的注册用户&#xff0c;千万级的帖子&#xff0c;nTB级的附件&#xff0c;还有巨大的日访问量&#xff0c;大型网站采用什么系统架构保证性能和稳定性&#xff1f; 首先讨论一下大型网站需要注意和考虑的问题。 数据库海量数据处理&#xff1a;负载量不大的情况下select、…

用Python爬取各大网站招聘平台,终于让我给知道对口的工作

个人经历&#xff1a;低不成&#xff0c;高不就 依稀还记得15年刚出来工作那会&#xff0c;在第一个互联网公司实习&#xff0c;在公司听惯了身边人说公司这不好&#xff0c;那不好&#xff0c;作为新人的我深受影响&#xff0c;不知从何时开始就想快点结束实习期换一份更好的…

用Python爬取各大网站招聘平台,终于让我给知道对口的工作

个人经历&#xff1a;低不成&#xff0c;高不就 依稀还记得15年刚出来工作那会&#xff0c;在第一个互联网公司实习&#xff0c;在公司听惯了身边人说公司这不好&#xff0c;那不好&#xff0c;作为新人的我深受影响&#xff0c;不知从何时开始就想快点结束实习期换一份更好的…

用Python清理收藏夹里已失效的网站

失效的书签们 我们日常浏览网站的时候&#xff0c;时不时会遇到些新奇的东西&#xff08; 你懂的.jpg &#xff09;&#xff0c;于是我们就默默的点了个收藏或者加书签。然而当我们面对成百上千的书签和收藏夹的时候&#xff0c;总会头疼不已…… 尤其是昨天还在更新的程序设计…