怎么去调需要登录的接口_遇到需要的登录的网站怎么办?学好python,用这3招轻松搞定...

news/2024/5/19 6:03:32/文章来源:https://blog.csdn.net/weixin_39614228/article/details/110799746

959b29b95a917a363d1ac3430a675a49.png

你好

由于你是游客

无法查看本文

请你登录再进

谢谢合作。。。。。

092f6c72e0a6585227f74bf6bc7c7e0c.png

当你在爬某些网站的时候

需要你登录才可以获取数据

咋整?

莫慌

把这几招传授给你

让你以后从容应对

e14de837be52dcd3ae1ade97eb17a611.gif

登录的常见方法无非是这两种

1、让你输入帐号和密码登录

9defb283d337d96d939192ad8ddaa123.png

2、让你输入帐号密码+验证码登录

2cbe3ef5ed69939e1b68140d12d7c4c8.png

今天

先跟你说说第一种

需要验证码的咱们下一篇再讲

第一招

fb551216ee5c43f4b36549b1beb506b3.png

Cookie大法

你平常在上某个不为人知的网站的时候

是不是发现你只要登录一次

就可以一直看到你想要的内容

过了一阵子才需要再次登录

这就是因为 Cookie 在做怪

简单来说

就是每一个使用这个网站的人

服务器都会给他一个 Cookie

那么下次你再请求数据的时候

你顺带把这个 Cookie 传过去

服务器一看

诶,小伙子是老客户啊

affff6b19e31272051db38e6016e2e23.png

有登录过

直接返回数据给他吧

在服务中还可以设置 Cookie 的有效时间

也就是说

当你下次携带一个过期了的 Cookie 给服务器的时候

服务器虽然知道你是老客户

但是还是需要你重新再登录一次

然后再给你一个有效的 Cookie

Cookie 的时长周期是服务器那边定的

ok

了解了这一点之后

我们就来玩一下吧

我们以「逼乎」为例

https://biihu.cc/account/login/

输入地址之后

按一下 F12

点击 network 标签

然后登录你的帐号

然后点击其中一个

你就可以看到在 Request Headers 有你的 Cookie

8da8ea9a3350e94fc84bf4c6ec63d04a.png

有了 Cookie 之后

我们在代码中直接获取我的个人信息

import requests
headers = {# 假装自己是浏览器'User-Agent': 'Mozilla/5.0 (X11; Linux x86_64) AppleWebKit/537.36 (KHTML, like Gecko) Ubuntu Chromium/73.0.3683.75 Chrome/73.0.3683.75 Safari/537.36',# 把你刚刚拿到的Cookie塞进来'Cookie': 'eda38d470a662ef3606390ac3b84b86f9; Hm_lvt_f1d3b035c559e31c390733e79e080736=1553503899; biihu__user_login=omvZVatKKSlcXbJGmXXew9BmqediJ4lzNoYGzLQjTR%2Fjw1wOz3o4lIacanmcNncX1PsRne5tXpE9r1sqrkdhAYQrugGVfaBICYp8BAQ7yBKnMpAwicq7pZgQ2pg38ZzFyEZVUvOvFHYj3cChZFEWqQ%3D%3D; Hm_lpvt_f1d3b035c559e31c390733e79e080736=1553505597',
}
session = requests.Session()
response = session.get('https://biihu.cc/people/wistbean%E7%9C%9F%E7%89%B9%E4%B9%88%E5%B8%85', headers=headers)
print(response.text)

运行后可以发现不用登录就可以直接拿到自己的个人信息了

<!DOCTYPE html>
<html>
<head>
<meta content="text/html;charset=utf-8" http-equiv="Content-Type" />
<meta content="width=device-width, initial-scale=1.0, maximum-scale=1.0, user-scalable=no" name="viewport" />
<meta http-equiv="X-UA-Compatible" content="IE=edge,Chrome=1" />
<meta name="renderer" content="webkit" />
<title>小帅b真特么帅 的个人主页 - 逼乎</title>
<meta name="keywords" content="逼乎,问答,装逼,逼乎网站" />
<meta name="description" content="逼乎 ,与世界分享你的装逼技巧与见解" />
<base href="https://biihu.cc/" /><!--[if IE]></base><![endif]-->
<link rel="stylesheet" type="text/css" href="https://biihu.cc/static/css/bootstrap.css" />
<link rel="stylesheet" type="text/css" href="https://biihu.cc/static/css/icon.css" />
<link href="https://biihu.cc/static/css/default/common.css?v=20180831" rel="stylesheet" type="text/css" />
<link href="https://biihu.cc/static/css/default/link.css?v=20180831" rel="stylesheet" type="text/css" />
<link href="https://biihu.cc/static/js/plug_module/style.css?v=20180831" rel="stylesheet" type="text/css" />
<link href="https://biihu.cc/static/css/default/user.css?v=20180831" rel="stylesheet" type="text/css" />
<link href="https://biihu.cc/static/css/mood/mood.css" rel="stylesheet" type="text/css" />
<script type="text/javascript">var _02AEC94D5CA08B39FC0E1F7CC220F9B4="a5359326797de302bfc9aa6302c001b8";var G_POST_HASH=_02AEC94D5CA08B39FC0E1F7CC220F9B4;var G_INDEX_SCRIPT = "";var G_SITE_NAME = "逼乎";var G_BASE_URL = "https://biihu.cc";var G_STATIC_URL = "https://biihu.cc/static";var G_UPLOAD_URL = "/uploads";var G_USER_ID = "188";var G_USER_NAME = "666";var G_UPLOAD_ENABLE = "Y";var G_UNREAD_NOTIFICATION = 0;var G_NOTIFICATION_INTERVAL = 100000;var G_CAN_CREATE_TOPIC = "1";var G_ADVANCED_EDITOR_ENABLE = "Y";var FILE_TYPES = "jpg,jpeg,png,gif,zip,doc,docx,rar,pdf,psd";
</script>
<script src="https://biihu.cc/static/js/jquery.2.js?v=20180831" type="text/javascript"></script>

第二招

691fb38f54f923c6d7e31f97ea31ace9.png

表单请求大法

很简单

就是通过抓包

获取请求登录的时候需要用到的用户名密码参数

然后以表单的形式请求服务器

如果你细心一点的话应该会知道之前说过拉

具体在这

去看下

我就不多说了

第三招

ca388b8f7b9f1b739e398367d1f8af35.png

Selenium 自动登录法

获取到两个输入框的元素

再获取到登录按钮

往输入框写你的帐号密码

然后自动点击一下登录

username = WAIT.until(EC.presence_of_element_located((By.CSS_SELECTOR, "帐号的selector")))
password = WAIT.until(EC.presence_of_element_located((By.CSS_SELECTOR, "密码的selector")))
submit = WAIT.until(EC.element_to_be_clickable((By.XPATH, '按钮的xpath')))
username.send_keys('你的帐号')
password.send_keys('你的密码')
submit.click()

登录完之后拿到 Cookie

cookies = webdriver.get_cookies()

有了 Cookie 你就可以拿到你想要的数据了,希望对你有帮助

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.luyixian.cn/news_show_711636.aspx

如若内容造成侵权/违法违规/事实不符,请联系dt猫网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

wordpress如何配置两个header。php_WordPress入门|WordPress建站详细流程

在安装WordPress之前&#xff0c;先看看服务器及本地软硬件是否满足安装要求。服务器端要求PHP 7.3或更高版本MySQL 5.6或MariaDB 10.1或更高版本Apache或Nginx本地要求用户ID和密码&#xff08;登录服务器的FTP或Shell帐户&#xff09;文本编辑器FTP软件浏览器1. 域名注册网站…

提交数据网页设计_网站网页编写需要注意哪些问题?

在网站建设过程中对网页的制作必须按照一定的步骤进行制作&#xff0c;这样才不会显得网站页面太过杂乱&#xff0c;以便根据网站建设的习惯性制作好网页以及素材图片融合等内容。就以大连网龙科技旗下产品云霸屏为例来讲&#xff0c;云霸屏作为一款全网霸屏推广产品十分注重对…

个人博客网站html源码_最新0成本简单使用CODING Pages搭建Gridea个人博客网站详细教程...

直接0成本简单使用CODING Pages免费搭建Gridea个人博客网站&#xff0c;不需要购买域名也不需要购买服务器就可以搭建自己的博客教程开始gridea官网 gridea.devcoding官网 e.coding.net1、首先我们先注册一个coding账户2、然后创建一个代码托管项目&#xff0c;下面这里的项目名…

使用SHTML更好的维护门户网站(转)

< DOCTYPE html PUBLIC -WCDTD XHTML TransitionalEN httpwwwworgTRxhtmlDTDxhtml-transitionaldtd> 转自&#xff1a;http://blog.breakn.net/article.asp?id266目前为部分访问量大的页面自动生成HTML的方式&#xff0c;不过一些很多页面都要用到的菜单什么的如果要改就…

ASP.NET构建动态网站之综合实验

经过以上的学习&#xff0c;我们了解了C#控制台程序和ASP.NET程序的区别&#xff0c;学习了变量、运算符、表达式的应用&#xff0c;并且学会了使用ASP.NET程序实现各种页面功能&#xff0c;已初步掌握了程序结构和数组在页面中的用法&#xff0c;以及控件在页面中的应用。本次…

电子商务B2C网站数据分析全流程

“请举手!如果你的用户转化率每天达到了5%。”如果这样问中国所有的B2C网站。结果是&#xff0c;一个举手的人都没有。目前&#xff0c;绝大多数B2C的转化率都在1%以下&#xff0c;做的最好的也只能到3.5%左右(比如以卖图书为主的当当)我想&#xff0c;所有的B2C都会关心三个问…

最好最牛的101个网站 【达人必修】

最好最牛的101个网站 【达人必修】 发了一年时间收集的好东西&#xff0c;汇总分享给大家&#xff0c;喜欢的朋友记得顶一个哦。谢谢 1&#xff0c;用颜色搜索图片&#xff01;http://color.slightlyblue.com/ 2&#xff0c;几分钟 http://www.jifenzhong.com/ 好看的生活百科…

2011年国外最受欢迎的15个人才招聘网站

2019独角兽企业重金招聘Python工程师标准>>> 面向全球电子商务知识库网站eBizMBA公布了2011年国外最受欢迎的15个人才招聘网站&#xff1a; 1 Yahoo! HotJobs (http://www.hotjobs.yahoo.com) eBizMBA排名第99&#xff0c;估计每月访客40000000人&#xff0c;竞争力…

搜索引擎制作_四川网站建设制作,搜索引擎付费推广公司哪家好

武汉伊夕网络科技有限公司为您详细解读WQGnin四川网站建设制作的相关知识与详情&#xff0c;正在网络推广中&#xff0c;网站地图是一个不成或缺的因素。陈某们凡是习惯正在网站上添加网站地图&#xff0c;但很少有人实正考虑为什么要添加&#xff0c;功用是什么。陈某们凡是将…

js如何将跨域打开的窗口放到最前面_程序员的强迫症-便捷打开常用网站

根据上一篇 程序员的强迫症–如何让电脑桌面变得非常干净&#xff1f;可以让电脑桌面非常简洁、干净&#xff0c;win r 快速打开应用程序、常用文件夹。这篇就介绍 win r 便捷打开常用网站&#xff0c;优化管理我们在日常生活、办公中都有一些常用网站&#xff0c;我们一般都…

实操2 : 清洗招聘网站职位信息数据集 如何删除所有薪酬为 “面议“ 的值所在的行

(一) 问题描述 现有一招聘网站职位信息数据集, 数据集部分内容如下图所示, 现在我们需要的解决的问题是 该数据集中薪酬列有很多行填写的是 “面议”, 而一条招聘信息中包含有 “面议” 则没有参考价值 应当删去。那么我们如何将所有薪酬列为 “面议” 的行进行删除?     …

实操3 : 清洗招聘网站职位信息数据集 如何将薪酬转为数字类型+如何计算月薪

(一) 问题描述 待处理的数据集如下图所示, 很明显薪酬一栏为字符串类型, 而这样我们无法对其进行数学运算, 所以我们应当将薪酬一列转为数字类型, 且利用薪酬列的年薪计算出每月的平均工资 (二) 解决方案 import pandas as pd# 导入数据集 df pd.read_csv(E:/Code/数据分析/d…

实操4 : 清洗招聘网站职位信息数据集 如何将不同学历从枚举表示转变为数字类型表示

(一) 问题描述 数据集如下所示, 现在待解决的问题是数据集中学历一列是被枚举出来的, 如 “初中”, “高中”, “大学” 等不同的学历, 但是当要用数据集进行数据分析时就需要把这种枚举的字符串类型转为数字类型。   如:     “初中” → 0,     “高中” → 1,   …

实操1 : 如何搭建IP代理池和Agent池 + 使用 requests、xpath 通过关键词多层级多页面爬取某习僧网站的详情页

(一) 问题描述 如果要从某习僧网站上面爬取到数据, 我们需要做的大体上有五件事情 :     1.定义关键词字典     2.在搜索到的招聘信息列表中点击一条进入到其详情页面爬取数据     3.爬取完毕后退出到招聘信息列表并进入下一行爬取详情页面信息     4.爬取完一…

优化网站设计(二十三):减小Cookie的体积

前言 网站设计的优化是一个很大的话题,有一些通用的原则,也有针对不同开发平台的一些建议。这方面的研究一直没有停止过&#xff0c;我在不同的场合也分享过这样的话题。 作为通用的原则&#xff0c;雅虎的工程师团队曾经给出过35个最佳实践。这个列表请参考 Best Practices fo…

覆盖ftp服务器上面的图片后网站的原图为什么不变呀?,Win7下架设FTP服务器失败的原图...

前一段时间&#xff0c;想在Windows7系统下搭建一个FTP服务器&#xff0c;可是按照别人的成功搭建的步骤&#xff0c;我却没有成功&#xff0c;最后检验的结果是&#xff1a;提示&#xff1a;“Windows无法访问此文件夹。请确保输入的文件名是正确的&#xff0c;并且您有权访问…

服务器访问危险网站降权重,网站权重下降,原因有哪些?如何处理?

原标题&#xff1a;网站权重下降&#xff0c;原因有哪些?如何处理?很多站长对网站进行维护的时候&#xff0c;经常遇到类似的问题&#xff0c;就是网站关键词排名下降了通过查询发现网站权重也下降了?是什么原因造成的。影响网站权重下降的原因&#xff1a;1、影响权重的外在…

真人测试网站用户体验的超棒在线服务 - Peek by UserTesting

闲逛的过程中找到的这个工具网站&#xff0c;它可以帮助你测试你的网站用户体验&#xff0c;而且会发送给你一个5分钟的视频来展示一个实际的用户&#xff08;不是机器&#xff0c;是人哦&#xff09;如何操作你的网站的&#xff0c;这个服务目前免费&#xff0c;大家如果有兴趣…

大型网站系统与Java中间件实践

大型网站系统与Java中间件实践&#xff08;贯通分布式高并发高数据高访问量网站架构与实现之权威著作&#xff0c;九大一线互联网公司CTO联合推荐&#xff09;曾宪杰 著 ISBN 978-7-121-22761-52014年4月出版定价&#xff1a;65.00元 340页16开编辑推荐到底是本什么书&#x…

linux rsync 目录同步,Linux rsync网站目录同步功能的实现

实现目标&#xff1a;172.16.1.64服务器上的/var/www/sw_service目录&#xff0c;与172.16.1.60服务器上的/var/www/sw_service目录实现同步&#xff0c;即1.60主动向1.64同步环境配置&#xff1a;Server-->172.16.1.64 /var/www/sw_serviceClient-->172.16.1.60 /…