遇到需要的登录的网站怎么办?用这3招轻松搞定!

news/2024/5/10 18:58:43/文章来源:https://blog.csdn.net/PythonJavaPHP/article/details/103140842

你好

 

由于你是游客

 

无法查看本文

 

请你登录再进

 

谢谢合作

 

 

当你在爬某些网站的时候

 

需要你登录才可以获取数据

 

咋整?

 

莫慌

 

小帅b把这几招传授给你

 

让你以后从容应对

 

 

那么

 

接下来就是

 

学习 python 的正确姿势

 

 

登录的常见方法无非是这两种

 

1、让你输入帐号和密码登录

 

 

2、让你输入帐号密码+验证码登录

 

 

今天

 

小帅b先跟你说说第一种

 

需要验证码的咱们下一篇再讲

 

第一招

 

 

Cookie大法

 

你平常在上某个不为人知的网站的时候

 

是不是发现你只要登录一次

 

就可以一直看到你想要的内容

 

过了一阵子才需要再次登录

 

这就是因为 Cookie 在做怪

 

简单来说

 

就是每一个使用这个网站的人

 

服务器都会给他一个 Cookie

 

那么下次你再请求数据的时候

 

你顺带把这个 Cookie 传过去

 

服务器一看

 

诶,小伙子是老客户啊

 

 

有登录过

 

直接返回数据给他吧

 

在服务中还可以设置 Cookie 的有效时间

 

也就是说

 

当你下次携带一个过期了的 Cookie 给服务器的时候

 

服务器虽然知道你是老客户

 

但是还是需要你重新再登录一次

 

然后再给你一个有效的 Cookie

 

Cookie 的时长周期是服务器那边定的

 

ok

 

了解了这一点之后

 

我们就来玩一下吧

 

我们以「逼乎」为例

 

https://biihu.cc/account/login/

 

输入地址之后

 

 

按一下 F12

 

点击 network 标签

 

然后登录你的帐号

 

然后点击其中一个

 

你就可以看到在 Request Headers 有你的 Cookie

 

 

 

有了 Cookie 之后

 

我们在代码中直接获取我的个人信息

 

  •  
  •  
  •  
  •  
  •  
  •  
  •  
  •  
  •  
  •  
  •  
  •  
  •  
import requests
headers = {    # 假装自己是浏览器    'User-Agent': 'Mozilla/5.0 (X11; Linux x86_64) AppleWebKit/537.36 (KHTML, like Gecko) Ubuntu Chromium/73.0.3683.75 Chrome/73.0.3683.75 Safari/537.36',    # 把你刚刚拿到的Cookie塞进来    'Cookie': 'eda38d470a662ef3606390ac3b84b86f9; Hm_lvt_f1d3b035c559e31c390733e79e080736=1553503899; biihu__user_login=omvZVatKKSlcXbJGmXXew9BmqediJ4lzNoYGzLQjTR%2Fjw1wOz3o4lIacanmcNncX1PsRne5tXpE9r1sqrkdhAYQrugGVfaBICYp8BAQ7yBKnMpAwicq7pZgQ2pg38ZzFyEZVUvOvFHYj3cChZFEWqQ%3D%3D; Hm_lpvt_f1d3b035c559e31c390733e79e080736=1553505597',}
session = requests.Session()response = session.get('https://biihu.cc/people/wistbean%E7%9C%9F%E7%89%B9%E4%B9%88%E5%B8%85', headers=headers)
print(response.text)

 

运行后可以发现不用登录就可以直接拿到自己的个人信息了

<!DOCTYPE html><html><head><meta content="text/html;charset=utf-8" http-equiv="Content-Type" /><meta content="width=device-width, initial-scale=1.0, maximum-scale=1.0, user-scalable=no" name="viewport" /><meta http-equiv="X-UA-Compatible" content="IE=edge,Chrome=1" /><meta name="renderer" content="webkit" /><title>小帅b真特么帅 的个人主页 - 逼乎</title><meta name="keywords" content="逼乎,问答,装逼,逼乎网站" /><meta name="description" content="逼乎 ,与世界分享你的装逼技巧与见解" /><base href="https://biihu.cc/" /><!--[if IE]></base><![endif]--><link rel="stylesheet" type="text/css" href="https://biihu.cc/static/css/bootstrap.css" /><link rel="stylesheet" type="text/css" href="https://biihu.cc/static/css/icon.css" /><link href="https://biihu.cc/static/css/default/common.css?v=20180831" rel="stylesheet" type="text/css" /><link href="https://biihu.cc/static/css/default/link.css?v=20180831" rel="stylesheet" type="text/css" /><link href="https://biihu.cc/static/js/plug_module/style.css?v=20180831" rel="stylesheet" type="text/css" /><link href="https://biihu.cc/static/css/default/user.css?v=20180831" rel="stylesheet" type="text/css" /><link href="https://biihu.cc/static/css/mood/mood.css" rel="stylesheet" type="text/css" /><script type="text/javascript"> var _02AEC94D5CA08B39FC0E1F7CC220F9B4="a5359326797de302bfc9aa6302c001b8"; var G_POST_HASH=_02AEC94D5CA08B39FC0E1F7CC220F9B4; var G_INDEX_SCRIPT = ""; var G_SITE_NAME = "逼乎"; var G_BASE_URL = "https://biihu.cc"; var G_STATIC_URL = "https://biihu.cc/static"; var G_UPLOAD_URL = "/uploads"; var G_USER_ID = "188";  var G_USER_NAME = "小帅b真特么帅"; var G_UPLOAD_ENABLE = "Y"; var G_UNREAD_NOTIFICATION = 0; var G_NOTIFICATION_INTERVAL = 100000; var G_CAN_CREATE_TOPIC = "1"; var G_ADVANCED_EDITOR_ENABLE = "Y"; var FILE_TYPES = "jpg,jpeg,png,gif,zip,doc,docx,rar,pdf,psd";</script><script src="https://biihu.cc/static/js/jquery.2.js?v=20180831" type="text/javascript"></script> ....

 

 

第二招

 

 

表单请求大法

 

很简单

 

就是通过抓包

 

获取请求登录的时候需要用到的用户名密码参数

 

然后以表单的形式请求服务器

 

如果你细心一点的话应该会知道之前说过拉

 

具体在这

去看下

我就不多说了

 

python爬虫03:那个叫做 Urllib 的库让我们的 python 假装是浏览器

 

 

第三招

 

 

Selenium 自动登录法

 

你应该看过这两个

 

python爬虫09 | 上来,自己动 !这就是 selenium 的牛逼之处

python爬虫11 | 这次,将带你爬取b站上的NBA形象大使蔡徐坤和他的球友们

 

看过的话

 

那么对于你来说

 

Selenium 自动登录也太 tm 简单了吧

 

获取到两个输入框的元素

 

再获取到登录按钮

 

往输入框写你的帐号密码

 

然后自动点击一下登录

 

  •  
  •  
  •  
  •  
  •  
  •  
  •  
username = WAIT.until(EC.presence_of_element_located((By.CSS_SELECTOR, "帐号的selector")))password = WAIT.until(EC.presence_of_element_located((By.CSS_SELECTOR, "密码的selector")))submit = WAIT.until(EC.element_to_be_clickable((By.XPATH, '按钮的xpath')))
username.send_keys('你的帐号')password.send_keys('你的密码')submit.click()

 

登录完之后拿到 Cookie

 

  •  
cookies = webdriver.get_cookies()

 

有了 Cookie 你就可以拿到你想要的数据了

 

ok

 

以上这三招

 

 

希望对你有帮助

 

咱们下一篇说说验证码相关

 

下回见

 

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.luyixian.cn/news_show_855241.aspx

如若内容造成侵权/违法违规/事实不符,请联系dt猫网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

python爬虫教程,爬取任意网站上面的视频!

前言 对于Python爬虫很多人都不陌生&#xff0c;可以用它来批量下载文字、图片、视频等&#xff0c;其中涉及的知识点也是比较多的&#xff0c;但是Python中有一个方法&#xff0c;一行代码就能爬取任意网站上面的视频&#xff0c;只要你安装了Python环境就可以&#xff0c;哪…

Python爬虫,批量下载小说网站上的小说!

爬虫脚本把这个小说网上的几乎所有小说都下载到了本地&#xff0c;一共27000本小说&#xff0c;一共40G。 完整代码&#xff1a; #codingutf-8 2 import urllib 3 import urllib2 4 import re 5 import os 6 7 webroot http://www.xuanshu.com 8 9 for page in range(20,220…

如何使用 Python 和 BeautifulSoup 爬取网站!

互联网上的信息如此之多&#xff0c;任何人穷其一生也无法全部消化吸收。你需要的不是访问这些信息&#xff0c;而是一种可伸缩的方式&#xff0c;可以用来收集、组织和分析这些信息。你需要的是 Web 爬取。Web 爬取可以自动提取数据&#xff0c;并以一种让你可以轻松理解的格式…

江南鹤微信hook c#版已实现webhook,在你的网站中也可以调用hook了

可以将hook软件放在服务器上。在客户端电脑上用web调用即可。 特色&#xff1a; 1 每次登录只显示二维码&#xff0c;不再显示上次登录的用户 2 设置好不自动更新后&#xff0c;会保存。下次用户登录&#xff0c;程序也不会自动更新。 交流vx&#xff1a;weixinhook 第一步…

Python Flask 搭建个人网站

介绍Hello Kuko 是使用PythonFlask这样的组合搭建的网站&#xff0c;虽然其中的功能根本没有。项目已开源到github&#xff1a;kukoapp.pyimport io import json import os import randomfrom flask import Flask from flask import url_for from flask import request from fl…

CentOS 简便方法新手搭建一个网站

该文章写给从来没有搭建过网站的小伙伴们的&#xff0c;大佬们就不要浪费时间看下去了。 只搭建nginx&#xff0c;不搭建后端、数据库等相关服务&#xff0c;目的是让小伙伴能在刚刚学习完Html、css、js之后能够更直观的访问到自己的网页。 如何快速的搭建一个网站呢&#xf…

docnet 开发需要知道的网站!()

当前全球有数百万的开发人员在使用微软的.NET 技术。如果你是其中之一&#xff0c;或者想要成为其中之一的话&#xff0c;我下面将要列出的每一个站点都应该是你的最爱&#xff0c;都应该收藏到书签中去。 对于不熟悉.NET技术的朋友&#xff0c;需要说明一下&#xff0c;.NET…

vs2010发布网站

发布网站步骤&#xff1a; 1、新建网站&#xff1a; 打开IIS&#xff0c;右击网站——>添加网站 填写网站名称&#xff08;随便写&#xff09;和应用程序池名称 物理路径选择你要存放发布网站的位置&#xff08;最好自己新建一个空的文件夹&#xff09; 点击身份验证下的链…

chrome 打开csdn网站显示有问题

换一个浏览器就不会 这是为啥

详解微软网站三剑客之Graphic Designer

Adobe合并Macromedia后&#xff0c;就不断传来微软开发图形图像和动画软件的消息。不过信息少的可怜&#xff0c;特别是号称Flash杀手的“Sparkle”&#xff0c;除了一条简短的新闻就没别的了。所谓厚积薄发&#xff0c;没想到微软这次一出手就是三款设计软件&#xff0c;看来是…

Ubuntu 12.04下搭建Web网站服务器 (MySQL+PHP+Apache环境)教程

Ubuntu 12.04下搭建Web网站服务器 &#xff08;MySQLPHPApache环境&#xff09;教程 作者&#xff1a;木瓜 发布&#xff1a;2012-04-28 22:06 分类&#xff1a;网络 阅读&#xff1a;1832次 10条评论 分享到&#xff1a;QQ空间新浪微博腾讯微博人人网更多10前言 看了…

在网站上添加百度搜索

我们自己开发的个人网站有时需要将百度搜索加上&#xff0c;怎么加呢&#xff1f; 其实很简单&#xff0c;将如下代码加到自己需要的网页上即可&#xff1a; 当然有技术的朋友可以到hao123上参考&#xff0c;将hao123上的百度搜索条拿来自己用。 <form data-hook"sear…

demo4 表格隔行变色效果 onmouseout onmouseover

let trs document.querySelector(tbody).querySelectorAll(tr)for(let i0;i<trs.length;i){// 鼠标经过事件trs[i].onmouseover function(){this.className bg}// 鼠标离开事件trs[i].onmouseout function(){this.className }}

大学四年,靠着这些学习网站,我从挂科学渣变成了别人眼中的大神

原文链接&#xff1a; https://blog.csdn.net/JAck_chen0309/article/details/104780288 前记 毕业合影时&#xff0c;导员笑着对我说“你可是我们系里的风云人物”。我也笑了&#xff0c;思绪却回到了四年前。 还记得四年前&#xff0c;我从小县城里走出&#xff0c;来到学校…

docker-compose 配置 nginx + node + mysql 网站环境

本文需要熟悉 Docker、Node、Nginx 的基础知识&#xff0c;如果不熟悉的同学需要查看文档了解学习后阅读。 Docker - 从入门到实践Node.js v10.15.3 文档Nginx 入门指南 这里开始正文 准备测试代码 初始化一个项目目录&#xff0c;并配置基础的测试代码 简单的一些代码下面不…

为你的网站配置一个小巧的框架( CodeIgniter)

现在的web开发确实已经到了无框架卜欢乐的状态&#xff0c;无论是前端&#xff1a;JavaScript&#xff08;vue.js\react.js\angular.js框架和jQuery库&#xff09;&#xff0c;CSS&#xff08;bootstrap&#xff09;&#xff0c;还是后端&#xff1a;PHP&#xff08;CI/thinkPH…

使用postman测试需要登陆认证网站的api

postman作为一款web开发中必备的神器&#xff0c;有很多只是需要我们去学习 如果想要使用postman测试需要登陆认证网站的api&#xff0c;只需开启一个按钮&#xff1a; 然后在头部添加cookie以及X-CSRFToken&#xff08;因为项目是django&#xff09;

用户点击与网站目标 - 基于Google Analytics的应用

转载出处: http://webdataanalysis.net/tool-for-web-analytics/click-and-goal/ 用户在网站的行为其实无非就是输入和点击&#xff0c;而点击又是最常见的行为&#xff0c;其实用户行为分析一大部分就是在分析用户各种各样的点击行为。我们可以通过各种途径来监控用户点击行为…

三招教你提升团购网站流量转化率(上)

转载出处: http://hi.baidu.com/%CE%A4%B2%AE%C4%C9%CB%B9/blog/item/21f173c3275b82c7d10060a0.html/cmtid/8501cf90d0feb311d21b70ea 本人负责经营美心计化妆品团购网站&#xff0c;日常推广需要对流量进行分析。而流量分析中的核心是分析流量的价值&#xff0c;流量的价值是…

学习Web 开发技术的16个国外最佳教程网站和博客

转载地址: http://www.w3cfuns.com/article-788-1.html 互联网经过这么多年的发展&#xff0c;已经出现了众多的 Web 开发技术&#xff0c;像 .Net/Java/PHP/Python/Ruby 等等。对于 Web 开发人员来说&#xff0c;不管是初学者还是有一定经验的开发人员都需要时刻学习新的开发…