python登录网站脚本_Python爬虫之用脚本登录Github并查看信息

news/2024/5/9 12:58:47/文章来源:https://blog.csdn.net/weixin_39779467/article/details/110274033

前言分析目标网站的登录方式

目标地址：https://github.com/login

登录方式做出分析：

第一，用form表单方式提交信息，

第二，有csrf_token,

第三，是以post请求发送用户名和密码时，需要第一次get请求的cookie

第四，登录成功以后，请求其他页面是只需要带第一次登录成功以后返回的cookie就可以。

以get发送的请求获取我们想要的token和cookie

代码：

import requests

from bs4 import BeautifulSoup

r1 = requests.get('https://github.com/login')

soup = BeautifulSoup(r1.text,features='lxml') #生成soup 对象

s1 = soup.find(name='input',attrs={'name':'authenticity_token'}).get('value')

#查到我们要的token

r1_cookies = r1.cookies.get_dict() # 下次提交用户名时用的cookie

# print(r1_cookies)

# print(s1)

#结果：：

{'logged_in': 'no', '_gh_sess': 'VDFWa2hJWjFMb1hpRUFLRDVhUmc3MXg1Tk02TDhsUnhDMERuNGpyT2Y4STlQZ2xCV1lCZEFhK21wdFR1bkpGYUV0WEJzcDEydWFzcm93

aVc4Nk91Q2JicmtRV0NIQ0lRSWM4aFhrSVFYbCtCczBwdnhVN0YySVJJNUFpQnhyTzNuRkJwNDJZUWxUcEk2M2JkM3VSMDdXVHNOY1htQkthckJQZDJyUVR2RzBNUkU3VnltRVF2U

m1admU3c3YzSGlyVnVZVm0ycnA1eUhET1JRVWNLN0pSbndKWjljMGttNG5URWJ1eU8rQjZXNEMxVEthcGVObDFBY2gvc2ZzWXcvWWZab29wQWJyU0l6cmZscWhBQUlzYTA3dTRtb

3l1S0hDYytHY2V1SUhEWlZvVlZoSWZpTzBjNmlidFF2dzI2bWgtLTJON1lqbm5jWUtSYmtiVEM1clJPakE9PQ%3D%3D--897dbc36c123940c8eae5d86f276dead8318fd6c'}

pRz0wapEbu5shksGCeSN0FijWoU9ALw8EPUsXlqgcw1Ezirl0VbSKvkTYqIe8VhxhPH2H/uzGaV6XX+yjTGoVA==

获取这两个值就可以，进行下一步发送登录请求：

第二步post方式提交用户名密码

代码：：

这个代码接着上面的get请求，只是post请求的部分，

r2 = requests.post(

'https://github.com/session',

data ={

'commit':'Sign in',

'utf8':'✓',

'authenticity_token':s1,

'login':'541756569@qq.com',

'password':'用户名密码' # 填上正确的用户名即可

cookies = r1.cookies.get_dict(), # 这里需要第一次的cookie

)

print(r2.cookies.get_dict()) # 这个是成功以后的cookie

成功以后就返回登录页面的信息。

基于post登录成功后查看个人详情页。

这里只需要带着登录成功以后的cookie 就可以

#完整代码

import requests

from bs4 import BeautifulSoup

r1 = requests.get('https://github.com/login')

soup = BeautifulSoup(r1.text,features='lxml')

s1 = soup.find(name='input',attrs={'name':'authenticity_token'}).get('value')

r1_cookies = r1.cookies.get_dict()

print(r1_cookies)

print(s1)

r2 = requests.post(

'https://github.com/session',

data ={

'commit':'Sign in',

'utf8':'✓',

'authenticity_token':s1,

'login':'541756569@qq.com',

'password':'密码'

cookies = r1.cookies.get_dict(),

)

查看个人详情页

print(r2.cookies.get_dict())

r3 = requests.get(

'https://github.com/13131052183/product', #查看个人的详情页

cookies = r2.cookies.get_dict()

)

print(r3.text)

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.luyixian.cn/news_show_846842.aspx

如若内容造成侵权/违法违规/事实不符，请联系dt猫网进行投诉反馈email:809451989@qq.com，一经查实，立即删除！

python登录网站脚本_Python爬虫之用脚本登录Github并查看信息

相关文章

长尾词推广系统推荐乐云seo_如何进行长尾关键词优化

自动生成网站的工具

开发在线编程网站

mysql投票网站_ThinkPHP5+jQuery+MySql实现投票功能

站点html标贴验证,SEO优化之详解百度站点验证

php网站安全狗绕过,绕过网站安全狗拦截，上传Webshell技巧总结 | 附免杀PHP一句话...

百度关键词抓取工具_SEO：想提升关键词排名？你还缺一份seo优化大全

ngrok内网穿透映射使用与注册让外网访问你的网站

大型网站架构之分布式消息队列

网站架构第一篇

python 3 爬取某小说网站小说，注释详细

如何用自己电脑做服务器，绑定域名建一个个人网站

Android 学习论坛博客及网站推荐

【2019.6.11可用】chrome提示“无法添加来自此网站的应用、扩展程序和应用脚本”的解决办法

猪八戒学做网站之HTML5篇（2）：编写网页的工具

猪八戒学做网站之HTML5篇（3）：网页不是图片

猪八戒学做网站之HTML5篇（5）：Hello HTML

猪八戒学做网站之HTML5篇（6）：标签！标签！

在VS2008中创建自定义控件（一）创建网站项目和自定义控件项目

python从网站抓取特定内容