python求职网站_用Python爬取各大网站招聘平台,终于让我给知道对口的工作

news/2024/5/20 22:12:16/文章来源:https://blog.csdn.net/weixin_39637979/article/details/110379639

原标题:用Python爬取各大网站招聘平台,终于让我给知道对口的工作

个人经历:低不成,高不就

依稀还记得15年刚出来工作那会,在第一个互联网公司实习,在公司听惯了身边人说公司这不好,那不好,作为新人的我深受影响,不知从何时开始就想快点结束实习期换一份更好的工作;

千盼万盼,终于迎来第二年的毕业,毕业后我也选择了大部分实习生的选择,没有再回到公司,在之后,懵懂的我终于迎来人生的第一次打击,在之后的两个月的时间,我开始在做比较,结果没有找到一家比上家更好的工作,由于当初的不辞而别,我也感觉没脸回到上家公司,终于到了身无分文的地步,而我也不得以选择一家“差”的公司,想着做几个月存点钱再去找一份更好的工作;

这样的恶性循环在我身上循环了一年,“低不成,高不就”的现象也许不只是出现在我身上,下面教你如果找到一份自己相对满意的工作!

fdff11d2b3d9408997426a9e9538b3fb.jpeg

正文:找一份自己满意的工作

拿一个招聘网站用来分析:

1、分析网站结构,确定我们要抓取的数据内容

通过 Chrome 浏览器右键检查查看 network 并对网站结构进行分析发现我们在 ajax 请求界面中,可以看到这些返回的数据正是网站页面中Python岗位招聘的详情信息。

8931e5f853db45e0854898df6f20c92e.jpeg

之后我们在查看headers的时候发现该网站请求的方式是Post请求,也就是说在请求的过程中需要携带Form Data数据

95b54dc94a2d498b8c3f844b929a8bdc.jpeg

在多次对网页界面进行分析评测的时候,发现在点击第二页的时候Form Data的携带格式发生了变化。可以看到 pn=2 肯定是咱们的当前的页数。

847b4816de9d4726bd9df07ed713b0f5.jpeg

2、不管三七二十一 ,先请求拿到数据在说

4ed32f3e889b4dc49619df0590b758b9.jpeg

在直接请求界面的时候我们发现网站有反爬机制,不让我们请求《“msg”:“您操作太频繁,请稍后再访问”》,我们携带请求头伪装一下,不行

1092c99cea2f40c3b7edbd7dbecf7d71.jpeg

这里我用了一种可以快速生成headers以及cookie的工具:

7ad56274f57f46479a38fd67427819c2.jpeg

我怀疑该网站具有多重反爬策略,当我在次添加cookies试一下的时候;我们发现数据可以正常获取了;难道就这么简单就解决拉勾网数据获取的问题了吗?然而机智的我察觉到事情并没有想像的那么简单;

95a053c2ccf14cc9a61c04606a4112d0.jpeg

我的最终解决方案是共用 session,就是说我们在每次请求界面的时候先获取session然后原地更新我们的session之后在进行数据的抓取,最后拿到想要的数据。

a4998e9150384f12b11527db00119396.jpeg

第二步:对数据进行分解

71b6340b15be4d8e8866594e3ce51486.jpeg

运行结果:

0ac9ecca56954c04b7264f9364080449.jpeg

第三步:对解析数据进行存储

这里通过 excel 表格的形式进行存储;

需要 pip install xlwt 安装一下 xlwt 库.

5b37283170c3447f84d6d86abfde5f0e.jpeg

最终显示数据内容

责任编辑:

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.luyixian.cn/news_show_760603.aspx

如若内容造成侵权/违法违规/事实不符,请联系dt猫网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

网站被挂了很多链接 源码里边看不到_操作源码平台月入万元的创业项目实操方法和步骤...

项目背景:很多人做电商或者互联网其他行业,第一步都要做一个站点。但是又不愿意多出钱,因此就有人去找一些源码做个站。大家知道一个站是由三部分组成的,分别是域名,服务器和程序,所谓的程序也就是源码。什…

freeradius 用户时间限制_网站越来越卡?那是你的虚拟主机流量被限制了!

在讨论这个问题前,我们必须知道网站流量和虚拟主机流量的有什么区别。网站流量一般指网站访问量,用来表明一个网站的浏览数量,用PV/UV表示。而虚拟主机流量主要指代用户在访问过程中所产生的数据量,例如加载图片视频等消耗了5G、1…

matlab psf点扩散函数,什么是点扩散函数PSF?-ZEMAX,OpticStudio-光行天下-国内光电行业门户-光学,光电,光机技术及其软件运用专业网站!...

概要这篇文章讲述了:什么是点扩散函数?点列图快速傅里叶变换计算的点扩散函数(FFT PSF)惠更斯算法计算的点扩散函数(Huygens PSF)如何使用非序列模式下的透镜和探测器观察惠更斯积分对于序列模式下的透镜组,分析点扩散函数时如何在惠更斯和快…

去除标题_什么是网站标题堆砌?

相信在做网站优化的小伙伴,见到过很多的网站标题堆砌的问题,从搜索引擎推出的清风算法可以看出,对于网站标题关键词多次出现会被搜索引擎视为一种作弊的行为,严重的话会被搜索引擎限制搜索结果展现,引起网站降权、限制…

实验楼网站mysql_实验楼mysql实验-搭建一个简易的成绩管理系统的数据库

网址如下https://www.shiyanlou.com/courses/running ,pass之后的体验还蛮好的,。首先打开终端,双击xfce终端或右键打开终端开启数据库服务 ,连接数据库首先创建新的数据库create database gradesystem;接着选择新创建的数据库 us…

网站 mysql 密码 查询_分享几个默认密码在线查询网站

网络设备忘记了密码,不要慌,先看一下厂家和型号,找找产品手册,不行就在线查一查,比如下面这几个网站,说不定有惊喜。本文分享几个默认密码在线查询网站,仅用于用户找回默认密码,不许…

邮箱@topgrid.cn是什么网站_想知道自己的邮箱或手机号注册过哪些网站?这一招教你一键查询...

怎么看自己注册过哪些网站?如今很多网站或手机APP都需要邮箱或手机验证注册,时间一长,我们很容易忘记在哪些平台上注册过账号,尤其是一些需要换手机号的朋友,需要提前在各大网站/APP解绑账号,以免影响后续使…

adobe怎么统计字数_优化网站文章标题怎么写?

网站文章和发到其他平台的文章还是有很大的区别的,他首要的任务是优化,所以文章标题并不是乱写一些热点就可以给自己家的网站带来流量。现在信息爆炸,人的阅读速度不是快,而是有选择的读,所以标题是非常重要的。在搜索…

mysql 中文社区版_mysql数据库下载官网_mysql中文官方网站下载

MySQL数据库下载与安装详细教程 1.首先进入官网 下载安装包 进去之后如图所示,依次点击DOWNLOADS—>如何在官网上下载可安装版的MySQL数据库,MySQL数据库安装软件有解压版和安装版,解压版需要配置环境参数,本文主要介绍MySQL数据库从下载到…

1h2g云服务器做网站,云服务器1h2g

云服务器1h2g 内容精选换一换扩容云服务器后,通过查看云服务器的规格和各项容量指标验证扩容是否成功。登录华为云“管理控制台”页面。单击服务列表计算弹性云服务器。在弹性云服务器列表中,在待变更资源的云服务器所在行的规格/镜像列,查看…

[导入]门户网站

门户网站门户(portal)。原意是指正门、入口,现多用于互联网的门户网站和企业应用系统的门户系统。广义注解这里是一个应用框架,它将各种应用系统、数据资源和互联网资源集成到一个信息管理平台之上,并以统一的用户界面…

Web开发中的性能:谈Google和Facebook的网站使用到的技术,图片预加载CSS Sprites

(January 11) http://www.handandaily.com首先我要说的是博客园的速度打开的很慢,深圳南山的如果你知道这种技术,那就不用进来了,1.首先你先打开下面两个连接:(下面链接不是一般的图片,无毒无广告)http://static.ak.facebook.com/images/spri…

开发第一个动态网站———使用JSP

这是一个用JSP开发第一个动态网站的例子. 在这个例子中,我们实现的是在第一个页面,让用户输入自己的昵称,然后在第二个页面中显示第一个页面输入的昵称。通过这个例子,基本了…

如何修改MOSS网站名(主机标头)

修改MOSS网站名(主机标头) 编写人:顾劲松 一、问题现状描述 在MOSS中创建的网站时,如果不指定网站的标头,MOSS会使用主机名作为网站标头。例如,我们在服务器myhigerweb上安装部署的MOSS网站,从I…

高并发高流量网站架构(转)

高并发高流量网站架构(转) Web2.0的兴起,掀起了互联网新一轮的网络创业大潮。以用户为导向的新网站建设概念,细分了网站功能和用户群,不仅成功的造就了一大批新生的网站,也极大的方便了上网的人们。但Web2.0以用户为导向的理念&am…

quasar携程框架_Quasar框架:构建响应式网站和混合移动应用程序

quasar携程框架类星体框架 (Quasar Framework) Build responsive websites and hybrid mobile Apps (that look native!) using same code, with VueJs. 通过VueJ使用相同的代码构建响应式网站和混合移动应用程序(看起来很自然!)。 网站 (website) http://quasar-f…

vuejs 前提是数据响应_使用VueJs 2构建响应式网站和混合移动应用程序

vuejs 前提是数据响应类星体框架 (Quasar Framework) Build responsive websites and hybrid mobile Apps (that look native!) using same code, with VueJs 2. 使用VueJs 2使用相同的代码构建响应式网站和混合移动应用程序(看起来很自然!)。 Quasar Framework is…

vue构建项目可视化_Vue和Electron的网站可视化构建器

vue构建项目可视化视觉设计 (vue-design) Be the best website visualization builder with Vue and Electron. 借助Vue和Electron成为最佳的网站可视化构建器。 Download Source 下载源 ✨特点: (✨ Features:) desktop application build with electron 电子版桌…

网站系统 上传

准备工作完成后,就可以正式安装weenCompany系统了,在浏览器中输入网址: www.weentech.com (当weenCompany上传到网站的根目录时)www.weentech.com/xyz (当weenCompany上传到网站某特定目录xyz下时)当weenCompany判断为初次安装时,…