用Python爬取各大网站招聘平台,终于让我给知道对口的工作

news/2024/5/21 0:14:47/文章来源:https://blog.csdn.net/chen801090/article/details/103681713

个人经历:低不成,高不就

依稀还记得15年刚出来工作那会,在第一个互联网公司实习,在公司听惯了身边人说公司这不好,那不好,作为新人的我深受影响,不知从何时开始就想快点结束实习期换一份更好的工作;

千盼万盼,终于迎来第二年的毕业,毕业后我也选择了大部分实习生的选择,没有再回到公司,在之后,懵懂的我终于迎来人生的第一次打击,在之后的两个月的时间,我开始在做比较,结果没有找到一家比上家更好的工作,由于当初的不辞而别,我也感觉没脸回到上家公司,终于到了身无分文的地步,而我也不得以选择一家“差”的公司,想着做几个月存点钱再去找一份更好的工作;

这样的恶性循环在我身上循环了一年,“低不成,高不就”的现象也许不只是出现在我身上,下面教你如果找到一份自己相对满意的工作!

用Python爬取各大网站招聘平台,终于让我给知道对口的工作

 

正文:找一份自己满意的工作

拿一个招聘网站用来分析:

1、分析网站结构,确定我们要抓取的数据内容

通过 Chrome 浏览器右键检查查看 network 并对网站结构进行分析发现我们在 ajax 请求界面中,可以看到这些返回的数据正是网站页面中Python岗位招聘的详情信息。

用Python爬取各大网站招聘平台,终于让我给知道对口的工作

 

之后我们在查看headers的时候发现该网站请求的方式是Post请求,也就是说在请求的过程中需要携带Form Data数据

用Python爬取各大网站招聘平台,终于让我给知道对口的工作

 

在多次对网页界面进行分析评测的时候,发现在点击第二页的时候Form Data的携带格式发生了变化。可以看到 pn=2 肯定是咱们的当前的页数。

用Python爬取各大网站招聘平台,终于让我给知道对口的工作

 

2、不管三七二十一 ,先请求拿到数据在说

用Python爬取各大网站招聘平台,终于让我给知道对口的工作

 

在直接请求界面的时候我们发现网站有反爬机制,不让我们请求《“msg”:“您操作太频繁,请稍后再访问”》,我们携带请求头伪装一下,不行

用Python爬取各大网站招聘平台,终于让我给知道对口的工作

 

这里我用了一种可以快速生成headers以及cookie的工具:

用Python爬取各大网站招聘平台,终于让我给知道对口的工作

 

我怀疑该网站具有多重反爬策略,当我在次添加cookies试一下的时候;我们发现数据可以正常获取了;难道就这么简单就解决拉勾网数据获取的问题了吗?然而机智的我察觉到事情并没有想像的那么简单;

用Python爬取各大网站招聘平台,终于让我给知道对口的工作

 

我的最终解决方案是共用 session,就是说我们在每次请求界面的时候先获取session然后原地更新我们的session之后在进行数据的抓取,最后拿到想要的数据。

用Python爬取各大网站招聘平台,终于让我给知道对口的工作

 

第二步:对数据进行分解

用Python爬取各大网站招聘平台,终于让我给知道对口的工作

 

运行结果:

用Python爬取各大网站招聘平台,终于让我给知道对口的工作

 

第三步:对解析数据进行存储

这里通过 excel 表格的形式进行存储;

需要 pip install xlwt 安装一下 xlwt 库.

用Python爬取各大网站招聘平台,终于让我给知道对口的工作

 

最终显示数据内容

用Python爬取各大网站招聘平台,终于让我给知道对口的工作

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.luyixian.cn/news_show_747906.aspx

如若内容造成侵权/违法违规/事实不符,请联系dt猫网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

用Python爬取各大网站招聘平台,终于让我给知道对口的工作

个人经历:低不成,高不就 依稀还记得15年刚出来工作那会,在第一个互联网公司实习,在公司听惯了身边人说公司这不好,那不好,作为新人的我深受影响,不知从何时开始就想快点结束实习期换一份更好的…

用Python清理收藏夹里已失效的网站

失效的书签们 我们日常浏览网站的时候,时不时会遇到些新奇的东西( 你懂的.jpg ),于是我们就默默的点了个收藏或者加书签。然而当我们面对成百上千的书签和收藏夹的时候,总会头疼不已…… 尤其是昨天还在更新的程序设计…

织梦怎么样备份网站

很多用织梦的朋友不知道怎么备份网站,还有些朋友备份网站的方式不对。当遇到网站被黑、服务器到期等关键时刻,导致数据丢失,网站不能用。新搭建网站就得一切从头再来,找技术恢复,又是一笔不小的开支。这是一种无形的损…

网市场云建站 v4.9 更新,增加网站子账户

开发四年只会写业务代码,分布式高并发都不会还做程序员? 网市场云建站系统,结合云技术,一台2核4G服务器可以建立超过4万个网站!打破传统建站的高成本,让价格不再是阻碍的门槛,让每个人都能有自…

Python_爬虫_爬取好大夫网站_数据清洗部分

1.前言 通过对好大夫网站内容的爬取,我们已经收集到好大夫的相关数据,并将其存入excel表中。之所以先存入excel表中,是因为有很多是非结构化数据,需要进行数据清理后在进行保存,excel中有很多的功能能够帮助进行数据清…

使用Apache服务部署静态网站。

1、安装Apache服务程序,命令后面的Apache服务的软件包名称为httpd。2、httpd服务程序并将其加入到开机启动项中3、在浏览器(这里以Firefox浏览器为例)的地址栏中输入http://127.0.0.1并按回车键,就可以看到用于提供Web服务的httpd…

php特级课---1、网站大访问量如何解决

php特级课---1、网站大访问量如何解决 一、总结 一句话总结: 负载均衡和冗余技术 1、负载均衡和冗余技术是一回事么? 并不是:负载均衡是用户分流;冗余技术是避免出现单点故障 负载均衡:将不同的用户分流到不同的服务器…

python实战教程:7万网站用户行为大数据的分析

今天的教程有点长,耐心点看完,你会有收获的。基础薄弱的伙伴,不清楚的可以留言,要视频学习教程的,可以留言! 7万网站用户行为大数据分析 数据分析师,是通过数据对业务团队决策、公司管理层的决…

手把手教你做毕业设计:基于JSP+MySQL的简单校园新闻网站(1)

系列教程来了!毕业设计头大的伙伴,看过来了!基础薄弱的伙伴,需要视频教程的,可以留言,我整理后发大家! 整体流程 做一个项目,首先是需求分析,将要做的东西说明白。 然后…

手把手教你做毕设计系列:基于JSP+MySQL的简单校园新闻网站(3)

系列教程(2)下一期出,保存的文件一下子打不开了,下期更新哈! 新建数据库 使用Navicat新建数据库shcoolnews。 为了保存管理员用户名、密码,新建user表,结构如下图。 简单解释下,i…

jquery找到第几个字符_10个可以找到jQuery承包商的网站

jquery找到第几个字符作为一名技能娴熟的前端Web开发人员,您可以选择以自由职业者,承包商或临时或永久任职的身份独立从事工作 。 或者,您可能只想在业余时间通过在线寻求一些项目工作来提高自己的技能。 因此,今天我列出了一些地…

10个可以找到jQuery承包商的网站

作为一名技能娴熟的前端Web开发人员,您可以选择以自由职业者,承包商或临时或永久任职的身份独立从事工作 。 或者,您可能只想在业余时间通过在线寻求一些项目工作来提高自己的技能。 因此,今天我列出了一些您可能会找到以jQuery /…

portfolio r语言_jQuery Mobile Portfolio网站模板

portfolio r语言我已经为jQuery4u博客读者免费开发了用于个人投资组合网站的基本jQuery Mobile模板 ! :)使用此模板的初始版本,功能特定于投资组合,您可以使用个人简历,投资组合图片库和联系表创建基本的移动投资组合网站。 这只是…

Python爬虫:爬取需要登录的网站

不少伙伴学爬虫,这就出一期Python爬虫教程,文末总结的有视频教程,自己按需学习哈! 爬虫在采集网站的过程中,部分数据价值较高的网站,会限制访客的访问行为。这种时候建议通过登录的方式,获取目…

创意网站精选

2019独角兽企业重金招聘Python工程师标准>>> https://gomockingbird.com/ framework my life to a professioner http://doubanmash.com/ doubanmash http://alphatown.com/ 阿尔法城,模拟网上商品城,做的确实不错。 http://c2.com/cgi/wiki?DesignP…

政府与金融行业网站为何必须安装SSL证书?

在了解SSL证书对于政府与金融行业网站的重要性之前,我们先来了解一下SSL证书是什么?根据百度百科上的解释,SSL证书是数字证书的一种,类似于驾驶证、护照和营业执照的电子副本。因为配置在服务器上,也称为SSL服务器证书…

【网站工具】PHPNow,PHPMyadmin,Apache,IIS,MySQL

近期在学习网站建站的一些基本知识,遇到几个工具 PHPNow,改名为servkit http://servkit.org/ 优点:适合新手快速入门,绿色版,免费 缺点: 1、只有中文版,英文操作系统就乱码啦 2、Apache可…

响应式网站设计_响应式网站的设计体验

响应式网站设计开始之前 响应式Web设计旨在确保网站的布局和内容流畅地扩展到可用的屏幕空间。 这是将投资集中在改善网站内容和用户功能上的绝妙方法,同时无论用户使用什么设备和屏幕大小来访问网站,都可确保用户获得良好的体验。 如果您没有阅读本系列…

响应式网站的设计体验

开始之前 响应式Web设计旨在确保网站的布局和内容流畅地扩展到可用的屏幕空间。 这是将您的投资集中在改善网站内容和用户功能上的一种绝佳方法,同时无论用户使用什么设备和屏幕大小来访问您的网站,都可以确保他们获得良好的体验。 如果您没有阅读本系列…

网站解密:从零开始学建站

为什么80%的码农都做不了架构师?>>> 网站解密:从零开始学建站 本书是为站长群体编写的一本入门级的书,它的定位是:对网站制作不清楚、对网站程序不了解、想成为一名站长的人。从基本的网站概念到一个网站上线所涉…