Python爬取招聘网站,获取一手招聘需求,轻松面试上岗!

news/2024/5/15 3:03:08/文章来源:https://blog.csdn.net/fei347795790/article/details/119938891

朋友的小老弟最近想找工作,但是不知道做什么合适,喊我帮忙,我能怎么办呢,那只能使出我祖传的Python大法了!
在这里插入图片描述
对于Python来说,找个工作不是很简单的事情吗,于是我直接用Python把所有的岗位信息都爬下来了,顺便做个数据分析,今天给大家分享一下爬虫部分吧~
在这里插入图片描述
这是要用的软件,先准备好

python 3.6  
pycharm

要用的模块,没安装的铁汁记得安装,不然分分钟报错就难受~

requests  >>> pip install requests 
re
json
csv
time

爬虫的实现过程:

一. 数据来源分析
1. 确定爬取数据
2. 确定数据来源
通过开发者工具进行抓包分析
二. 代码实现
1. 发送请求
2. 获取数据
3. 解析数据
4. 保存数据
5. 多页爬取

老样子,模块先安排好。

import requests
import re
import json
import pprint
import csv
import time

创建好表格和格式

f = open('招聘1.csv', mode='a', encoding='utf-8', newline='')
csv_writer = csv.DictWriter(f, fieldnames=['标题', '公司', '地区', '经验', '学历', '薪资', '福利', '发布时间', '详情页'])

url复制过来,把python代码伪装成浏览器发送请求,复制过来的请求头

在这里插入图片描述
在这里插入图片描述
数据解析 re正则表达式[.*?] css选择器 xpath 根据标签内容来提取
正则提取字符串数据内容
索引取值

html_data = re.findall('window.__SEARCH_RESULT__ = (.*?)</script>', response.text)[0]json_data = json.loads(html_data)['engine_search_result']

标题啊福利薪资等等大家关系的内容统统安排上,然后打印输出

    for index in json_data:title = index['job_title'] # 标题job_welf = index['jobwelf'] # 福利money = index['providesalary_text'] # 薪资job_href = index['job_href'] # 详情页date = index['updatedate'] # 发布时间company_name = index['company_name'] # 公司area = index['attribute_text'][0] # 地区exp = index['attribute_text'][1] # 经验edu = index['attribute_text'][2] # 学历dit = {'标题': title,'公司': company_name,'地区': area,'经验': exp,'学历': edu,'薪资': money,'福利': job_welf,'发布时间': date,'详情页': job_href,}csv_writer.writerow(dit)print(dit)

截图的部分没办法,不然过不了审
基础不好的同学看不明白的话,有视频讲解,包括完整代码,或者从零基础开始的教程、软件等等都可以 点我免费加群领取 包括有学习的问题都可以在群里问。
在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.luyixian.cn/news_show_732861.aspx

如若内容造成侵权/违法违规/事实不符,请联系dt猫网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Python爬虫入门教程24:下载某网站付费文档保存PDF

前言&#x1f4a8; 本文的文字及图片来源于网络,仅供学习、交流使用,不具有任何商业用途,如有问题请及时联系我们以作处理。 前文内容&#x1f4a8; Python爬虫入门教程01&#xff1a;豆瓣Top电影爬取 Python爬虫入门教程02&#xff1a;小说爬取 Python爬虫入门教程03&…

Python爬虫入门教程31:爬取猫咪交易网站数据并作数据分析

前言&#x1f4a8; 本文的文字及图片来源于网络,仅供学习、交流使用,不具有任何商业用途,如有问题请及时联系我们以作处理。 前文内容&#x1f4a8; Python爬虫入门教程01&#xff1a;豆瓣Top电影爬取 Python爬虫入门教程02&#xff1a;小说爬取 Python爬虫入门教程03&…

Python爬虫+数据分析:爬一爬那个很懂车的网站,分析一下现阶段哪款车值得我们去冲

文章目录一、写在前面二、准备工作1、知识点2、使用的软件3、第三方库三、大致流程四、代码展示分析1、爬虫部分1.1 代码展示2、效果展示2.1 爬取中2.2 保存的数据3、数据分析部分3.1 导入模块3.2 Pandas数据处理3.3 Pyecharts可视化3.4 二手车推荐4、数据分析代码运行一、写在…

Python爬虫:二十行代码获取某知名网站高质量视频,带视频讲解

文章目录一、写在前面二、爬虫原理三、案例实现四、视频讲解一、写在前面 兄弟们&#xff0c;自从上次爬虫热门后&#xff0c;我就没发高质量爬虫了&#xff0c;看的人都少了&#xff0c;唉~ 原来你们都是这样的人 二、爬虫原理 作用: 批量获取互联网数据(文本, 图片, 音频…

死党暗恋校花失败,我爬了这个网站发给他分分钟治愈,男人的快乐往往很简单(每天一遍,忘却初恋)

死党一直暗恋校花&#xff0c;但是校花对他印象也不差&#xff0c;就是死党一直太怂了&#xff0c;不敢去找校花&#xff0c;直到昨天看到校花登上了校董儿子的豪车&#xff0c;死党终于彻底死心&#xff0c;大醉一场&#xff0c;作为他的兄弟&#xff0c;我怎么能看他郁郁不振…

要不是这个沙雕网站,我这辈子都见不到这么多沙雕网站!

点击上方SQL数据库开发&#xff0c;关注获取SQL视频教程SQL专栏SQL数据库基础知识汇总SQL数据库高级知识汇总来源&#xff1a;差评&#xff08;chaping321&#xff09;到目前为止&#xff0c; 大多数已知的网站已经得到了网民们详细的解读。功能详尽的同城网站&#xff0c;仿佛…

为了防止这个网站消失,我连夜用Python离线了上万张图片

文章目录吐槽一下事前准备1、环境配置**2、模块使用3、如何配置pycharm里面的python解释器?4、pycharm如何安装插件?5、基本流程代码解析1、模块导入2、发送请求3、获取数据4、解析数据5、保存数据吐槽一下 之前好多高质量网站都不见了&#xff0c;肯定是你们整活整多了&…

除了 P 站,程序员居然还喜欢上这些网站?快来摸鱼呀!

说到p站&#xff0c;估计不知道的人已经很少了&#xff0c;除了p站还有哪些站&#xff1f;应该很多人思考过这个问题了 二次元可是有ABCDEFGHJKNMT站…等等诸多圣地的&#xff01;外面的世界很精彩&#xff0c;别抱着一个站啃了~ 1、A站 Acfun AcFun&#xff0c;中国第一家…

干货 | 程序员必备的16个实用的网站

最近看到很多网友分享了好多比较酷炫的网站&#xff0c;好多都放进小艾的收藏夹了&#xff0c;(__) 嘻嘻……看的我也忍不住想分享了&#xff0c;因为是IT行业&#xff0c;所以分享几个收集的比较实用而且酷炫的网站O(∩_∩)O~ 1.“Hello World”大全 网站一共收集了大约481种…

别去送si了!Selenium 与 Puppeteer 能被网站探测的几十个特征

很多人喜欢使用Selenium 或者 Puppeteer(Pyppeteer)通过模拟浏览器来编写爬虫&#xff0c;自以为这样可以不被网站检测到&#xff0c;想爬什么数据就爬什么数据。 但实际上&#xff0c;Selenium 启动的浏览器&#xff0c;有几十个特征可以被网站通过 JavaScript 探测到。Puppe…

Yii2.0 网站开发流程记录 反馈网页统计

2019独角兽企业重金招聘Python工程师标准>>> 这里不再多说&#xff0c;欢迎各位踊跃提意见&#xff0c;书籍第一部分草稿在&#xff1a; http://download.csdn.net/detail/bubifengyun/9541785 后续还在添加中。 谢谢。转载于:https://my.oschina.net/bubifengyun/b…

java 企业门户网站 源码 自适应响应式 freemarker 静态引擎 html5 SSM

前台&#xff1a; 支持五套模版&#xff0c; 可以在后台切换系统介绍&#xff1a;1.网站后台采用主流的 SSM 框架 jsp JSTL&#xff0c;网站后台采用freemaker静态化模版引擎生成html2.因为是生成的html&#xff0c;所以访问速度快&#xff0c;轻便&#xff0c;对服务器负担小3…

我的天,适合程序员的史上醉强“摸鱼”网站!!!

分享8个提升学习能力以及工作效率的神奇网站&#xff0c;谁用谁知道。 1、 IData-知识检索 大学生涯中大家都会用到各种文献资料往往都是从知网下载的&#xff0c;但如果不在学校或者学校没有购买知网权限&#xff0c;我们就需要一个新的文献下载工具——IData。 如果需要查询相…

Crazy!这个算法可视化网站真的是太棒了!

最近在学习算法的时候&#xff0c;发现一个非常不错的编程网站&#xff0c;特别适合学习算法&#xff0c;感官体验十分不错。 这个网站是「VisuAlgo」&#xff0c;它是一个算法可视化网站。 谁这么良心&#xff0c;免费搞这么优质的动画算法教程网站呢&#xff1f; 这个网站是…

使用LNMP架构部署动态网站环境。 Linux+PHP

1、配置php服务 &#xff08;1&#xff09;yasm源码包&#xff0c;其解压、编译、安装过程. &#xff08;2&#xff09;libmcrypt源码包&#xff0c;其解压、编译、安装过程. &#xff08;3&#xff09;libvpx源码包&#xff0c;其解压、编译、安装过程.libvpx源码包的后缀是.t…

程序员接私活月入2万?分享10个接私活的网站快收藏~

最近&#xff0c;在和身边的程序员聊天中&#xff0c;听不少朋友分享了自己接私活的经历&#xff0c;那收入真是让我“瞠目结舌” … 程序员A&#xff1a;我Java程序员&#xff0c;工作两年&#xff0c;月薪13K&#xff0c;私活20K。 程序员B&#xff1a;之前在单位上班&#…

网站title标题被改并被百度网址安全中心提醒的解决办法

国庆假日期间我们Sine安全接到众多网站站长求助网站标题被改导致在百度搜索中百度安全中心提醒被拦截,导致网站正常用户无法浏览网站被跳转到一些菠菜du博网站&#xff0c;而且很明显的一个特征就是在百度中搜索关键词的网站快照标题被修改成了一些与网站本身内容不相关的页面,…

github网站介绍、并使用git命令管理github(详细描述)

本章学习: 1)熟悉github网站2)通过git命令远程管理github,3)git命令使用ssh key密钥无需输入账号密码 1.首先我们来熟悉github网站 1.1 注册github 登录http://github.com/,然后点击sign up,来注册账户: 注册好了,以及验证邮箱后,然后进入github主页: 1.2点击start a project(启…

十周后,62%的PHP网站将运行在一个不受支持的PHP版本上

根据W3Techs的统计数据&#xff0c;目前约有78.9&#xff05;的网站使用PHP开发。\\但是&#xff0c;PHP 5.6.x的安全支持将在2018年12月31日正式停止&#xff0c;这标志着对古老的PHP 5.x分支版本的支持都将结束。\\也就是说&#xff0c;从明年开始&#xff0c;大约62&#xf…

常见的网站服务器架构有哪些?

初始阶段的网站架构一般来讲&#xff0c;大型网站都是从小型网站发展而来&#xff0c;一开始的架构都比较简单&#xff0c;随着业务复杂和用户量的激增&#xff0c;才开始做很多架构上的改进。当它还是小型网站的时候&#xff0c;没有太多访客&#xff0c;一般来讲只需要一台服…