excel修改列名_利用Excel分析招聘网站数据分析师岗位

news/2024/5/21 1:02:34/文章来源:https://blog.csdn.net/weixin_33544518/article/details/112105208

48f32d36267b8ba159c1d0efaad93aac.png

Excel是进行数据分析用得最多、最基本的工具,下面内容是运用Excel2013对一份数据分析师招聘网站的数据进行分析。

Excel数据分析的步骤:

1、提出问题(明确数据分析目的)

2、理解数据(理解数据列名的意义)

3、数据清洗(统一格式内容)

4、构建模型(思考用什么样的表现形式把数据呈现出来)

5、数据可视化(把数据转化成图)

一、提出问题

首先要明确这次数据分析的目的是什么?也就是为了解决什么问题?

提出问题:

1、在哪些城市找到数据分师工作的机会比较大?

2、数据分师的薪水如何?

3、根据工作经验的不同,薪酬是怎样变化的?

二、理解数据

接下来要理解表格中的各个字段(列名)表示什么意思:

bdb4bea0477e4440e85839df373d6f72.png

城市:用于比较不同城市对数据分析师的需求如何

职位所属:分析以后的工作岗位

职位ID:表示职位的唯一表示,也就是每一行数据的唯一标识------用于去掉重复ID

薪水:比较不同城市、和所属领域的薪水区别

工作年限:从时间轴上对比薪资涨幅

三、数据清洗

数据清洗即数据预处理,目的是去掉无效、重复数据,以取得符合我们要求的数据。

数据清洗的基本步骤:

00b9f68aa9b4eff50461576c17f851a8.png

1. 选择子集

只选择对数据分析有意义的字段,无意义的字段选择隐藏,即隐藏不需要分析的列(尽量不删,保证数据的完整性)。这里隐藏公司ID公司全名,保留职位ID公司简称

a375224de103f9d46bb06b8152199dfd.png

2. 列名重命名

将不合适的列名更改为我们容易理解的形式。

3. 删除重复值

对重复数据进行删除,这里我们对【职场ID】列进行删除重复值处理:

6181d3ce3bea3c7689569eae6bda9b14.png

4. 缺失值处理

先检查数据是否存在缺失值,先查看完整数据列的计数,再选择其他列查看是否缺失数据:

f8885b81619ba0374e4e9fbe2b767c31.png

b0e940f6fa82dad5e559df3cc9a5c30e.png

可以看出【城市】这一列缺失2条数据。

一般对缺失值的处理有4种方法,根据情况灵活使用:

① 通过人工手动补全(缺失值较少,并且可以根据其他信息确定该值)

② 删除缺失的数据(无法判断该位置填写何值,或者删除的数据对分析无大的影响

③ 用平均值代替缺失值

④ 用统计模型计算出的值去代替缺失值

这里对【城市】这一列的处理方法:

93b1dd5ce0716b23aad8df53c1619d38.png

23e5c55e259536abfc04f39f357f7ae6.png

由于缺失数据较少,这里选用人工手动补全,使用Ctrl+Eneter快捷键,在不连续的单元格中同时输入同一个数据或公式时很好用:

2f91615cc9ea58471fcbafefbec34889.png

5. 一致化处理

(1)对数据进行统一的命名和处理。比如数据中的公司的所属领域是“企业服务,数据服务”,对该列数据进行拆分。

步骤:选中要进行拆分的列-选项卡-数据---分列--分隔符号---下一步---勾选 其他,并入输入“,”且 勾选 连续分隔符视为单个处理(注意,将输入法 切到 中文状态 ,因为 中文的逗号和英文的不是一种字符)---下一步--完成,就会看到 在右边生了一列出来,如图:

a30bdc2d39a28f1f4b4df53d39f674bb.png

1e789230da38820b7e2f5c41539aa7d0.png

7874dcd9a0669743fed15671b0c1d7e8.png

06ff7622be1317825380a2fdc69def4c.png

注意事项:

① 将数据先复制到最后一列(分列功能会覆盖右边单元格),隐藏原始列----进行分列;

② 对拆分出来的一页 添加列名:公司所属领域2,原来列的列名改为公司所属领域1 ,否则数据透视时会出现警告:”数据表字段名无效。

(2)我们将薪水处理成【最低薪水】、【最高薪水】、【平均薪水】,用于存放清洗后的薪水数据。这里有两个方法可以实现:

一种是使用上面提到的分列功能,将【-】作为分隔符号,然后用【查找替换】功能替换掉【k】,再使用函数AVERAGE求出平均薪水。

d00d8b56dc7267cd26a6cb074ea577d9.png

第二种是利用函数实现:

FIND函数的意思是查找一个字符串在另一个字符串中出现的起始位置,用FIND 函数查找分隔符【k】或者【-】。

ed8b97920c620ec455dfbe42075a7433.png

FIND函数用来对原始数据中某个字符串进行定位,以确定其位置。FIND函数进行定位时,总是从指定位置开始,返回找到的第一个匹配字符串的位置,而不管其后是否还有相匹配的字符串。

LEFT函数(从左开始截取字符串),MID函数(从中间截取字符串),Len函数(计算字符串长度),函数具体用法可以在百度上查。

4508e50a4d7f5dee9d7c3d01fb536c3b.png

利用LEFT函数截取最低薪水:

a2b9e956e5af2e8481c89103ec1c82ea.png

同理,使用MID函数截取最高薪水:

04eba349f3321e33a1dd89f95975b5c2.png

62fc65a61557af1b96210a9237d020a5.png

7cd8a7417875d81f55ab37c0155cf41a.png

在做的时候会最高薪水这一列出现错误值,使用筛选的功能查找错误值:

680e291337a0d8da86675d4c8c6b4419.png

a05ffc11028aa3dabb8e07907a3153d1.png

报错原因是在薪水这一列中数值有问题,其一是k的大小写问题,出现有大写的K,可使用查找替换修改大写为小写。

其二是出现薪资范围是多少k以上:

558caf3a0da3f79a7821b7ac697f6ac1.png

具体操作方法如下:选中最高薪水该列,定位条件为错误。然后delete删除错误值。再在单元格内输入=ctrl+方向键←,让其等于最低薪水;最后Ctrl+enter,批量操作。

在操作的时候会出现数字显示为文本格式,可以选中该列×1,使其转换成数字格式。

当所有操作都完成之后,使用average函数对其求均值。

6. 数据排序

我们对【平均薪水】这一列进行降序排序:

bf010102c8d09f216c60bf738c111d01.png

f0664a2eff2bc9d2ddc117f4821a68ef.png

578386feaf49f91080f618f767754a18.png

7. 异常值处理

使用数据透视表处理表格:

fa8a7313f20aad109a2cf8c1962b5688.png

5c9ae6a65f625983158f5def097e3739.png

e4468754b880d7b414aafcd877edceb7.png

此时发现【职位名称】中有职位不属于数据分析:

a9af0c890f32303ad99c21f184a1860f.png

这些异常值需要去掉,应返回原表重新筛查。

步骤:

① 在原表【职位名称】列后插入新的列命名为“数据分析职位名称”;

② 在下方空白单元格插入函数=IF(COUNT(FIND({"数据运营","数据分析","分析师"},L2)),"是","否");

③ 双击单元格右下方进行自动填充;

a208f82c79042685bca20b48f1b4189e.png

④ 使用筛选功能,选择“是”,过滤掉异常值。

2b70a4a49c377790bf6ca3455993f56a.png

四、构建模型及数据可视化

1、在哪些城市找到数据分师工作的机会比较大?

以城市为行标签,工作年限要求为列标签,数据透视分析不同城市对不同年限的数据分析师的需求情况。

步骤:全选--选项卡,数据透视图----将数据透视表字段中的【城市】拖入到行,将【工作年限要求】拖入到列,再将【城市】拖入到值中:

af6a7eb3c3ba5f62bf440000b5ead42d.png

再点选表格中左上角行标签---其他排序选项---降序排序--计数项:城市

649a9af63e167bc30b3de5bbed5490e6.png

最后将数值按列汇总的百分比显示数据:

8746708129bdfaf1fbee75c49490a002.png

将值按行汇总百分比显示数据:

7983698b4b9a6302079480b0378fbc4f.png

f2987a8ffb1164e6fe1a5b76c3909bf1.png

结论:从数据透视表可以看出,在北京数据分析的岗位最多,往后是上海、深圳、杭州、广州;按工作年限要求来看,3-5年的需求量最大,其次是1-3年,这说明数据分析对年轻人需求将更多。

2、数据分师的薪水如何?

首先,安装EXCEL 的分析工具库功能:选项卡,文件--选项---加载项---管理,选择 EXCEL 加载项---转到---勾选 分析工具库---确定。

0ffa06cd85ad794df09a9fe8d6faf72b.png

操作步骤:选项卡》数据 在右边出现有:数据分析 点击---对话框中,勾选 描述统计----确定----输入区域,框选中平均薪水列---分组方式--逐列----勾选标志位于第一行(表明第一行是列名不包括在计算机里面)-----点选中: 新工作表组---输入: 薪水描述统计(工作表名称)-----勾选 归总统计、平均数置信度95%、第K值大致5、第K值小值5----确定,结果如下图

df1be68e585126d89e1d90ef9450a060.png

fc374945ce22a1dff798a568a078a79a.png

以城市为行标签,平均薪水为列标签,数据透视表分析城市与平均薪水的关系:

85d21ff0335c5eb3ce3b4ea2199a0c5f.png

29173d0a1411527782242f69f4f5d80f.png

a7762582d32db89f165a17096379d27a.png

结论:从上面数据透视结果可以看出,深圳的数据分析师平均薪水最高,其次是北京,上海,杭州。

3、根据工作经验的不同,薪酬是怎样变化的?

以工作年限要求行标签,平均薪水为列标签,数据透视分析工作年限与平均薪水的关系:

c25394e3003c433b2d69163168611bd7.png

034bee2d3fb3d82ebde0db7f5e10aac8.png

77ef88c0a3d1574347d1058301cf85ad.png

e77d6aefd5e0642a7f6bfafea29746be.png

结论:从上面数据透视结果可以看出,随着工作经验的增长,数据分析师的薪酬也在不断增加。

综合上面三个数据透视结果,我们可以得到以下分析结论:

1)数据分析这一岗位,有大量的工作机会集中在北上广深以及新一线城市,如果将来去这些城市找工作,可以提高求职成功的条件概率。

2)从待遇上看,数据分析师留在深圳发展是个不错的选择,其次是北京、上海。

3)数据分析是个年轻的职业方向,大量的工作经验需求集中在1-5年。

对于数据分析师来说,5年似乎是个瓶颈期,如果在5年之内没有提升自己的能力,大概以后的竞争压力会比较大。

4)随着经验的提升,数据分析师的薪酬也在不断提高,10年以上工作经验的人,能获得相当丰厚的薪酬。

上述操作练习的数据:

https://pan.baidu.com/s/12Y3SCvUoFwGdlMcJjerYgw​pan.baidu.com

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.luyixian.cn/news_show_745142.aspx

如若内容造成侵权/违法违规/事实不符,请联系dt猫网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

图片变色_『设计|分享』设计师的色彩网站推荐(一)—渐变色

整理:设计与设计师(ID:Design-Designer)作者:设计与设计师转载请注明出处。配色对一项设计的重要性,这边就不多加赘述。在色彩设计应用中,我们对颜色不同程度的理解,将影响到产品&am…

php写伪静态,php网站动态网站的伪静态写法

PHP网站是主要是以动态网页展示,有时候为了方便优化,也可以设置伪静态来进行网站的优化。主要是通过下面的方式进行伪静态的书写:首先我们先查看Apache是否支持mod_rewrite功能,可以通过PHP提供的phpinfo()函数查看是否支持重写功…

ab压力测试_使用ab命令对网站进行压力测试

概述这是apache自带的一个网站压力测试工具,是ApacheBench的缩写,我们可以使用这个工具来对我们的网站进行压力测试安装在ubuntu上要安装下面这个包sudo apt-get install apache2-utils在centos下是下面这个包sudo yum install httpd-tools -y使用可以直…

虾米音乐java_抓取虾米音乐网站音乐,搜索虾米音乐功能的java实现

可以实现和点点网音乐分享功能暂时还没做界面,先留下代码package com;/*** 歌曲实体* author hanfei**/public class Song {private String title;private String songUrl;private String flashUrl;private String image;public String getTitle() {return title;}p…

百度二级网页打不开_网站降权都是什么原因 - 百度蜘蛛池博客

原出处:蜘蛛池博客原文链接:网站降权都是什么原因? - 蜘蛛池博客我们要学会找出网站降权的原因,才能知道如何对症下药,解决问题。那么,网站降权都是什么原因?接下来蜘蛛池博客小编就跟大家介绍几…

oracle表空间状态如何离线,read/write - Oracle表空间的状态_数据库技术_Linux公社-Linux系统门户网站...

表空间状态-READ ONLY、READ WRITE1. 只读表空间的主要用途就是为了消除对数据库大部分静态数据的备份和恢复的需要。Oracle不会更新只读表空间爱你的文件,因此这部分文件可以存储于只读介质中,例如CD-ROM或WORM drives。2. 只读表空间并不是为了满足归档…

计算机违反网络策略该怎么弄,网络策略设置禁止您使用该网站获取您计算机的更新程序。怎么办?...

进入微软windows update网站提示:网络策略设置禁止您使用该网站获取您计算机的更新程序。如果您确认此消息有误,请向您的系统管理员咨询。本人找到的是在 组策略(打开方法 运行->gpedit.msc)->计算机配置->管理模板->windows组件->window…

基于php网上购物商城用例图,动漫周边电商网站的设计与实现(PHP,MySQL)(含录像)...

动漫周边电商网站的设计与实现(PHP,MySQL)(含录像)(毕业论文10000字,程序代码,MySQL数据库)摘要本商品电商网站是为了方面用户在线购物而设计开发的商品电商网站,其开发过程主要包括前端应用程序的开发和后台数据库的建立和维护两个方面。本网站的开发可以在网上进行…

网站备案服务器ip怎么填写,域名备案网站ip地址如何填写

域名备案网站ip地址如何填写 内容精选换一换依据《非经营性互联网信息服务备案管理办法》第十四条、第二十三条规定,如备案信息不真实,将关闭网站并注销备案。若您的备案信息发生变更,请您提前三十日申请变更备案。对于已备案网站仅对应一个域…

ssm访问html乱码_Maven+JSP+SSM+Mysql实现的音乐网站

项目简介项目来源于:https://gitee.com/coder_ze/iMusic本系统基于MavenJSPSSMMysql实现的音乐网站。主要实现的功能有音乐播放、下载、上传等几个模块。难度等级:中等技术栈编辑器Eclipse Version: 2020-03 (4.15.0)前端技术基础:htmlcssJav…

最新30佳 HTML5 网站设计案例欣赏

在过去的几年,Web开发者们已开始关注和使用 HTML5 了,如今 HTML5 得到了更加广泛的应用,并将未来逐渐成为 Web 舞台的主角。今天,本文向大家推荐30个应用 HTML5 的网站案例,让大家感受一下 HTML5 的魅力。 1- Orange S…

国外精美网站设计欣赏的200佳网站推荐(系列十一)

您可能还喜欢 寻找网页设计灵感的27个最佳网站推荐最新30个漂亮的个人作品集网页设计案例分享35个非常漂亮的单页网站设计案例60佳灵感来自大自然的网页设计作品欣赏分享100佳精美的作品集网站设计案例这个系列将向大家分享汇集漂亮网站设计欣赏的200佳网站。网页设计师们可通过…

优异开发工具引荐:10款在线调试代码的网站

对于 Web 开发人员来说,有个疾速测验代码的当地是十分便利的。在这篇文章,咱们收集了8个十分有用的网站,协助 Web 开发人员在线调试代码,其间有些站点还可以在线共享和备用代码,这可以协助你十分便利的和其它的开发人员…

button hover逐渐变色_8种纯CSS实现的炫酷HOVER效果,你应该在网站中尝试使用

英文 | https://www.blog.duomly.com/html-button-hover-effects/作者 | Anna Danilec翻译 | web前端开发(ID:web_qdkf)按钮悬停效果简介按钮是每个页面,Web应用程序或移动应用程序中经常使用的基本元素。按钮是CSS布局中必不可少的元素,因为…

高防服务器如何防止网站攻击,高防服务器怎么防御攻击的?

高防服务器怎么防御攻击的?高防服务器,从字面上来理解就是具备防御性能的服务器,高防服务器相较于普通的服务器除了超高的防御性能以外,在配置上通常也是比较高的,所以在使用上,会更稳定一些,所以深受各类…

HTML网页修改内容会掉收录吗,网站内容被收录后还可以修改吗?

被搜索引擎收录后的文章还可以修改吗?对于这个问题,不同的站长有不一样的意见,因此每个人对于网站SEO优化的认知都是不同的,因此看待这个问题思考的角度也会不一样,那么被收录后的网站内容还可以修改吗?下面就一起来了解一下。打…

数据 微信 html代码,微信数据后台统计网站模板

微信数据后台统计网站模板是一款HTML5后台管理网站模板下载资源下载此资源下载价格为4D币,请先登录资源文件列表codedown123-0819-55/assets/css/bootstrap.css , 126261codedown123-0819-55/assets/css/custom-styles.css , 7532codedown123-0819-55/assets/css/fo…

gpu服务器跑网站,gpu服务器跑深度学习

gpu服务器跑深度学习 内容精选换一换A800-9000(Atlas 800 训练服务器(型号 9000))开发或运行环境安装参考如下:开发环境方式一:直接在昇腾AI设备上使用msInstaller工具给本机安装开发环境,如图1所示。该方式仅适用于昇腾AI设备安装的OS支持ms…

2021年青海高考成绩查询查分入口,2021年青海高考成绩查询网站查分网址:http://www.qhjyks.com/...

【导语】高考结束后大家最为关心的问题就是在哪里查分,如何查分,无忧考网高考频道特别整理2021年青海高考成绩查询查分网址,成绩公布时考生可直接点击网址进行查分,预祝大家都能顺利的考上理想的大学!由于,…

【转】如何构建高扩展性网站?

本篇通过阅读《高扩展性网站的50条原则》,总结出以下内容。 一方面博主没有实际的架构经验,另一方面知识面也不够宽阔,所以只能系统的总结书中的要点,并根据自己的理解做些归纳。 主要内容 本书从多个方面围绕高扩展性提出了50条建…