各大招聘网站信息实时查询浏览

news/2024/5/20 19:44:26/文章来源:https://blog.csdn.net/weixin_30342209/article/details/96983626

      最近听得较多的跳槽、面试之类的,相信很多园友也开始蠢蠢欲动了,有的甚至早已经开始了。最近我也在琢磨着换工作的事。说得俗套点,人在外面不就为了那么点工资么。现在找工作大部分都是通过在网上投简历,然后等电话 通知面试的。然,现在的招聘网站也是比较多。一个一个的在各大网站切换的流量招聘信息 实属麻烦。之前看到过一篇博文。《找工作神器,提取各大网站有效的招聘信息(前程无忧、智联招聘、猎聘网)》感觉这想法挺好的。把各大网站信息集中起来浏览,第一省了来回切换,第二还不容易重复投简历。本想拿来用用的,无奈没有提供源码下载,且是客户端版本。于是就只能自己动手,丰衣足食了~。(网站就是强大,可以大家一起分享●0●^_^)

     合并查询本来就是为了简单方便,所以也就没有弄很复杂了,一个页面搞定。如果同学们有什么好的想法,可以建议建议。

效果图:

就一个简单的关键字输入框、工作地点的选择和信息来源网站。

其实看上去很简单,实现起来也很简单。~~代码不多,难度也很小。很多时候需要的技术不是很多,想法更重要。

不想往下看的可以直接用用 演示地址 ,同学们求工作给推荐推荐,上海 浦东 .net。 私密我,或Q我。

 

第一、分析url

进入招聘网站的时候url大串大串的,我们需要用的的就三个。搜索关键字、地址和页码。

智联招聘:

http://sou.zhaopin.com/jobs/searchresult.ashx?jl=地址&kw=关键字&p=页码

jl=地址

kw=关键字

p=页码

然后地址的话 直接中文地址就ok了

猎聘网:

http://www.liepin.com/zhaopin/?key=关键字&dqs=地址&curPage=页码

key=关键字

dqs=地址

curPage=页码

地址有一个对应的编号

("北京", "010");
("上海", "020");
("广州", "050020");...等等  也是在猎聘网选择地址的地方右键 审查元素可以看到,如下:

前程无忧:

http://search.51job.com/jobsearch/search_result.php?jobarea=地址&keyword=关键字&curr_page=页码

jobarea=地址 [和猎聘一样的查找方法]

keyword=关键字

curr_page=页码

第二、用到了HtmlAgilityPack.DLL HTML解析组件

在之前我发过的 博客转发小工具 有提过HtmlAgilityPack。这里再简单的说说用法。

case ZhaopinType.猎聘网:var htmlWeb = new HtmlWeb();htmlWeb.OverrideEncoding = Encoding.GetEncoding("UTF-8");HtmlAgilityPack.HtmlDocument response = htmlWeb.Load(url);#region MyRegionvar ulS = response.DocumentNode.SelectNodes("//*[@id='sojob']/div[2]/div/div/ul/li");foreach (var item in ulS){var xpath = item.XPath;string titleName, infourl, company, city, date, salary, salary_em, source;titleName = item.SelectSingleNode(xpath + "/a").Attributes["title"].Value;infourl = item.SelectSingleNode(xpath + "/a").Attributes["href"].Value;company = item.SelectSingleNode(xpath + "/a/dl/dt[@class='company']").InnerText;city = item.SelectSingleNode(xpath + "/a/dl/dt[@class='city']/span").InnerText;date = item.SelectSingleNode(xpath + "/a/dl/dt[@class='date']/span").InnerText;salary = item.SelectSingleNode(xpath + "/a/dl/dt[@class='salary']/span").InnerText;salary_em = item.SelectSingleNode(xpath + "/a/dl/dt[@class='salary']/em").InnerText;source = "猎聘网";zpInfoList.Add(new ZhaopinInfo(){city = city,company = company,date = date,info_url = infourl,salary = salary,salary_em = salary_em,titleName = titleName,source = source});}#endregionbreak;

1.设置访问url页面的编码

 htmlWeb.OverrideEncoding = Encoding.GetEncoding("UTF-8");

设置编码为UTF-8,具体看对应页面采用的编码。

2.元素路径下的元素集合

var ulS = response.DocumentNode.SelectNodes("//*[@id='sojob']/div[2]/div/div/ul/li");

SelectNodes方法里面的这串字符串怎么来?

右键审查元素 Copy XPath 就ok了。不过如果js有动态修改document树的话 那么这个路径就不准了,需要自己微调下。

3、取标签的属性值 Attributes

如:取a标签的title值。

titleName = item.SelectSingleNode(xpath + "/a").Attributes["title"].Value;

4.取标签的中间的文本 InnerText

company = item.SelectSingleNode(xpath + "/a/dl/dt[@class='company']").InnerText;

5.过滤选择特定的id 或 class

XPath 中 标签名后面加上中括号 和@ 如: "/a/dl/dt[@class='company']"

第三、浏览器滚动条的onscroll事件

js获取滚动条距离浏览器顶部,底部的高度,兼容ie和firefox

取窗口可视范围的高度[浏览器可见区域高度]

//取窗口可视范围的高度[浏览器可见区域高度]getClientHeight: function () {var clientHeight = 0;if (document.body.clientHeight && document.documentElement.clientHeight) {var clientHeight = (document.body.clientHeight < document.documentElement.clientHeight) ? document.body.clientHeight : document.documentElement.clientHeight;} else {var clientHeight = (document.body.clientHeight > document.documentElement.clientHeight) ? document.body.clientHeight : document.documentElement.clientHeight;}return clientHeight;}

取窗口滚动条高度[滚动条距离顶部的高度]

  getScrollTop: function () {var scrollTop = 0;if (document.documentElement && document.documentElement.scrollTop) {scrollTop = document.documentElement.scrollTop;} else if (document.body) {scrollTop = document.body.scrollTop;}return scrollTop;}

 

取文档内容实际高度

  getScrollHeight: function () {return Math.max(document.body.scrollHeight, document.documentElement.scrollHeight);}

 

滚动条距离底部的高度

getScrollbheight: function () { return this.getScrollHeight() - this.getScrollTop() - this.getClientHeight(); }

 

 取滚动条距离底部的高度,当滚动条到最底部的时候,通过ajax异步请求后台,加载下一页数据,这样就可以免了翻页的麻烦了。

 

ps:用jquery 更加简洁(感谢@Samguist)

if ($(window).scrollTop() == $(document).height() - $(window).height()) {
// ajax异步加载数据
}

 

 

 

基本上就是这样简单,没什么难度。记得有什么好工作通知一声哦~^_^ ^_^   ***** 点击本人求职信息*****

环境:vs2013   数据库:无   插件:HtmlAgilityPack   演示地址  源码下载  (源码都下了 顺手点个赞呗~)

下一篇:各大招聘网站信息实时查询浏览【二】

 

转载于:https://www.cnblogs.com/zhaopei/p/4368417.html

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.luyixian.cn/news_show_792209.aspx

如若内容造成侵权/违法违规/事实不符,请联系dt猫网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

纯CSS一分钟让网站拥有暗黑模式切换功能

本文字数&#xff1a;6784字 预计阅读时间&#xff1a;17分钟 前言 暗黑模式这个概念最早起源于MacOS系统的Mojave&#xff0c;提供浅色主题和深色主题两种皮肤供用户选择&#xff0c;深色主题就是我们常说的暗黑模式。为了眼睛健康&#xff0c;笔者在手机、平板和电脑上都选择…

30个让人兴奋的视差滚动(Parallax Scrolling)效果网站--转

视差滚动&#xff08;Parallax Scrolling&#xff09;是指让多层背景以不同的速度移动&#xff0c;形成立体的运动效果&#xff0c;带来非常出色的视觉体验。作为今年网页设计的热点趋势&#xff0c;越来越多的网站应用了这项技术。今天这篇文章就与大家分享30个视差滚动效果的…

前端通用SEO技术优化指南

本文字数&#xff1a;2585字预计阅读时间&#xff1a;8分钟背景近期团队开发的新产品的官网上线了&#xff0c;随之而来的问题就是如何让网站更快更好的传播出去。当然SEO就是最常见的手段之一&#xff0c;对官网的SEO工作有利于产品的网络传播和分享。有的团队会有专人负责SEO…

Windows Server 2008 R2服务器在IIS上添加网站

1、安装网站之前&#xff0c;我们先需要确定aspx模块是否安装成功&#xff0c;在管理工具下找到IIS管理器&#xff0c;在IIS管理器下找到应用程序池&#xff0c;单击右键选择添加应用程序池&#xff0c;即可弹出相关的弹出框。 我们看到.NET Framework版本中看到有2.0和4.0版本…

bugku-网站被黑(这个题没技术含量但是实战中经常遇到)

题目地址&#xff1a;http://123.206.87.240:8002/webshell/ 进去之后没什么特别的提示 但题目说了 实战 经常遇到 所以 直接 御剑 跑一下 http://123.206.87.240:8002/webshell/shell.php 进入到一个 后台登陆页面 打开burp 使用burp中的 Intruder模块 爆破 用bur…

访问服务器网站出现 HTTP ERROR 500 该网页无法正常运作

项目在本地写好后上传到服务器访问出现如下图所示&#xff1a; 经过查看php日志文件发现问题在于数据库连接错误&#xff0c;如下图&#xff1a; 将项目中数据库配置部分修改成服务器中数据库的用户名和密码&#xff0c;重启服务器即可正常访问。

网站设计中常用的一些jq效果

只做会做网站设计不会前端是不行的&#xff0c;现在很多网站设计师都会精通前端CSSjquery&#xff0c;但是今天要说的是是我个人在一家厦门网站设计公司中经验笔记&#xff0c;都是很实用的&#xff0c;希望能帮助网站设计者们&#xff0c;现在越来越多的网站运用上了Jquery技术…

如何利用Python监控你女/男朋友每天都在浏览什么网站?

需求&#xff1a; (1) 获取你对象chrome前一天的浏览记录中的所有网址(url)和访问时间&#xff0c;并存在一个txt文件中 (2)将这个txt文件发送给指定的邮箱地址(你的邮箱) (3)建立例行任务&#xff0c;每天定时自动完成这些操作&#xff0c;你就可以通过邮件查看你对象每天看…

给你8个接私活的网站,保证你月薪轻松上W

今天给大家推荐几个江湖卖艺赚钱养家的好渠道&#xff08;程序员&#xff1a;8个接私活的网站&#xff0c;只要你有码&#xff0c;那“我”就有钱&#xff01;&#xff09;一起来看看吧&#xff01; 1、程序员客栈 https://www.proginn.com/ 2、快码众包 https://www.kuai.m…

不会吧,学过爬虫连这个网站都爬不了?那Python岂不是白学了

本文内容 系统分析目标网页html标签数据解析方法海量图片数据一键保存 环境介绍 python 3.8pycharm 模块使用 requests >>> pip install requestsparsel >>> pip install parseltime 时间模块 记录运行时间 通用爬虫 导入模块 import requests # 数…

工程师英语和计算机证书查询,点击进入国家硬件维修工程师证书查询网站

工程师证书查询网站人力资源社会保障部指定查询国家职业资格证书的唯一官方网站。涵盖全国各省市、各行业、各央企颁发的证书。电脑硬件维修工程师网上能查看国家工信部硬件维修工程师证书查询网址&#xff1a;http://www.ceiaec.org/index.htm工程师证书编号在网上怎么查询如果…

根目录_怎样找到网站根目录?

什么是根目录&#xff1f;什么是根目录&#xff1f;根目录&#xff0c;或根文件夹&#xff0c;是顶层目录一个的文件系统。目录结构可以直观地表示为上下颠倒的“树”&#xff0c;因此术语“ root ”代表顶层。所有其它目录、子目录、目录的“分支”等都储存在根目录中。尽管所…

网站服务器怎么理解,http请求的原理怎么理解

(1)是请求方法&#xff0c;GET和POST是HTTP中最常用的方法&#xff0c;除了DELETE、HEe、OPT、NS、PUT和Sea之外。但目前大多数浏览器仅支持GET和POST。它提供了一个HiddenHtyMethodFilter&#xff0c;可以让你通过“_method”的表单参数来指定这些特殊的HTTP方法(实际上&#…

Tornado 网站demo 二

连接数据库 methods 中建立一个文件 db.py 分别建立起连接对象和游标对象 #!/usr/bin/env Python # codingutf-8import pymysql conn pymysql.connect(host"localhost", user"root", passwd"123456", db"testdb", port3306, charset&…

【redux】详解react/redux的服务端渲染:页面性能与SEO

亟待解决的疑问 为什么服务端渲染首屏渲染快&#xff1f;&#xff08;对比客户端首屏渲染&#xff09; react客户端渲染的一大痛点就是首屏渲染速度慢问题&#xff0c;因为react是一个单页面应用&#xff0c;大多数的资源需要在首次渲染前就加载好&#xff0c;这较大程度地拖慢…

顶级白嫖!!!八个python免费自学网站一周搞定python(抓紧收藏)。。

导读 人工智能必将到来&#xff0c;在那个时代&#xff0c;我们的工作方式会发生很大的改变&#xff0c;尤其是Python都已经进入了中小学教育的大纲&#xff0c;在智能为主的时代&#xff0c;Python就像现在的电脑一样&#xff0c;每个人工作中必备的工作技能&#xff0c;学会…

新手学电脑入门教程_适合新手程序员学习编程的10个常用网站,超实用

我们很多程序员刚学习时都到处找资源&#xff0c;今天小编我把最常用的10个编程网站分享给大家&#xff0c;大家只要经常浏览这10个网站&#xff0c;学好编程足够了。1、 Googlehttps://www.google.com/2、Stackoverflowhttp://stackoverflow.com/3、githubhttps://github.com/…

页面布局让footer居页面底部_谷歌SEO的网站页面内链布局3大方法!

在谷歌SEO里&#xff0c;网站中内链的重要性不言而喻。对于用户来说&#xff0c;合理的网站内链可以方便用户读取有用的信息&#xff0c;提升用户粘性&#xff0c;降低跳出率。从谷歌搜索引擎来说&#xff0c;合理的网站内链&#xff0c;不仅能够吸引谷歌搜索引擎蜘蛛的抓取&am…

阿里云云主机搭建网站攻略 - 云翼计划

阿里云服务器&#xff08;云主机&#xff09;搭建网站攻略 - 云翼计划 提示&#xff1a;此搭建攻略为2017版本&#xff0c;阿里云未跟新前。 最新搭建攻略请前往 Amaya丶夜雨博客 / 最新个人博客 https://www.amayaliu.cn 支持一下哦&#xff0c;谢谢。&#xff08;9.5一…

在网站中添加 https 百度分享

博客地址&#xff1a;http://www.moonxy.com 一、前言 百度分享是一个提供网页地址收藏、分享及发送的 WEB2.0 按钮工具&#xff0c;借助百度分享按钮&#xff0c;网站的浏览者可以方便的分享内容到人人网、开心网、QQ空间、新浪微博等一系列 SNS 站点。 网站主可以在百度分享网…