23.模拟登录cookies请求速询网站数据

news/2024/5/19 0:08:19/文章来源:https://blog.csdn.net/weixin_34401479/article/details/94342730
23.模拟登录cookies请求速询网站数据
采集速询网站数据:

网站地址:http://www.suxun0752.com/index.html

网站是需要账号登录才给返回信息的,我这里是直接拿的登录后的cookies请求的数据,cookies我也给了注释,没做深层的采集只是试采集了某一月份的。

简单分析一下 :

1.首先要先拿到cookies这样你才有权限去访问返回的数据。
2.分析页面翻页请求的参数,及需要筛选的标签年份、月份等。
把这几个参数综合起来去请求,就能完全获取页面数据了。我这里只是拿了一个月份的数据去请求获取数据。

问题:虽然有账号,但是采集到一定程度还是会被检测到访问过于频繁限制采集。
这里只是一个解决问题才去的简单方法。

采集状况,存入文本txt:

 

 
# coding:utf-8import requests
import random,time
import json
#请求地址
target_url ='http://www.suxun0752.com/template/infoPrice/govlist.tdo?t=Fri%20Oct%2019%202018%2015:55:08%20GMT+0800%20(%E4%B8%AD%E5%9B%BD%E6%A0%87%E5%87%86%E6%97%B6%E9%97%B4)'headers = {'Accept': '*/*','Accept-Encoding': 'gzip, deflate','Accept-Language': 'zh-CN,zh;q=0.9','Connection': 'keep-alive','Content-Length': '75','Content-Type': 'application/x-www-form-urlencoded; charset=UTF-8','Cookie': '************账号来之不易******************','Host': 'www.suxun0752.com','Origin': 'http://www.suxun0752.com','Referer': 'http://www.suxun0752.com/template/channelView.thtml?channel_id=00af','User-Agent': 'Mozilla/5.0 (Windows NT 6.1; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/68.0.3440.106 Safari/537.36','X-Requested-With': 'XMLHttpRequest',
}
#模拟请求参数
for i in range(0,400):j=i*10form_data={'prov': '1','city': '12','area': '59','year': '17','month': '9','key': '','code': '','start': '{}'.format(j),'displayRecord':'10',}# 发送post请求,翻译数据response = requests.post(target_url, data=form_data, headers=headers)# print(response.text)content = json.loads(response.text)list = content['object']# print(list)for i in list:id = i['id']print(id)name = i['name']print(name)area = i['area']print(area)city = i['city']print(city)price = i['price']print(price)nicePrice = i['nicePrice']print(nicePrice)month = i['month']print(month)note = i['note']print(note)code = i['code']print(code)file_id = i['file_id']print(file_id)spec = i['spec']print(spec)unit = i['unit']print(unit)year = i['year']print(year)print('*'*100)time.sleep(random.randint(1,2))with open('text', 'a', encoding='utf-8')as f:f.write('\n'.join([str(id),str(name),str(area),str(price),str(nicePrice),str(month),str(code),str(file_id),spec,str(unit),str(year)]))f.write('\n' + '=' * 100 + '\n')


 

 

 

posted on 2018-11-07 17:57 五杀摇滚小拉夫 阅读(...) 评论(...) 编辑 收藏

转载于:https://www.cnblogs.com/lvjing/p/9924137.html

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.luyixian.cn/news_show_797342.aspx

如若内容造成侵权/违法违规/事实不符,请联系dt猫网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

域名添加cdn_优化网站-设置内容分发cdn和对象存储cos

刚开始接触花了不少时间去弄,通过搜网上资料,才解决问题。以腾讯云为例,为什么要用腾讯云,因为CDN 用户每月均可享受10GB免费流量包,接入加速域名后于次月1号发放至您的账户。还有新开通 CDN 的用户还会在开通后的6个月…

html漂亮的表格模板+背景_App开发主题响应式网站着陆页模板

哈喽!大家好,这里公众号,Adobe素材助手。App开发主题响应式网站着陆页模板,用于应用程序站点。它是干净,现代和创造性的设计适合所有类型的应用程序风格的网站。这个模板是创造性和专业性的完美结合,所有部…

10个留美必备生活网站

不少同学习惯了天朝各种方便的互联网服务,一到美国往往感到不适应,其实美国也有很多提供类似服务的网站。今天小编就给你做一个大盘点。帮助你在美国也能轻松享受和国内类似的服务。1.Yelp 美国最大的点评网站民以食为天,今天我们首先要介绍的…

html颜色渐变配色方案,css网站推荐 渐变色配色方案 - 小俊学习网

渐变色彩搭配方案的酷站,推荐2个渐变色方案的网站。无论网页配色还是设计人员都可以参考这些美丽的色彩。UIgradients – 美丽的UI渐变色分享站 并可转成CSS代码通过渐变彩色滤镜实现很多漂亮的效果,然而用什么渐变颜色才好呢?可以看看今天为…

大型网站技术架构(四)网站的高性能架构

2019独角兽企业重金招聘Python工程师标准>>> 网站性能是客观的指标,可以具体体现到响应时间、吞吐量、并发数、性能计数器等技术指标。 1、性能测试指标 1.1 响应时间 指应用执行一个操作需要的时间,指从发出请求到最后收到响应数据所需要的时…

大型网站技术架构(三)架构核心要素

2019独角兽企业重金招聘Python工程师标准>>> 所谓架构,一种通俗的说法就是“最高层次的规划,难以改变的决定”,这些规划和决定奠定了事物未来发展的方向和最终的蓝图。 而软件架构即“有关软件整体结构与组件的抽象描述&#xff0…

【读书笔记《Bootstrap 实战》】6.单页营销网站

我们已经掌握了很多实用 Bootstrap 的重要技能。现在,是时候拿出更多的创意来帮助客户实现他们全方位在线营销的愿望了。此次将带领大家做一个漂亮的单页高端营销网站。 主要任务如下: □ 一个大型介绍性传送带图片展示区,配有自定义的响应式…

【JavaWeb开发】初步实现网站应用钉钉扫码登录

写在前面:如果你还不知道钉钉是什么,就赶紧问问Google。当然,这篇博客是用流水线的形式完成钉钉扫码登录。 第一步,看官方文档 网站应用钉钉扫码登录开发指南(钉钉官网) 如果你想要通过用户扫码获取到他的…

大型网站技术架构(四)网站的高性能架构

2019独角兽企业重金招聘Python工程师标准>>> 网站性能是客观的指标,可以具体体现到响应时间、吞吐量、并发数、性能计数器等技术指标。 1、性能测试指标 1.1 响应时间 指应用执行一个操作需要的时间,指从发出请求到最后收到响应数据所需要的时…

大型网站技术架构(七)网站的可扩展性架构

2019独角兽企业重金招聘Python工程师标准>>> 扩展性是指对现有系统影响最小的情况下,系统功能可持续扩展或提升的能力。 设计网站可扩展架构的核心思想是模块化,并在此基础上,降低模块间的耦合性,提供模块的复用性。模…

使用apache2在ubuntu下搭建简易网站(新手小白适用)

使用apache2在ubuntu下搭建简易网站 写在开头 本文章适合有一点linux基础但是不会网站搭建的小白,这里使用的网页是我之前写的一个作业,所以大家就不要嫌丑啦~~ 正文 本文使用阿里云云服务器进行部署 安装apache2 安装前先更新下软件 sudo apt upda…

苹果cms模板_万词无限模板站群黑帽SEO利器

万词无限模板排名站群,端口站群,无限模板,关键词,可做百度搜狗360各大引擎。100万流量利器,强悍无与伦比。无需任何推送,全自动收录,动态轮链池,内部有秒收课程霸屏关键词技巧。程序自带蜘蛛池功能无需任何辅助蜘蛛池&…

Nginx从入门到实战(七):定时器动态切换nginx配置-实现网站自动启停

背景: 有些网络由于某种特殊需求,需要每日在指定时间内开放,在其余时间展示“系统正在维护中…”的页面。 基于类似需求,最好的当然是定时自动处理了,省去人工处理的麻烦; 一、整体思路 1、设计2个nginx.…

一个网站的LOGO

今天董事长叫我去谈了话,有了一个网站的构想于是就先做一个LOGO也来了,好久没有做美工方面的东东了希望这个LOGO能用上,把网站做起来像我这种人天生就是为做网站的董事长也说以前让我们做那些,对我们来说也是和自己的专长搭不上现…

我要自学网polyworks_四大适合年轻人自学的网站!知乎超100万人推荐,自学改变人生...

在这个互联网时代,想要学点什么东西,上网搜一搜就有,但网上的资源五花八门,看得人眼花缭乱,想要找到高质量又免费的自学资源还真不是见容易的事!不过别着急,今天就来跟大家分享几个质量杠杠的自…

html理财用户中心模板,银行理财HTML5网站模板

银行理财HTML5网站模板资源下载此资源下载价格为4D币,请先登录资源文件列表codedown123-0820-34/css/bootstrap.css , 141622codedown123-0820-34/css/flexslider.css , 6661codedown123-0820-34/css/font-awesome.css , 35134codedown123-0820-34/css/style.css , …

【摘】改进电子商务网站易用性的10个方法

今天消费者网络购物的支出越来越多,可是太多的网站并没有考虑到他们网站和订购流程的易用性,最终导致用户很快就放弃了他们的订购。 这里有10种可以提高你的电子商务网站易用性的方法,可以帮助你最大可能的提高网站的转化率,将用户…

网站维护必知:网站压力测试

【IT168 专稿】互联网的普及,宽带的流行,使得越来越多的个人和单位都架设了自己的网站。而充当网站的服务器的大多是普通的PC或者低档服务器,这样访问者人数一多或者遭受DDos攻击,很容易造成瘫痪。因此我们需要网站在真正发布前对…

js怎么制作一个下拉菜单_怎么才能制作一个比较好的网站

当今互联网时期,任何企业开展宣传都离不开网络,那么制造一个好的网站就显的很重要了。做一个好的网站,不只能够彰显公司的实力,而且还能带来流量带来客户。高端一些的应该看起来很洁净,没有很浓的颜色去装饰&#xff0…

我用We7 网站群系统建设县级网站群全程回放

随着网络和信息化的发展,网站的建设也越来越重要,各个公司,单位都会有一个自己的网络形象,政府部门也是如此,想让更多的公民了解,更好的为人民提供方便的服务,已成为当今判断政府部门服务的基本…