编写python爬虫采集彩票网站数据,将数据写入mongodb数据库

news/2024/5/13 2:07:53/文章来源:https://blog.csdn.net/weixin_30338461/article/details/97459941

1.准备工作:

1.1安装requests: cmd >> pip install requests
1.2 安装lxml: cmd >>  pip install lxml
1.3安装wheel: cmd >>  pip install wheel
1.4 安装xlwt: cmd >> pip install xlwt
1.5 安装pymongo: cmd >> pip install pymongo

完整代码
import requests
from lxml import etree
import xlwt
from pymongo import MongoClient#设置浏览器的请求头,告诉服务器我们是从浏览器来的,作用是阻止被网站反爬
headers = {'User-Agent': 'Mozilla/5.0 (Windows NT 6.1; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/73.0.3683.103 Safari/537.36','Accept-Encoding': 'gzip, deflate','Accept': 'text/html,application/xhtml+xml,application/xml;q=0.9,image/webp,image/apng,*/*;q=0.8,application/signed-exchange;v=b3','Connection': 'keep-alive'
}# 创建数据库
client = MongoClient()
database = client['Chapter6']
collection = database['webdata']for i in range(1, 21):url = "http://kaijiang.zhcw.com/zhcw/html/3d/list_{}.html".format(i)#发送请求 得到数据response = requests.get(url=url,headers=headers)#print(response.text)#将数据改成xpath结构res_xpath = etree.HTML(response.text)trs = res_xpath.xpath('/html/body/table//tr')# 将数据写入MongoDB数据库for tr in trs[2:-1]:data = {'开奖日期': tr.xpath("./td[1]/text()")[0],'期号': tr.xpath("./td[2]/text()")[0],'中奖号码1': tr.xpath("./td[3]/em[1]/text()")[0],'中奖号码2': tr.xpath("./td[3]/em[2]/text()")[0],'中奖号码3': tr.xpath("./td[3]/em[3]/text()")[0],'销售额(元)': tr.xpath("./td[4]/text()")[0],'返奖比例': tr.xpath("./td[5]/text()")[0]}collection.insert_one(data);

实现效果

 

转载于:https://www.cnblogs.com/kinblog/p/10983499.html

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.luyixian.cn/news_show_783542.aspx

如若内容造成侵权/违法违规/事实不符,请联系dt猫网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

中国电信北京研究院发布“2016年上半年网站安全报告”

提要:中国电信北研院副院长陈运清在致辞中表示,信息安全已经上升到国家战略高度,随着“互联网”时代到来,以及互联网新业务和新技术的快速发展,信息安全防护的要求越来越高。中国电信充分利用遍布全网的智能管道、丰富…

.NET也有春天及高性能网站架构实践

.NET也有春天及高性能网站架构实践 在本次专访之前,笔者一直都对.NET这个平台有所偏见,或者说是看不到.NET的优势,对Java Web、PHP、Ruby等更加看好,而之后SSH、RoR、LAMP等的流行也让笔者对这个观点更加坚信。然而在浏览完赵桂华…

推荐8个超棒的学习 jQuery 的网站

推荐8个超棒的学习 jQuery 的网站 根据国外科技网站 W3Techs 一项调查了近100万个网站数据显示,jQuery是目前最流行的 JavaScript 库。对于初学者来说,有的时候很难找到一个好的学习jQuery的网站,所以本文收集了8个很棒的 jQuery 学习网站推…

自学宝典:10个学习Android开发的网站推荐

自学宝典:10个学习Android开发的网站推荐 1. Android Developers 作为一个Android开发者,官网的资料当然不可错过,从设计,培训,指南,文档,都不应该错过,在以后的学习过程中慢慢理…

利用squid反向代理提高网站性能

利用squid反向代理提高网站性能本文在介绍 squid 反向代理的工作原理的基础上,指出反向代理技术在提高网站访问速度,增强网站可用性、安全性方面有很好的用途。作者在具体的实验环境下,利用 DNS 轮询和 Squid 反向代理技术,实现了…

MalwareMustDie关闭博客网站 抗议NSA利用恶意软件攻击公共机构

近期,国外一篇博客披露,著名的反恶意软件组织MalwareMustDie决定关闭其博客网站,以抗议NSA(美国国家安全局)利用黑客工具入侵无辜国家的教育和公共服务器。 文章指出,Shadow Brokers(影子经纪人…

阿里云 配置网站 安装nginx 访问不了公网ip

转载自:https://blog.csdn.net/LJFPHP/article/details/78670459 一、开始找原因 在浏览器输入:http://ip,正常的话,会有页面,welcome to nginx 我这里是浏览器访问失败, 查找原因: 1、在服…

asp.net免费网站三剑客:WebMatrix + MojoPortal + SQLCE

一个免费发布软件,一个免费CMS(内容管理系统),一个免费数据库,正好完成一个免费软件的部署。大致过程:1. 先从这里找到MojoPortal的CE版本:http://mojoportal.codeplex.com/releases/view/64508…

用户体验分析:以 “师路南通网站” 为例

作业目标: 对比UMU学习平台、学生安全教育平台,针对师路南通,开展UX分析。基于实例分析,体会用户体验设计的7条准则 作业要求: 基于我们列出的 7 条UX评价准则,分析“师路南通” 在用户体验设计方面让你觉得…

基于阿里云服务器搭建网站

前面写了《基于PHP搭建网站开发环境》的三节内容,主要用于PC端开发/调试/测试网站所需要搭建的开发环境。当然,最重要的还是网站开发成功之后,如何让很多人通过外网连接到网站呢? 1、服务器:服务器选择的是阿里云的&a…

阿里云建站的基本流程

1. 云服务器 ECS 1.1 概述 云服务器ECS实例,即阿里云服务器,以下简称 ECS 实例。 1.2 创建 ECS 实例 1.2.1 购买 ECS 实例 在阿里云官网找到:产品->云计算基础服务->弹性计算->云服务器 ECS 。 在购买之前可以领取阿里云优惠劵哦…

阿里云建站云企业官网标准版/高级版/尊贵版功能对比及选择方法

阿里云建站云企业官网标准版、高级版和尊贵版有什么区别?云集市场网分享阿里云建站定制云企业官网版本功能区别亮点及选择方法: 云企业官网标准版/高级版/尊贵版对比 阿里云建站云企业官网定制分为标准版、高级版和尊贵版三个版本,云集市场…

最全面的WordPress建站教程,零基础30分钟学会建站

宝塔面板添加WordPress站点 一、建站准备条件 条件1:阿里云服务器一台。原则上有台服务器就好了,不过我一般喜欢用大品牌,稳定和安全。条件2: 阿里云域名一个。在哪家买的服务器,就用哪家的域名,反之&…

快来建造自己的网站吧,阿里云免费教程哦

主要亮点: 亮点一:标配阿里云空间,无需技术,会打字就会建网站 亮点二:选定模板,预置1000套精美网站模板,覆盖上百行业,随意切换,简单修改,网站- 即可上线&am…

没有使用面板的云服务器(手动搭建环境的云服务器)备份网站文件和数据库的命令及教程

对于使用了面板(如宝塔面板)的云服务器来说,备份网站文件和数据库相当简单,但是没有使用面板的云服务器(手动搭建环境的云服务器)备份数据就稍显麻烦了,前几日有一朋友让我帮忙备份一下&#xf…

使用宝塔面板搭建WordPress网站(图文教程)

使用宝塔面板搭建WordPress网站 图片来自宝塔官网 现在搭建一个自己的网站已经不是一件难事了,有出色的WordPress程序,有价格实惠的云服务器,有像七牛云这种对草根站长友好的云存储服务,还有像宝塔面板这类易操作的面板&#xff…

阿里云建站全教程:域名注册/云服务器/环境搭建详细流程

小白如何创建网站部署环境?建立一个网站需要多少钱呢?笔者分享 个人/企业建网站的基本步骤和流程。从域名购买解析、到云服务器购买搭建环境,最后到上传程序,具体教程如下: 第一步、注册域名 进入(万网官…

NET温故而知新学习系列之网站安全技术—web.config加密和解密

NET温故而知新学习系列之网站安全技术—web.config加密和解密 我们为什么要对web.config配置文件中的配置节加密&#xff1f; 因为在我们的项目中&#xff0c;有的配置节可能包含敏感信息&#xff0c;我们看下面的<connectionStrings/>配置节中包含了我们连接数据库的用户…

新手建站教程—宝塔面板的安装与使用

为什么使用宝塔面板&#xff1f; 新手建站最大的痛苦就是不好入门&#xff0c;代码太多&#xff0c;无法轻松管理。 在这里&#xff0c;我们介绍一种简单好用的免费服务器运维面板——宝塔面板。使用宝塔面板&#xff0c;可以在可视界面中为服务器安装应用、同步文件、定期执行…

企业如何搭建公司网站?

现在是互联网时代&#xff0c;很多企业都注重互联网&#xff0c;通过做公司网站进行展示及营销。公司网站好处有以下几点&#xff1a; 公司网站是公司对外的宣传窗口&#xff1b;展现公司形象&#xff1b;挖掘潜在客户&#xff0c;即使现在不成交&#xff0c;以后也会通过网站…