对动态网站收集的注册信息进行处理

news/2024/5/12 8:02:55/文章来源:https://blog.csdn.net/sriting/article/details/52445741

这篇blog是接着上篇 第一个动态网站的心得–细数建站跳过的坑! 写的,主要是对网站的云服务器上的access数据库导出来的数据进行处理加工。

数据类型和内容

access数据库userinfo的info表格下,一共有以下六个字段:

  • number : 序列号; 自动编号;主键
  • id: 学号;短文本;不为空
  • name: 姓名;短文本;不为空
  • mail: 电子邮箱;短文本;不为空
  • cluster: 专业大类;短文本;不为空
  • isForeign: 是否为国际生;短文本;不为空

百团大战当天线下记录表格usernumber,记录所有线下交过钱、进行过验证的注册社员的序列号:

  • number: 序列号;数字(现场随机记录,不能选自动编号;更不能选短文本);主键

数据处理要求

1. 提取所有现场验证过的、交过社费的社员信息

提取现场注册验证过的序列号的表格usernumber中,每个序列号对应的数据:1、把注册信息表info和序列号验证表进行合并,利用两表都有number字段,查询所有usernumber中number值对应的info的记录。2、把查询结果生成新表submitted,对新表进行二次处理,改正填写错误的邮箱格式,批量添加邮箱后缀(@xxxx.xxx ),发注册成功邮件。

2. 提取所有线上提交过注册信息,但现场未验证过、交过社费的社员信息

利用上面查询生成的表submitted,进行第二次查询,查询userinfo表里有的但submitted表里没有的记录,生成新表unsure,因为怕注册人忘记序列号,我设置了允许最多三次提交,所以unsure表格里会包含有已验证过的会员的信息和未验证会员的重复信息。所以要进行二次过滤。第一次,先合并submitted表和unsure表,利用id字段,查询出两表重复的记录记为sameID表,即为unsure表需要删除的记录,然后通过查询unsure表里有但sameID表没有的记录,得到不包含已验证会员信息的表unsubmitted。第二次,对unsubmitted表再加工,删除重复id、重复姓名的记录,得到我们最后需要的信息,给所有未验证的注册者发邮件提醒缴纳社费。

数据处理步骤

1. 提取所有现场验证过的、交过社费的社员信息:

  • 打开access,导入info表和excel格式的usernumber表(步骤可看:利用Access查询两个表中相同字段的方法)

  • 合并两表:”创建“ —>”查询设计“—>info表和usernumber表都点—>空白处右键—>“SQL特定查询”—>“联合”—>填写SQL代码:

    SELECT info.*
    FROM info INNER JOIN usernumber ON usernumber.number = info.number
  • 生成具有所有验证过的社员信息的新表submitted,导出新表:打开“查询1”(之前查询的默认名)—>“外部数据”—>导出选”Excel“

  • 改正填写错误的邮箱格式,批量添加邮箱后缀(如:@163.com ):因为写错邮箱格式的人不多,但是写错的格式也是千奇百怪,我就没写代码,而是手动改,大概也就十几个吧。但是邮箱后缀是批量添加的,这里有个动图,生动展示了应该如何快速批量添加数值:(操作可看:Excel里面要统一加入同一字段该怎么操作?)
    这里写图片描述

2. 提取所有线上提交过注册信息,但现场未验证过、交过社费的社员信息:

  • 导入submitted表,像上面一样合并两表,再进行查询。不过这次查询的是userunfo表里有,但是submitted表里没有的记录,所以代码如下,导出表unsure (参考:access如何筛选两表相同字段中的不同数据):

    SELECT info.*
    FROM info LEFT JOIN submitted ON info.number = submitted.number
    WHERE (((info.number) Is Not Null) AND ((submitted.number) Is Null)); 
  • 第一次过滤,先合并submitted表和unsure表,利用id字段,查询出两表重复的记录记为sameID表,即为unsure表需要删除的记录,代码类似上面。然后通过查询unsure表里有但sameID表没有的记录,得到不包含已验证会员信息的表unsubmitted。

  • 第二次过滤,对unsubmitted表再加工,删除重复id、重复姓名的记录,得到我们最后需要的信息:这里有两个快速删除有重复记录的方法(参考:excel中如何删除有部分重复字段的记录):

    1. 使用高级筛选:
      1、选中相关记录(连续选中的矩形区域有效);
      2、在数据功能区,排序与筛选中的“高级”按钮;
      3、在弹出的“高级筛选”对话框中,选择筛选结果的显示方式,建议为第二种(保留原始数据);
      这里写图片描述

    2. 使用删除重复项工具:
      Excel2007及以后版本中增加了一个“删除重复项”按钮,用它来删除重复记录更加容易。步骤如下:
      1、选中相关记录(连续选中的矩形区域有效);
      2、在数据功能区,单击数据工具中的“删除重复项”按钮;
      3、在弹出的“删除重复项”对话框中,选择要查重的字段,即可。
      这里写图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.luyixian.cn/news_show_842049.aspx

如若内容造成侵权/违法违规/事实不符,请联系dt猫网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

基于Html的SEO(很基础,更是前端必须掌握之点)

2019独角兽企业重金招聘Python工程师标准>>> Html代码seo优化最佳布局&#xff0c;实例讲解 众所周知&#xff0c;搜索引擎对html代码是非常优化的&#xff0c;所以html的优化是做好推广的第一步。一个符合seo规则的代码大体如下界面所示。 1、<!–聚酯多元醇&am…

大型网站技术架构(一)大型网站架构演化

2019独角兽企业重金招聘Python工程师标准>>> 看完了有一本书&#xff0c;就应该有所收获&#xff0c;有所总结&#xff0c;最近把《大型网站技术架构》一书给看完了&#xff0c;给人的印象实在深刻&#xff0c;再加上之前也搞过书本上讲的反向代理和负载均衡以及ses…

大型网站技术架构(二)架构模式

2019独角兽企业重金招聘Python工程师标准>>> 每一个模式描述了一个在我们周围不断重复发生的问题及该问题解决方案的核心。这样&#xff0c;你就能一次又一次地使用该方案而不必做重复工作。 所谓网站架构模式即为了解决大型网站面临的高并发访问、海量数据、高可靠…

5个适合零基础练习的Python刷题网站

知乎上有人问&#xff0c;有没有适合新手练习 Python 的做题类网站&#xff1f; 根据我刷题找资料的经验&#xff0c;推荐以下5个Python练习网站&#xff0c;都很良心 1、Github 这不是一个专门的刷题网站&#xff0c;而是代码托管平台&#xff0c;里面有数百万个Python项目…

爬虫python学习代码记录3-抓取某电商网站的商品数据

Python3 爬虫、数据清洗与可视化实战 第4章 大型爬虫案例&#xff1a;抓取某电商网站的商品数据 目录 抓取某电商网站的商品数据 封装代码&#xff0c;提高可读性 写一个程序test.py定时监控运行结果 爬虫效率优化 抓取某电商网站的商品数据 # 第4章 大型爬虫案例&#x…

鸿蒙os报名入口,鸿蒙os2 0公测版报名链接网站入口

鸿蒙OS2.0现在已经开启了招募活动&#xff0c;在手机中我们可以通过报名的方法来提前体验到这个系统&#xff0c;那么鸿蒙OS2.0公测招募怎么报名吧&#xff0c;下面就来本文中看看鸿蒙OS2.0公测招募报名网址以及报名条件说明介绍吧!鸿蒙OS2.0测试版资格申请网址鸿蒙OS2.0公测招…

太赞了,京东研发一哥力荐的高可用网站构建技术PDF,备好水,慢慢啃

学习是一种基础性的能力。然而&#xff0c;“吾生也有涯&#xff0c;而知也无涯。”&#xff0c;如果学习不注意方法&#xff0c;则会“以有涯随无涯&#xff0c;殆矣”。 学习就像吃饭睡觉一样&#xff0c;是人的一种本能&#xff0c;人人都有学习的能力。我们在刚出生的时候…

终于拿到了2022阿里技术专家分享的552页大型网站架构实战PDF文档

说在前面 在笔者职业生涯的开端&#xff0c;曾参与了一个合同额每年亿元级的软件项目。 该项目有一个独特的架构&#xff0c;可以让开发人员近似千人一面地完成开发工作&#xff0c;加之该项目有严谨的项目管理流程&#xff0c;使得它迭代十几年至今。 之后参与了一个不太成…

随手记:发布网站时报错;文件创建完第一次无法写入数据

一、Asp.Net网站生成没问题&#xff0c;发布时报错&#xff1a;未能获得项目引用“XXX”的依赖项 解决方案&#xff1a;配置改成“Debug-any cpu” 补充&#xff1a;如果使用Release-any cpu&#xff0c;需要检查相关联的项目中Release文件夹中&#xff0c;可能缺少相关联的dll…

京东技术负责人纯手写:小团队构建大网站中小研发团队架构实战

本书结合作者近几年的工作经验&#xff0c;总结了一套可直接落地、基于开源、成本低、可快速搭建的中小研发团队架构实践方法。本书共5篇22章&#xff0c;开篇是本书的导读;架构篇是设计思想的提升&#xff0c;包括企业总体架构、应用架构设计、统- -应用分层等;框架篇主讲中间…

phpcms实现mysql读写分离_五指CMS(wuzhicms)开源网站管理系统 v4.1.0 简体中文 UTF8 正式版...

五指CMS(wuzhicms)开源网站管理系统简介五指cms由原phpcms V9 负责人王参加主导开发&#xff0c;前后台界面采用html5css3技术&#xff0c;可以进行跨屏、跨设备管理内容&#xff0c;极大的提升了用户体验。五指CMS(wuzhicms)开源网站管理系统功能特点描述模型化设计&#xff1…

一些Java技术相关的博客,专栏,和技术学习网站推荐?

推荐两个视频学习网站 慕课网 第一个推荐的学习网站应该是慕课网&#xff08;慕课网私聊我打钱哈&#xff01;&#xff09;&#xff0c;在我初学的时候&#xff0c;这个网站对我的帮助挺大的&#xff0c;里面有很多免费的课程&#xff0c;也有很多付费的课程。如果你没有特殊…

Chrome浏览器安装插件提示“无法从该网站添加应用,拓展程序或脚本”解决办法

新版的Chrome&#xff0c;只可以在官方商店中安装扩展。 准确的说&#xff0c;从主版本号67开始&#xff0c;以后所有版本的Chrome&#xff0c;都无法安装离线插件。 查看chrome版本的方法&#xff0c;在chrome地址栏&#xff0c;输入chrome://version/&#xff0c;回车就能查…

如何解决电商网站超卖现象

所谓超卖现象举例&#xff1a;比如某商品的库存为1&#xff0c;此时用户1和用户2并发购买该商品&#xff0c;用户1提交订单后该商品的库存被修改为0&#xff0c;而此时用户2并不知道的情况下提交订单&#xff0c;该商品的库存再次被修改为-1这就是超卖现象。 究其深层原因&…

Cisco官方网站悄然换标

10月2日&#xff0c;就在所有中国人欢度国庆佳节之际&#xff0c;可能是思科(cisco)历史上最大的市场活动悄然启动。就在今天&#xff0c;51cto.com记者发现&#xff0c;思科网站全面改版&#xff01;其实&#xff0c;改版的内容不大&#xff0c;主要就是logo的改变。记者发现&…

CYQ.IIS 下载中心[ASP.NET 本地运行网站无需要安装IIS]

CYQ.IIS&#xff08;QBlog-IIS.exe) 下载中心&#xff1a; 简介&#xff1a;CYQ.IIS&#xff08;QBlog-IIS.exe) 是由一款改造自开源的CassiniServer的本地IIS运行程序&#xff0c;使用它可以无需要安装IIS&#xff0c;直接运行ASP.NET网站。 使用说明&#xff1a; PS&#xf…

BestSync同步软件使用指南 - FTP自动备份网站数据[转]

文/china#risefly.com 网站数据备份无疑是站长们的一个头疼问题&#xff0c;如服务器损坏&#xff0c;黑客攻击等造成数据损失无疑是一场灾难&#xff0c;那么如何能够安全&#xff0c;定时的把站点自动备份呢&#xff1f; 本文旨在教您如何通过BestSync同步软件&#xff0c;设…

今天需要部署.Net 4的网站提示 Service Unavailable

某Windows 2003服务器&#xff0c;装有IIS6&#xff0c;未安装过.Net Framework 4。今天需要部署.Net 4的网站&#xff0c;于是安装.Net Framework 4。 安装过程一切顺利&#xff0c;安装完成之后现有的几个网站就都无法访问了&#xff0c;提示 Service Unavailable。查看系统日…

iis 6.0上部署.net 2.0和4.0网站

网站环境 IIS6.0,操作系统Windows server2003 sp2,服务器之前已经部署了.net 2.0和asp的网站,现在要部署新开发的.net 4.0网站. 大体部署流程如下&#xff1a; 1.官网下载.net framework4.0,下载地址: http://www.microsoft.com/zh-cn/download/details.aspx?id17718,下载后安…

在IIS7.5中部署PHP网站报错:无法在fastCGI应用程序配置中找到handler scriptProcessor

1&#xff1a;在IIS7.5中部署PHP网站报错&#xff1a;无法在<fastCGI>应用程序配置中找到<handler> scriptProcessor 解决方案&#xff1a;1&#xff09;拷贝PHP必备的应用程序和扩展DLL(复制2个文件夹php和phptmp)2&#xff09;配置好php.ini文件的路径&#xff1…