生成新冠疫苗接种趋势图-技术和法律学习

news/2024/4/29 3:12:03/文章来源:https://www.cnblogs.com/jingjingxyk/p/16845153.html

文档说明:只记录关键地方;

缘由:


想看疫苗接种趋势图,我要去哪里找呢?奈何公开的渠道没有找到!自己做一个呗

数据来源: http://www.nhc.gov.cn/xcs/xxgzbd/gzbd_index.shtml
(信息来自国家卫生健康委员会官方网站)

我要怎么得到数据呢?用什么展示呢?

搜索一番

1. 趋势图使用echarts展示2. 数据怎么来呢?怎么快速得到数据?用什么工具可以实现?

心路历程:

1. 手工复制粘贴数据,复制粘贴了15天的数据,发现,这么不行阿,太慢了!2. 开始之前先用  curl -v 直接请求,看请求头。接着 用程序直接请求地址,用正则匹配内容,3. 好家伙,开始还能用,多试几次,body直接不返回信息了!(通过查看响应头,发现被 waf 拦截了);下面怎么办?4. 搜索,waf 用什么拦截是什么原理?用了浏览器指纹、请求速度、UserAgent、浏览器headless模式、人的行为特征等等,来判断是不是机器人!5. 通过搜索了解到各种爬虫技术:  python3 requests、3BeautifulSoup、scrapy、3urllib.request、puppeteer 、pyppeteer 、DevTools Protocol、群控技术、人力分布式爬虫、 找人力资源,看网页,人工录入,人工便宜把渗透技术用于爬内容、  直接读取内存行不行?录屏 OCR 解决、把并发间隔整形成正态分布试试 (看到这里,我就想起了,游戏里的物理外挂)把社会社会工程学用于信息爬取 更高级的的做法是不爬数据,而是引导用户,让用户主动提交信息6. 了解了那么多技术,最有效的办法--分布式人工爬虫+网联云控技术人工便宜因为人工便宜,按照文档操作文档就能弄,不需要技术含量的工作。这也就能解释了 刷单、刷播放量、刷排名、刷热搜、刷投票,怎么回事! 分布式真人操作多雇点人,人肉爬,法律上很安全 (人力不值钱)网联云控还有一个群控技术,这个更恐怖,把装有群控技术软件的手机发给用户,通过服务器远程操作分布在全国各地的手机,让手机干什么,就干什么 !(例子: 手机植入后门,默默的扣费;手机自动点赞,评论。还能自动发短信)为啥我知道,因为我是受害者, 投诉无门 (你可以看看自己的短信详单,你会发现,你的短信详单里,发送方主叫号码都不显示了,这样你也就找不到投诉对象)我因投诉,被某些服务商拉入了黑名单,黑名单解除期限 2029年(导致燃气公司,给我发的短信,我收不到,原因是:燃气公司的短信服务商,是我投诉过的服务商)7. 研究了那么多,发现爬虫挺有意思的。 重点来了,请看下面: 面向牢饭编程爬虫写的好,牢饭吃到老反爬团队和爬虫团队可能是同一拨人(不知进攻如何防守)爬取个人隐私身份信息是违法的任何单位和个人不得非法制造、销售、提供或者使用网络地址自动切换系统。中华人民共和国网络安全法中华人民共和国反电信网络诈骗法  帮信罪: 《网络产品安全漏洞收集平台备案管理办法》非法破坏计算机系统罪12. 单独看几条:第十四条 任何单位和个人不得非法制造、买卖、提供或者使用下列设备、软件:(一)电话卡批量插入设备;(二)具有改变主叫号码、虚拟拨号、互联网电话违规接入公用电信网络等功能的设备、软件;(三)批量账号、网络地址自动切换系统,批量接收提供短信验证、语音验证的平台;(四)其他用于实施电信网络诈骗等违法犯罪的设备、软件。电信业务经营者、互联网服务提供者应当采取技术措施,及时识别、阻断前款规定的非法设备、软件接入网络,并向公安机关和相关行业主管部门报告。《网络安全法》第二十六条,“开展网络安全认证、检测、风险评估等活动,向社会发布系统漏洞、计算机病毒、网络攻击、网络侵入等网络安全信息,应当遵守国家有关规定。”

最后来个最简单的落地方案:

觉得简单,是因为,只会这个

    1.  正则+javascript脚本从单个页面把数据提取出来2.  javascript脚本、浏览器扩展、浏览器远程调试端口 控制?页面往上一页、往下一页3.  总结: 页面注入javascript脚本,获取数据,并把数据传递到指定的地方4.  大致方法:方法一: 浏览器扩展就能实现全部功能方法二: 应用程序连接浏览器运程调试端口,推荐: puppeteer  pyppeteer (实现devtools-protocol的应用程序都行)

结果展示

没用啥技术,实际浏览器扩展就可以完成数据获取

参考文档

  1. 图表显示chart

Headless browser detection

  1. Getting Started with Headless Chrome

  2. chrome-headless-test

  3. detect-headless

  4. detect-headless

  5. [headless-chrome]https://developers.google.com/web/updates/2017/04/headless-chrome)

  6. 浏览器指纹技术

  7. python基础知识

  8. 正则表达式 - 语法

  9. pyppeteer从基本使用到启发式爬虫

  10. WEB2.0启发式爬虫实战-猪猪侠-20180616.pdf

  11. WEB 2.0 启发式爬虫实战|阿里云猪猪侠

  12. puppeteer

  13. pyppeteer

  14. playwright-python

  15. DevTools Protocol

  16. github devtools-protocol

  17. chrome-remote-interface

  18. Headless Chromium

  19. Headless Chrome

  20. chromium自定义启动参数 和 启用远程调试

  21. 快速下载chromium源码

  22. 定制自己的chromium浏览器,linux版

  23. 请问天眼查,企查查等数据是怎么来的

  24. cheatengine

  25. kali tools

  26. 先知社区

法律法规

  1. 立法禁止非法使用网络地址自动切换系统
  2. 中华人民共和国反电信网络诈骗法
  3. 工信部印发《网络产品安全漏洞收集平台备案管理办法》
  4. 中华人民共和国网络安全法:
  5. 中华人民共和国反电信网络诈骗法
  6. 帮信罪

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.luyixian.cn/news_show_410455.aspx

如若内容造成侵权/违法违规/事实不符,请联系dt猫网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

靶机20 driftingblues3

描述: __________ 获取标志 难度:简单 1、下载靶场 靶机名称:driftingblues 下载地址: DriftingBlues: 3 ~ VulnHub 2、安装靶场 以DC-1为例,将文件解压(一压缩包形式进行下载)。 打开虚拟机,选…

K8S二进制部署之定义CA证书与ETCD

文章目录CA证书制作K8S集群证书流程K8S 二进制集群部署K8S二进制部署ETCD集群部署1、docker部署(所有节点)ETCD集群部署master节点操作小结:查看etcd 启动脚本创建ca证书创建cfssl类型工具下载脚本到node节点修改CA证书 CA证书中包含密钥对 …

浅谈 web3

web3——互联网的未来? web3,很多人觉得是个骗局,是在割韭菜。因为大部分介绍 web3 的文章都离不开 NFT、数字货币、区块链、比特币、以太坊、元宇宙等概念,玄之又玄,脱离我们的生活,没解决我们的痛点。一般文章最后还教给我们怎么炒币,怎么买卖 NFT,妥妥的割韭菜套路,…

顺序结构综合练习

顺序结构综合练习 数学头文件#include<cmath> 幂函数 pow10(x)结果等于10^x pow()函数是cmath标头的库函数,用于查找幂的加数。计算x的y次方 pow()函数语法:pow(x,y); #include<cstdio>// main(){int a,b,c;scanf("%d%d",&a,&b);//格式化…

长时间久坐危害竟然这么大,这4项检查,男性朋友一定要定期查

对于男性而言&#xff0c;生殖系统健康尤为重要&#xff0c;但很多人却并不是那么重视&#xff0c;家住昆山的小王就是其中一员&#xff0c;作为一名程序员的他&#xff0c;上班坐着&#xff0c;上班路上坐着&#xff0c;下班路上也是坐着&#xff0c;回家更是坐着。小伙身体棒…

Bootstrap概述和Bootstrap快速入门

Bootstrap概述 1.概念:一个前端开发的框架,Bootstrap,来自Twitter,是目前很受欢迎的前端框架。Bootstrap是基于HTML、CSS、JavaScript的,它简洁灵活,使用得Web开发更加快捷。框架:一个半成品软件,开发人员可以在框架基础上,在进行开发,简化编码。好处:1.定义了很多的…

css 居中

阅读目录水平居中垂直居中垂直居中: position 绝对定位演示垂直居中: flex 演示垂直居中: transform 演示水平&垂直居中flex 1flex 2position水平居中 1 行内块居中 设置父元素的 text-align: center 2 块级元素 设置当前块级元素(宽度) margin: 0 auto; 3 绝对定位 元素…

【微机接口】中断的基本概念

中断&#xff1a; CPU在执行程序的过程中&#xff0c;由于某种外部或内部事件的作用&#xff0c;使CPU停止当前正在执行的程序转去为该事件服务&#xff0c;待事件服务结束后&#xff0c;又能自动返回到被中止的程序继续执行。 主程序&#xff1a; 被中断的原程…

@DateTimeFormat和@JsonFormat介绍

文章目录1.DateTimeFormat注解1.1DateTimeFormat注解简介1.2DateTimeFormat注解的功能1.3DateTimeFormat注解的注意点1.4DateTimeFormat功能演示1.4.1类型转换异常情况测试1.4.2接收url路径传参格式测试1.4.3接收Form-Data数据格式测试1.4.4接收JSON数据格式测试2.JsonFormat注…

基于协同过滤推荐算法的在线教育平台(Vue+Node.js+SSM)

基于协同过滤推荐算法的在线教育平台&#xff08;前后端分离&#xff09;。 back为后端&#xff0c;front为前端&#xff0c;config-files为相关配置文件 摘要 随着科技的不断变迁&#xff0c;信息技术的不断迭代升级。人们对于互联网方方面面的需求都开始涌现了出来&#xf…

第9章实验作业

实验9:异常处理及程序调试 一、实验目的和要求 1、了解代码异常知识; 2、掌握异常处理的try…except语句、try…except…else语句、try…except…finally语句。raise语句; 3、掌握程序调试的方法。 二、实验环境 软件版本:Python 3.10 64_bit 三,实验过程 实验1 (1) def…

实战经验:如何根据系统的业务场景需求定制自己的线程池?

线程池有那么多的参数和类型&#xff0c;在实际的开发中&#xff0c;我们应该如何设置呢&#xff1f;是直接使用Executors提供的线程池实现&#xff0c;还是自定义线程池&#xff1f;这都是我们本篇文章要回答的问题&#xff0c;那么就请跟随笔者一起分析一下在实战中如何根据系…

uniapp开发微信小程序-用户授权登录和获取手机号码

小程序开放文档 uniapp开发的小程序配置&#xff0c;找到manifest.json&#xff0c;填入正确的小程序appId&#xff1b; hbuilderx>运行>运行到小程序模拟器(安装开发者工具)&#xff0c;编译完成之后会直接在微信开发者工具内打开&#xff1b; 登录流程解析&#xff1…

【SpringBoot】一文了解SpringBoot热部署

文章目录前言手动启动热部署热部署种类手动进行热部署自动启动热部署热部署范围配置热部署的关闭总结&#x1f315;博客x主页&#xff1a;己不由心王道长&#x1f315;! &#x1f30e;文章说明&#xff1a;一文彻底搞懂SpringBoot热部署&#x1f30e; ✅系列专栏&#xff1a;Sp…

程序人生:去了字节跳动,才知道年薪40W的测试有这么多?

今年大环境不好&#xff0c;内卷的厉害&#xff0c;薪资待遇好的工作机会更是难得。最近脉脉职言区有一条讨论火了&#xff1a; 哪家互联网公司薪资最‘厉害’&#xff1f; 下面的评论多为字节跳动&#xff0c;还炸出了很多年薪40W的测试工程师 我只想问一句&#xff0c;现在的…

【C#】async和await

大概理解 查了一个小时的资料&#xff1a;async和await 发现这个大神的解释一针见血&#xff0c;深得我心&#xff01;以最简单的例子&#xff0c;解释了async和await。妙~~~ 大多情况下&#xff0c;分开才能体现async和await的价值&#xff01; 但&#xff0c;await 并没有…

C#中的弃元

从C#7.0开始,推出了一种新的特性:弃元,这种思想可能来源于Golang。弃元,就是不想要了的元素变量,用单下划线(_)表示,弃元在编译时起作用,就是搞编译器:这个变量我不要,你可以优化处理。我们经常在下面几个过程中使用弃元:1、元组解构赋值在使用元组解构赋值时,我们…

Linux——进程间通信——管道(文件)通信

目录 前言 一、有名管道 1、用法 2、管道分类 3、有名管道的创建 4、思考&#xff1a;如何进程a要将键盘获取的数据传递给另一个进程b&#xff1f; 5、有名管道实现进程间通信 二、无名管道 1、无名管道的创建 2、管道操作分为以下步骤 3、无名管道实现进程间通信 前言…

string类详解

文章目录1:构造string类1.1:方法1.2:测试2:size和length2.1:用途2.2:测试3:capacity3.1:用途3.2:测试4:clear4.1:用途4.2:测试5:empty5.1:用途5.2:测试6:reserve6.1:用途6.2:测试7:resize7.1:用途7.2:测试8:string的三种遍历8.1:方法一 for循环和[]重载8.2:方法二 迭代器8.2.1:…

基于CNTK/C#实现逻辑回归【附源码】

文章目录前言一、VS2022CNTK环境搭建二、逻辑回归代码构建1.逻辑回归构建2.训练数据的生成3.模型训练三、效果展示前言 本文基于CNTK实现逻辑回归二分类&#xff0c;并以之前的不同&#xff0c;本次使用C#实现&#xff0c;不适用python&#xff0c;python版的CNTK比较简单&…