反复刷新增加访问量_基于爬虫刷新某网站访问量!我说怎么上千万呢!

news/2024/5/20 4:35:48/文章来源:https://blog.csdn.net/weixin_39907939/article/details/113330664
前言:前一段时间看到有博友写了爬虫去刷新博客访问量一篇文章,当时还觉得蛮有意思的,就保存了一下,但是当我昨天准备复现的时候居然发现文章404了。
所以本篇文章仅供学习交流,严禁用于商业用途

当我在写文章的同时,代码依然在运行,亲测是有效滴。

2084116fb3ce20b3b827e1ed1506939a.png

你很容易会发现你写的那些水文章的url都有一个共同特点,前面都是固定的,就是后面一串数字不一样,这串数字是利用某种算法生成,因为我不会,这里我不展开讲了。我只需要把后面的数字拿过来就好了。

https://blog.csdn.net/SuperBetterMan/article/details/107508976
https://blog.csdn.net/SuperBetterMan/article/details/107368925
https://blog.csdn.net/SuperBetterMan/article/details/107144322

CSDN是基于ip地址去判别有效的访问量,同一个ip访问过多后,会被后台判定是机器,将不再增加访问量,IP甚至会被禁止访问一段时间。那我们找了一个免费的性价比还不错的ip代理,很好解决了这个小小的问题。
昨晚出去散步把代码放在跑,本来以为能刷个几k吧,但是当我回来却发现刷到2百多的时候,后台就给我停掉了,而且网站应该是设置了一个时间戳,在一定时间内,即使不同的ip访问了,也不会增加访问量。
最后当我写完这行的时候,代码也还在跑,真要是闲的没事可以放在云服务器上多搞几个线程跑个几天几夜,然后号就没了

f01471fac3d8df83764388972171f49e.png


最后附上代码,代码也上传到github,里面有一些其他较为有意思的代码,希望大家可以喜欢,然后给我一个小star

from lxml import html
import time
import random
import requestsimport re
import urllib.request
import urllib.parsefirefoxHead = {"User-Agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64; rv:61.0) Gecko/20100101 Firefox/61.0"}
IPRegular = r"(([1-9]?d|1d{2}|2[0-4]d|25[0-5]).){3}([1-9]?d|1d{2}|2[0-4]d|25[0-5])"
host = "https://blog.csdn.net"
url = "https://blog.csdn.net/SuperBetterMan/article/details/{}"
codes = ["106651719", "106533059", "107508976", "106658304", "106594490", "106242605"]def parseIPList(url="https://www.89ip.cn/tqdl.html?num=60&address=&kill_address=&port=9999&kill_port=&isp="):req = urllib.request.Request(url)  # 创建请求对象res = urllib.request.urlopen(req)  # 对网页发起请求并获取响应html = res.read().decode("utf-8")p = re.compile(r'(?<![.d])(?:d{1,3}.){3}d{1,3}(?![.d])')IPS = re.findall(p, html)return IPSdef PV(code):s = requests.Session()s.headers = firefoxHeadcount = 0while True:count += 1print("正在进行第{}次访问t".format(count), end="t")IPs = parseIPList()# print(random.choice(IPs))# IPs = ["36.248.129.106","36.248.132.123"]newip = random.choice(IPs)print('ip地址是{}'.format(newip))s.proxies = {"http: {}:9999".format(newip)}s.get(host)# r = s.get(url.format(random.choice(codes)))r = s.get(url.format(codes[random.randint(0, 5)]))en = html.etree.HTML(r.text)  # 将网页源代码解析成xpath对象result = en.xpath('//*[@id="articleContentId"]/text()')print(result)Views = en.xpath('//*[@id="mainBox"]/main/div[1]/div/div/div[2]/div[1]/div/span[2]/text()')print('访问量是{}'.format(Views))time.sleep(random.randint(5,10))def main():PV(codes[0])# parseIPList()if __name__ == "__main__":main()

很简单,有木有 源码获取加群:1136192749

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.luyixian.cn/news_show_743563.aspx

如若内容造成侵权/违法违规/事实不符,请联系dt猫网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

php 禁止抓取,服务器反爬虫攻略:Apache/Nginx/PHP禁止某些User Agent抓取网站

一、Apache①、通过修改 .htaccess 文件修改网站目录下的.htaccess&#xff0c;添加如下代码即可(2 种代码任选)&#xff1a;可用代码 (1)&#xff1a;RewriteEngineOnRewriteCond %{HTTP_USER_AGENT} (^$|FeedDemon|Indy Library|Alexa Toolbar|AskTbFXTV|AhrefsBot|CrawlDadd…

java天气获取网站_java扒取天气网站的数据

1:由于天气apk接口不稳定所以经常获取不到信息。于是就动手写一个扒取天气网站上的数据然后做成json&#xff0c;apk直接调用服务器上扒取的数据增加稳定性。2&#xff1a;项目主要是用servlet然后正则表达式来提取网站信息。3:我觉得比较难得地方就是如何写正确的正则来提取出…

使用Varnish为web网站加速

使用Varnish为网站加速varnish概述 Varnish是一款高性能的开源HTTP加速器&#xff0c;挪威最大的在线报纸Verdens Gang (http://www.vg.no) 使用3台Varnish代替了原来的12台squid&#xff0c;性能居然比以前更好。Varnish 的作者Poul-Henning Kamp是FreeBSD的内核开发者之一&am…

iis网站域名绑定

这里解释两种绑定 一、全局ip未分配 二、绑定指定域名 1、添加主机名 注释&#xff1a;没有绑定主机名的进站默认就会被访问。绑定主机名的进站访问特定主机名的网站。转载于:https://www.cnblogs.com/zz-930474270/p/4569358.html

谈谈网站防盗链

引子&#xff1a;明明引用了一个正确的图片地址&#xff0c;但显示出来的却是一个红叉或写有“此图片仅限于***网站用户交流沟通使用”之类的“假图片”&#xff08;下图便是网易博客的防盗链效果&#xff09;。用嗅探软件找到了多媒体资源的真实地址用下载软件仍然不能下载。下…

从服务器检索时出错dfdferh01_服务器空间的稳定性对seo优化非常重要—竹晨网络...

网站降权是指搜索引擎对网站评定的级别下降&#xff0c;是搜索引擎对网站进行的一种处罚方式。通常多为网站自身作弊导致的&#xff0c;改正错误一段时间后会自行恢复。特征一&#xff1a;关键词排名大幅度下降特征二&#xff1a;网站收录量减少特征三&#xff1a;搜索引擎快照…

对公司网站DNS解析异常的排查与处理

这周可谓是屋漏连夜雨&#xff0c;先是nfs挂载出现问题&#xff0c;紧接着住处的厕所堵了&#xff0c;然后又是今天的域名解析异常导致服务访问返回404。我们的域名是解析到两个IP&#xff0c;分别是电信跟网通。异常情景&#xff1a;用户打开页面登录后图片上传跟显示出现异常…

php多站点建站,wordpress多站点子目录多域名建站 管理开启方法

最近打算折腾一个主题演示站&#xff0c;给每个主题使用独立的子站点来搭建演示&#xff0c;如果是Apache环境&#xff0c;配置就比较容易&#xff0c;但是倡萌使用的是 Nginx&#xff0c;花了大量的时间测试了N多网络上的伪静态规则&#xff0c;最终找到了完美的解决方法。下面…

如何查看任何一下网站的全部二级域名?

快速教会你查看任何一个网站的全部二级域名。请看我的讲解吧&#xff01; 方法/步骤 1方法其实很简单。首先&#xff0c;我们随便找一个搜索引擎。我以百度搜索引擎为例。 2我以腾讯QQ这个网站为例。我们在搜索框内输入site:*qq.com这下我们就可以搜索到这个网站所有二级域名以…

linux系统 网站木马后门Webshell查杀工具源码

后门这东西好让人头疼&#xff0c;第一文件太多了&#xff0c;不容易找&#xff0c;第二&#xff0c;难找&#xff0c;需要特征匹配啊。搞了一个python版查杀php webshell后门工具&#xff0c;大家可以增加后门的特征码&#xff0c;然后甩到后台给他查杀就可以了。适合Linux系统…

SEO算法深度分析之倒排索引,来解释SEO排名的问题

今天给大家分享一下倒排索引的一些事情&#xff0c;为什么要说倒排索引呢?因为当用户搜索一个词的时候&#xff0c;返回的搜索结果页面就是经过倒排索引和一系列算法过滤后的结果排序&#xff0c;seo苦苦追求的不就是排名的多少吗?说的通俗一点&#xff0c;其实搜索引擎的索引…

网站主机Introduction

“Introduction” 真是一个让人头晕的一个词汇&#xff0c;文章来自3wsc的记录。 首 页 目录主要内容网站主机简介万维网如何工作、发布站点&#xff1b;因特网服务提供商(ISP)提供什么服务主机提供商将站点放置 自己的服务器 与放置于 ISP 的差异域名注册如何注册域名并充分利…

【网络推广方案】比相微博、SEOSEM依然是最有效手段

【网络推广方案】比相微博、SEOSEM依然是最有效手段近年来&#xff0c;微博作为一个重要的社交网络平台&#xff0c;一度成为最具潜力和最重要的流量来源。无论谁拥有大量的微博粉丝&#xff0c;都会引起很多关注。一些产品在微博上高度传播。人们传递这些商业信息仅仅是因为他…

JavaScript实现在线进制转换工具网站 -toolfk程序员工具网

2019独角兽企业重金招聘Python工程师标准>>> 本文要推荐的[ToolFk]是一款程序员经常使用的线上免费测试工具箱&#xff0c;ToolFk 特色是专注于程序员日常的开发工具&#xff0c;不用安装任何软件&#xff0c;只要把内容贴上按一个执行按钮,就能获取到想要的内容结果…

网站爬取-案例四:知乎抓取(COOKIE登录抓取个人中心)(第一卷)

有很多网站是需要先登录&#xff0c;才可以浏览的&#xff0c;所以我们这个案例主要讲解如何以登陆的方式抓取这类的页面 第一&#xff1a;http本身是一种无状态的协议 这样两个请求没有任何关系&#xff0c;像淘宝这样的网站需要记录用户的每次请求&#xff0c;来看看有状态的…

wordpress域名解析到了网站,但是点击其他页面会出现ip而不是域名

1.前提域名可以访问你的网站证明解析没问题 2.那就是wp后台的设置问题&#xff0c;将url和站点url改为你的域名http://www.eovision.cc清理缓存即可 亲测可用&#xff0c;如果改了出现页面前台和后台无法访问了&#xff0c; 在你使用的主题下找到functons.php任意地方加上 upda…

如何找到网站服务器的源代码_如何在网站建设中确保服务器安全?

对Seo的优化经常导致网站的攻击损失。实际上&#xff0c;这些事件对网站的优化是非常不利的&#xff0c;因为它会导致排名下降&#xff0c;网站无法打开等等。后来该网站甚至被拉进了黑名单。因此&#xff0c;怎样提前避免这些情况呢&#xff1f;第一&#xff0c;网站安全主要是…

window.open怎么设置title_网站” SEO “怎么设置

对于一个网站的SEO来说&#xff0c;首先必须做的是网站的标题&#xff08;title&#xff09;&#xff0c;是网站的记述和网站的关键词。网站的关键词选择的好坏决定了你的网站SEO的成功与否。那么&#xff0c;如何制作网站的关键词呢&#xff1f;做的时候有什么需要注意的吗&am…

怎么在自己的网站上显示其它网站_怎么推广自己的网站

日引粉200秘籍一&#xff1a;如何做网络推广百度推广(点击上方视频观看)二&#xff1a;正文每个站长最关注的是什么&#xff0c;网站的推广&#xff0c;推广网站方法很多&#xff0c;但真正可以达到自己要求的方法真的不多&#xff0c;所以今天小编带大家分析一下怎么推广网站1…

asp虚拟主机源码在线打包_网站技术:织梦源码的二次安装详细图文教程

本文特意先给刚刚做网站的新手朋友&#xff0c;图文并茂的详细介绍织梦源码二次安装的流程&#xff0c;并将容易出错的地方截图出来。织梦1、备份目标网站。2、压缩全部文件然后下载。3、将.zip文件上传到新的空间&#xff0c;添加站点解压。你会发现&#xff0c;输入新的空间域…