批量下载文件(以xxx网站为例)

news/2024/4/28 13:16:53/文章来源:https://blog.csdn.net/weixin_34253539/article/details/89444507
爸爸经常拿个收音机听评书,最近想帮爸爸在网上下个全集。打开百度搜了下评书,发现有个叫评书网的网站。搜了下单田芳说的《白眉大侠》。但是只能一回一次的单个点击下载,那不得点死。所以就想到了批量搞它。本文用的方法很简单(大神勿喷)。
发现规律,http://www.5ips.net/down_120_001.htm这个是第一回的下载地址,用浏览器打开显示网页源码发现下载地址就在里边那就好办了。url[2]= "/pingshu/单田芳_白眉大侠/单田芳_白眉大侠_001.mp3?key=8de4ff27ca1e24e711d0772ebe13b454_511093084"这个是他后台临时生成的下载地址,过几分钟就会失效。规律得到了,url地址是_001表示第一回,文件地址为_001.mp3, 如果是_002就表示第二回,文件地址为_002.mp3。以此类推
好吧直接搞起。用urllib2直接拿到网页
psurl0 = 'http://www.5ips.net/down_120_'
psurl0_0 = '.htm'
psurl1 = 'http://p33d.5ips.net/pingshu/单田芳_白眉大侠/单田芳_白眉大侠_'
def main(index):ji = "";if index < 10:ji = "00%d" %index;elif index < 100:ji = "0%d" %index;else:ji = "%d" %indexurl_p = psurl0 + ji + psurl0_0reque = urllib2.Request(url_p, headers = headers)content = urllib2.urlopen(reque).read()reg = '.mp3\?key=.*"'reslut = re.search(reg, content).group()reslut = reslut.replace('"', '')newpath = psurl1 + ji + reslut#down(newpath, ji + '.mp3')

psurl0,psurl0_0,psurl1都是固定的,变得只是下载的章数和动态生成的地址码。由于下载地址直接显示到网页源码中了,所以不需要复杂的解析,直接用正则找到下载地址reslut

拿到下载地址了直接用urllib2.urlopen下载失败了,但是把地址帖到浏览器可以播放,应该被网站禁止了。好吧,尝试其他办法。打开命令行用weget下载成功。问题解决了。weget是linux系统自带的下载工具,Mac和windows都需要自己安装。
def down(url, file_name):option = 'wget -O ./白眉大侠/%s %s' %(file_name, url)pop = subprocess.Popen(target, stdin = subprocess.PIPE, stdout = subprocess.PIPE)pop.communicate(mess)

一个循环把320回的MP3全部搞下

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.luyixian.cn/news_show_754494.aspx

如若内容造成侵权/违法违规/事实不符,请联系dt猫网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Window 下部署 Python 网站

一、Flask篇 在 Windows 平台部署基于 Python 的网站是一件非常折腾的事情&#xff0c;Linux/Unix 平台下有很多选择&#xff0c;本文记录了 Flask 部署到 IIS 的主要步骤&#xff0c;希望对你有所帮助。 1.1、涉及工具和平台 Windows 7 x64Python 3.4Flask 1.2、完成 Hello…

IIs 部署 Python 网站运行环境

1、启用或者关闭windows功能&#xff0c;选择安装CGI。 2、安装后重新打开IIS看到CGI 3、配置ISAPI和CGI限制 4、右上角添加&#xff0c;路径是python安装路径&#xff0c;注意要加上两个 %s %s 点确定 5、处理映射关系 6、右上角 添加模块&#xff0c;模块选择&#xff1a;Cg…

我的个人网站,多多支持啊,欢迎交换链接

为什么80%的码农都做不了架构师&#xff1f;>>> 爱闹 anool.net | 张利龙的个人博客&#xff0c;分享自己的生活见闻、软件开发实用技术 http://anool.net/ 转载于:https://my.oschina.net/nbuu/blog/162624

在线编程学习网站大搜罗

2019独角兽企业重金招聘Python工程师标准>>> 1. Fenby Fenby是一个免费的在线编程互动编程学习网站&#xff0c;提供在线课程、互动问答、编程大赛和练习等。Fenby的运营理念很类似于Codecademy&#xff0c;强调趣味&#xff0c;而据Fenby官方介绍&#xff0c;他们也…

Jenkins用HTTP Request Plugin插件进行网站的监控/加探针(运维监控)

使用的插件&#xff1a; 【HTTP Request Plugin】 思路&#xff1a; 说明&#xff1a;只能是网站是否正常打开&#xff0c;而不能是这个网站业务是否正常&#xff0c;如果是后者&#xff0c;则需要写特定的接口进行请求处理。 1、通过插件&#xff0c;发送GET请求指定的URL。 2…

推荐一些非常好玩和可爱的网站

2019独角兽企业重金招聘Python工程师标准>>> 下面是找到的一些非常好玩和可爱的网站&#xff0c;它们都拥有不错的技术和创意&#xff0c;尤其适合女孩子玩哈&#xff5e;&#xff5e;1 http://www.souface.com/可以在线测试长得像哪个明星&#xff5e;&#xff5e;…

再谈ITFriend网站的定位

2019独角兽企业重金招聘Python工程师标准>>> 在网站开发阶段、内部测试阶段、公开测试阶段&#xff0c;让诸多好友和网友&#xff0c;参与了我们的网站ITFriend的体验和测试。其中&#xff0c;大家非常关心&#xff0c;我们的网站是干什么的。在我们不做任何解释的情…

织梦task_do.php,织梦CMS网站添加文章时同时更新所有单页面的修改方法

这个方式是以前做sitemap.html单页的时候需要发布文章的同时更新地图单页&#xff0c;织梦dedecms自身是没有这个功能的&#xff0c;所以找人帮忙写了段代码实现这个功能。建议单页有调用系统最新文章的朋友可以使用上&#xff0c;在5.7下测试了一下&#xff0c;是可以使用的。…

揭秘 | 百万并发直播网站龙珠的性能秘籍

客户背景&#xff1a;龙珠直播是由苏州游视网络科技有限公司打造的游戏直播平台&#xff0c;于2015年2月1日正式上线&#xff0c;主要为游戏玩家提供网游视频直播和音乐直播等服务。目前龙珠直播与韩国职业电子竞技协会&#xff08;KeSPA&#xff09;、游戏风云、NICETV等组织达…

网站建设之网页框架布局

一个网页包括网站标题、导航、banner、主题内容和页脚&#xff0c;一个好的网页框架布局起着不可估量的作用&#xff1b;网站的网页好比一个公司的门面&#xff0c;代表着公司的整体形象&#xff1b;网页的框架布局就好比商场商品的布置&#xff0c;商场商品的布置讲究一些规则…

网站安全:你面临2个至关重要的挑战!

2019独角兽企业重金招聘Python工程师标准>>> 近期的 NAGW&#xff08;National Association of Government Web Professionals&#xff09;会议让笔者收获颇深。该会议旨在通过聚集来自联邦/州/地方市政府网络专家来探讨可能存在的领域内机构、教育以及合作。而通过…

Node.js 使用http客户端得到网站的图片下载到本地

以下代码有些冗余&#xff0c;大家捡核心看就好。 // 内置http模块&#xff0c;提供了http服务器和客户端功能 var httprequire("http");// cheerio模块&#xff0c;提供了类似jQuery的功能 var cheerio require("cheerio");// 内置文件处理模块 var fsre…

Nodejs建站笔记-注册登录流程的简单实现

1. 使用Backbone实现前端hash路由 登录注册页面如下&#xff1a; 初步设想将注册和登录作为两个不同的url实现&#xff0c;但登录和注册功能的差距只有form表单部分&#xff0c;用两个url实现显然开销过大&#xff0c;所以最终方案为使用hash作为前端路由&#xff0c;根据url的…

redis应用场景(1)一个文字投票网站

构建一个文章投票网站&#xff0c;一般具备下面几个功能 发布文章 文章投票评分&#xff08;按投票多少进行评分&#xff09; 文章排序&#xff08;按发布时间&#xff0c;按评分高低&#xff09; 文章分组&#xff08;如专题&#xff09; ... 1.关系型数据库设计 其中用户&…

iis网站属性在哪_windows服务器,网站被挂黑页,简单快速应急处理

作为一个网站管理员&#xff0c;你采用开源CMS做网站&#xff0c;比如dedecms&#xff0c;但是有一天&#xff0c;你忽然发现不知何时&#xff0c;网站的友情链接模块被挂大量垃圾链接&#xff0c;网站出现了很多不该有的目录&#xff0c;里面全是博彩相关的网页。而且&#xf…

网站建设不再难 - 2018年最好用的网站设计工具集锦

2019独角兽企业重金招聘Python工程师标准>>> 由于代码技术的限制&#xff0c;普通大众往往在网站建设方面总是一站难求。但是&#xff0c;想要拥有一个自己的网站&#xff0c;真的必须由程序员通过代码实现&#xff1f;哼&#xff0c;在当今满满科技感的新时代&…

安装iis打开网站提示Microsoft JET Database Engine 错误 '80004005'解决办法

今天在魅力网络公司办公室的一个电脑安装iis服务器软件&#xff0c;在win7系统上按的&#xff0c;放上了asp程序&#xff0c;但打开会有错误提示&#xff0c;打开htm静态的文件没问题&#xff0c;原因找了找发现是权限的问题。iis要求电脑磁盘格式是fat32的&#xff0c;而魅力网…

创建一个动态的雾_python django创建一个属于自己的动态网站

您如何开始使用Python创建网站&#xff1f;好吧&#xff0c;你可以自己完成所有工作&#xff0c;并编写一个在Web服务器上运行的程序&#xff0c;接受页面请求并以HTML和其他资源的形式提供响应。然而&#xff0c;这是很多工作&#xff0c;那么为什么在有大量现有工具为您完成工…

help.hybris.com和help.sap.com网站的搜索实现

help.hybris.com 我使用help.hybris.com时&#xff0c;发现每次在搜索栏输入文字时&#xff0c;没有发出任何HTTP请求&#xff0c;那么这个自动完成的下拉框里的记录从哪里来的&#xff1f;我看了下实现&#xff0c;发现所有自动完成下拉框里的记录都是硬编码在searchsuggestio…

自建网站对接微信公众号

title: 自建网站对接微信公众号date: 2018-04-12 15:25tags: 微信公众号,PHPcodeignitercategories: 技术 平常我们有些写各种网站, 个人博客系统, 物流管理系统, 通信录管理系统, 校园二手网站. 我们都知道, 只需要租用一个服务器, 再配置一个备案好的域名, 就可以在浏览器上进…