使用python下载网站漫画

news/2024/5/20 1:32:59/文章来源:https://blog.csdn.net/weixin_39020940/article/details/81153661

最近想回顾一下七龙珠,结果发现腾讯已经收费,而且是按节收费,无奈看看其他网站,找到了一个网站,可以在线看,但是无法下载,最后决定使用python下载下来

首先要分析网站源码,查看源代码

       1~42部的URL是从

http://comic.kukudm.com/comiclist/141/1343/到

http://comic.kukudm.com/comiclist/141/1384/

       而每一页的URL是从1.htm到xx.htm

       得到每部的网址后,下一步就是看图片的URL

rsp = req.get(url, timeout = 2)   rsp.encoding = 'utf-8'print rsp.text

打印出来的漫画图片源码如下:

       document.write("<img id=comicpic name=comicpic src='"+server+"kuku3comic3/qlz/vol01/001DM01W3.jpg'>");

可以看出网站源码并不直接图片的源地址,而是需要通过浏览器编译运行才能图片的真实地址,通过F12调试浏览器,得出源地址如下:

多找几个,可以得出漫画的真实网址是http://n5.1whour.com/加对应网页源码的后缀拼接出来的,代码可以这么写

image_pre_url = "http://n5.1whour.com/"# url http://comic2.kukudm.com/comiclist/141/1343/1.htm# filename 001.jpg@retry(stop_max_attempt_number=3, stop_max_delay=10000)def downloadImg(url, filename):print urlrsp = req.get(url, timeout = 2)   rsp.encoding = 'utf-8'image_posturl = re.findall("kuku3comic3.*.jpg", rsp.text)image_url = image_pre_url + str(image_posturl[0])

这里面的retry是引用了python的retrying模块,可以通过注释的模式设置函数内部重试,还可以设置最大时长

找到了章节网址和每个图片的网址,剩下就是下载了,代码如下

    r = req.get(image_url, stream=True, timeout = 2)with open(filename, 'wb') as f:for chunk in r.iter_content(chunk_size=1024):if chunk:f.write(chunk)f.flush()f.close()print 'download finished',image_url

至此,就可以完成漫画下载

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.luyixian.cn/news_show_763691.aspx

如若内容造成侵权/违法违规/事实不符,请联系dt猫网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

如何使用代理服务器访问授权的网站_如何减少HTTP请求并加快网站访问速度?...

每当有人访问您网站上的页面时&#xff0c;浏览器都必须请求大量文件。这些HTTP请求直接影响网页的加载速度。通常&#xff0c;更少的HTTP请求意味着网站加载速度更快。 现在&#xff0c;网站的加载速度是搜索引擎排名的重要因素。平均而言&#xff0c;媒体页面加载速度为谷歌的…

seo查询工具源码_SEO工具哪个好?

SEO工具涵盖了很多种&#xff0c;其中主要包括站长工具、外链工具、伪原创采集工具等&#xff0c;不同类型的工具针对性和功能性都非常强&#xff0c;而且对于网站优化能够起到有效的促进作用&#xff0c;同时也能够使站长节省更多的时间和精力&#xff0c;做好网站细节优化。图…

Python+Bottle+Sina SAE快速构建网站

Bottle是新生一代Python框架的代表&#xff0c;利用Bottle构建网站将十分简单。 Sina SAE是国内较出名的云平台之一&#xff0c;十分适用于个人网站的开发或创业公司网站开发。 下面将介绍如果通过PythonBottleSina SAE快速搭建一个网站。 1.注册Sina SAE账号后&#xff0c;创建…

php手机论坛,网站开发-php开发手机论坛(10)-帖子列表显示

帖子列表的显示是一个基本的功能,用于首页分类的显示,以及用户收藏以及发布的帖子的查看.整合在一个文件里面.接受参数:col:收藏的帖子c:分类显示帖子post:发表的帖子rep:回复的评论templates/listview.php返回<?php echo $from ?>发帖//Chromephp::log($article);if (…

移动APP vs. 移动网站,哪一个更好?

在虚拟世界&#xff0c;关于移动应用和移动网站的有效性差异的争论是一个非常有趣的话题。无论是移动应用程序还是移动网站都有自己的优点和缺点。有一些人认为&#xff0c;一个用户友好的和有效的移动app可以解决所有的问题&#xff0c;并帮助你更好地为你的客户服务。另一方面…

Java系的大网站架构-LinkedIn和淘宝

国内私募机构九鼎控股打造APP&#xff0c;来就送 20元现金领取地址&#xff1a;http://jdb.jiudingcapital.com/phone.html 内部邀请码&#xff1a;C8E245J &#xff08;不写邀请码&#xff0c;没有现金送&#xff09;国内私募机构九鼎控股打造&#xff0c;九鼎投资是在全国股份…

【JAVA WEB教程】jsp环境搭建+部署网站(eclipse+tomcat)【详细+图文】

下载tomcat7.X下载地址为&#xff1a;http://tomcat.apache.org/download-70.cgi下载完成之后就开始安装NextI Agree选中所有的复选框输入你的用户名和密码注意&#xff1a;一定要选择JDK下面的JRE选择安装目录点击finish在eclipse中删掉原来默认的J2EE web服务器创建一个新的服…

在网站设计中非常有用的10款在线生成工具

设计和开发者社区发展飞快&#xff0c;以致于我们的步伐很难跟上发生在我们身边的这一切。这就是为什么我喜欢聚集最新发布的优秀资源和工具&#xff0c;以使我们的工作和生活更轻松。这篇文章集合了 Web 开发中会用到的优秀工具&#xff0c;我敢肯定这些你会在这里发现有用的工…

博客建站的几点思考

博客系统&#xff0c;对于一般程序员来说&#xff0c;实现权限管理、信息备份、文件上传等等都不是什么大问题。技术问题也就是几个&#xff0c;怎么做出一个PV值高的博客系统&#xff0c;很值得我们思考。 它们 网上有众多的博客系统、信息共享网站&#xff0c;它们都是很好的…

python如何跳转到网站_python中模拟登陆成功如何跳转到主页

满意答案zhuhongdi推荐于 2017.12.16采纳率&#xff1a;48% 等级&#xff1a;12已帮助&#xff1a;8240人参考这个可以了&#xff0c;http://www.bubuko.com/infodetail-699326.html#以post的方法访问登陆页面&#xff0c;访问之后cookieJar会自定保存cookieopener.open(log…

网站不收录可能是受同服务器上的挂马站牵连

这段时间ytkah接手一个网站&#xff0c;服务器放在台湾&#xff0c;访问相当不稳定&#xff0c;上面有两三百个站点。第一反应就是把网站牵回自己的服务器&#xff0c;并用帝国cms重新搭建起来&#xff0c;模板和数据不变&#xff0c;鼓捣了一阵&#xff0c;网站重新上线了。但…

石家庄铁道大学网站首页UI分析

今天的软件工程王老师讲了UI的设计&#xff0c;以前狭隘的认为只有移动设备上的界面叫UI&#xff0c;百度一下才发现UI其实有这么多含义&#xff1a;UI即User Interface的简称。泛指用户的操作界面&#xff0c;UI设计主要指界面的样式&#xff0c;美观程度。而使用上&#xff0…

Apache Shiro 使用手册(一)Shiro架构介绍 - kdboy - ITeye技术网站

转载 原文地址 http://kdboy.iteye.com/blog/1154644 一、什么是Shiro Apache Shiro是一个强大易用的Java安全框架&#xff0c;提供了认证、授权、加密和会话管理等功能&#xff1a; 认证 - 用户身份识别&#xff0c;常被称为用户“登录”&#xff1b;授权 - 访问控制&#xf…

利用TP-Link+花生壳建立属于自己的网站

最近很想做一个自己的网站&#xff0c;苦于没有经费&#xff0c;也没有服务器&#xff0c;更加没有经验&#xff0c;所以只能寻找免费的解决方案。 身边有的工具只有一台TP-link&#xff0c;手提式电脑和能上网的环境&#xff0c;所以果断利用TP-link&#xff0c;没有TP-link的…

夺命雷公狗ThinkPHP项目之----企业网站23之网站前台二级分类的跳转(URL跳转到列表页或产品页)...

我们现在开始做实现我们的二级菜单如何跳转到指定的列表页或者产品也呢&#xff1f;&#xff1f; 我们分享下数据库情况&#xff1a; 我们的数据库里提前给我们预留了一个cate_type的字段&#xff0c;那么我们可以让这个字段进行判断&#xff0c;从而遍历出指定的数据&#xff…

网站优化—页面静态化技术

数据库检索的问题 主要是为了减少数据库的操作&#xff0c;让MySQL能够提供更强大的服务 使用缓存技术 磁盘缓存&#xff1a;就是将用户请求数据库的数据&#xff0c;保存到磁盘文件形成一个静态的HTML文本&#xff0c;下次用户的访问的时候&#xff0c;直接返回该HTML文本。 内…

Firefox 火狐浏览器访问所有HTTPS网站显示连接不安全

当 Firefox 连接到一个安全的网站时&#xff08;网址最开始为“https://”&#xff09;&#xff0c;它必须确认该网站出具的证书有效且使用足够高的加密强度。如果证书无法通过验证&#xff0c;或加密强度过低&#xff0c;Firefox 会中止连接到这个网站&#xff0c;并显示“连接…

网站功能测试小结

功能测试 1.1 链接测试 链接是Web应用系统的一个主要特征&#xff0c;它是在页面之间切换和指导用户去一些不知道地址的页面的主要手段。链接测试可分为三个方面。 1)测试所有链接是否按指示的那样确实链接到了该链接的页面; 2)测试所链接的页面是否存在; 3)保证Web应用系统上没…

网站头像html,分享一个非常强大的头像在线生成网站

现在的社交平台越来越多&#xff0c;微信、QQ、抖音、快手、知乎、今日头条等平台遍地开会&#xff0c;你有没有为一个社交头像思考很久&#xff1f;当然了一个好的头像更让人赏心悦目。今天就给你们分享一个非常厉害的头像在线生成网站&#xff0c;一键制作酷炫且颜值高的头像…

dede织梦网站不调用指定栏目或隐藏栏目下的文章

在织梦DEDECMS建站过程中&#xff0c;调用全站的最新文章时&#xff0c;程序会自动调用网站中所有已发布的文档&#xff0c;如果我们不想调用某个栏目下的文章时&#xff0c;应该如何操作呢&#xff1f;下面讲一下如何让DEDECMS不调用指定栏目下的文章的方法。 设置DEDE屏蔽某个…