python爬取动漫网站的动漫

news/2024/5/13 15:03:03/文章来源:https://blog.csdn.net/weixin_45438214/article/details/104666845

最近学了一下爬虫,就写段代码来试一下成果如何.(目的是爬取某动漫网站上的一部动漫darling in the franxx)
版本是python3.7

    import requests  import refrom selenium import webdriverimport osheaders={'user-agent' : 'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36   (KHTML, like Gecko) Chrome/69.0.3497.100 Safari/537.36'}url="http://www.imomoe.in/view/7288.html"response = requests.get(url,params=headers)html=response.textstep1_name=re.findall("/player/7288-0-.*?.html",html)if not os.path.exists("DarlingInTheFranxx"):os.mkdir("DarlingInTheFranxx")for i in range(24):file_name = "DITF" + str(i + 1)if not os.path.exists("DarlingInTheFranxx" + '/' + file_name + '.mp4'):url='http://imomoe.in'+step1_name[i]response=requests.get(url,headers=headers)#这里实在是找不到什么好的方法来获取iframe的源代码browser=webdriver.Chrome()browser.get(url)   browser.switch_to.frame("play2")  temp=browser.page_sourcebrowser.quit()    video_url=re.findall("https://.*?.mp4",temp)with open("DarlingInTheFranxx"+'/'+file_name+'.mp4','wb') as fuck:response = requests.get(video_url[0], stream=True)print("正在下载第" + str(i + 1) + "集")for chunk in response.iter_content(chunk_size=1024):if chunk:fuck.write(chunk)print("已下载第"+str(i+1)+"集")else:print("第"+str(i+1)+'集已经存在')

运行测试结果如下:
在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.luyixian.cn/news_show_901811.aspx

如若内容造成侵权/违法违规/事实不符,请联系dt猫网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

《从零开始学Swift》学习笔记(Day 2)——使用Web网站编写Swift代码

Swift 2.0学习笔记——使用Web网站编写Swift代码 原创文章,欢迎转载。转载请注明:关东升的博客 Swift程序不能在Windows其他平台编译和运行,有人提供了一个网站swiftstub.com,左栏是代码编辑窗口,右栏是运行结果窗口。…

百家号怎么加网站链接进行引流,方法让你轻松掌握

互联网推广模式方法一直在变,平台也在变,当然推广思维模式也要跟着变。现在大家对网站seo优化似乎失去了信心,原因是百度新算法大幅度提升 自家产品,不愿意给企业站或者个人网站倒流了。那么作为推广运营的我们,势必也…

水产百科网站(SSM,MySQL )

【项目包含内容】 【视频运行指导教程目录】 视频:https://www.bilibili.com/video/BV1Xa4y1v7dx/ 【项目运行工具】 Eclipse JDK1.8 TOMCAT8 MYSQL 链接:https://pan.baidu.com/s/1BJCnUCTlqzVA6zEJpNxgYw 提取码:f2ni 【部分项目…

学习网站推荐

正文: 菜鸟教程https://www.runoob.com/ 对于要学习某一门流行编程语言来说,我首推这个网站。这个网站相比于在我看过的来说呢,是看起来比较舒服的一个,里面涵盖大多数编程语言等,如Python、Java、C、C、JavaScript、…

电影影视网站对接微信公众号 日引流500+的实例教学

哈喽,大家好, 今天写一个关于电影网站对接公众号,日引流500的教程。首先自己百度找一个电影网站,获取网站的TOKEN和URL对接地址。 token: qweqwe URL: http://e.66hai.com/api.php/wechat注意:还需要一…

Vue项目实战-小商城的基本功能的实现-移动网站开发实例

1.项目的效果图 以下效果图是在谷歌浏览器的手机适配模式看到的。 主页展示 新闻资讯展示 详细新闻资讯展示 图片列表展示 缩略图展示 商城展示 2.工具技术准备 工具:vscode。 技术:Vue.js,node.js,MUI,Mint-UI. 3.项目目录的详情 4.项目配置文件 …

企业实战 -大型网站架构概述

文章目录 企业实战 -大型网站架构概述网站架构的发展历程初始阶段的网站应用和数据分离使用缓存改善网站性能缓存技术: 使用应用服务器集群改善并发处理能力数据库读写分离使用反向代理和CDN加速网站响应使用分布式文件系统和分布式数据库系统使用NoSQL和搜索引擎业务拆分分布式…

Android 设计相关网站推荐

这篇文章给大家介绍几个设计相关的网站&#xff0c;因为博主除了软件开发以外还比较喜欢设计&#xff0c;据我观察了解程序员普遍审美都是比较差的&#xff0c;所以这次给大家推荐几个我认为比较好的用来帮助开发和提升审美的网站。 <1> MaterialPalette&#xff1a;Mat…

PHP开发电脑网站支付宝支付详细流程(沙箱测试篇)

先附上我开始做沙箱测试的时候写的笔记 &#xff08;1&#xff09;准备工作 1、蚂蚁金服开放平台的商户账号&#xff08;个人账号不行&#xff09; 2、php5.5以上的开发环境 &#xff08;2&#xff09;具体流程 1、demo下载 进入蚂蚁金服开放平台的首页&#xff0c;选择文…

Thinkphp5开发电脑网站支付宝支付详细流程(线上测试篇)

在沙箱测试篇讲过的我在这里就不再做重复&#xff0c;详情请见上一篇PHP开发电脑网站支付宝支付详细流程&#xff08;沙箱测试篇&#xff09; 在沙箱测试的时候使用的是沙箱环境中的配置&#xff0c;现在进行线上测试&#xff0c;需要创建应用 1、创建应用 登录蚂蚁金服开放…

数据采集之爬取2019最好大学网站前四列排名保存为csv文件格式简单案例 BeautifulSoup

数据采集之爬取2019最好大学网站前四列排名 保存为csv文件格式 简单案例 BeautifulSoup 目录&#xff1a; 第一步 观察网页 第二步 使用requests、 BeautifulSoup解析数据 第三步 代码呈现结果 开始&#xff1a; 第一步 观察网页 第二步 使用request、 BeautifulSoup解析…

钉钉扫码登录第三方web网站,及得到用户详情信息

1 注册应用 &#xff08;1&#xff09;授权页面logo地址&#xff1a; 扫码设备显示的图片 &#xff08;2&#xff09;回调域名&#xff1a;用户扫码成功确认后跳转的页面&#xff08;等待页面&#xff09;&#xff0c;携带code(临时授权码&#xff09;和status&#xff08;防止…

政府网站普查,国办标准VS省市标准,谁更严格?谁的合格率更高?

政府网站普查政策实施多年&#xff0c;标准变化多次&#xff0c;目前实施的标准是2019年4月份发布的国务院办公厅制定的《政府网站与政务新媒体检查指标》和《政府网站与政务新媒体监管工作年度考核指标》。 随着普查的常态化&#xff0c;国务院每年根据国办标准抽查一次&…

Day10 总结:产品开发必备的63个网站和工具

点此进入目录&#xff1a;[干货] 十天 教你从创意到上线APP 大家都知道&#xff0c;“爱阅”本身就为我们收集了大量常用的热门网站&#xff08;这里面当然包括了技术类和设计类的网站&#xff09;&#xff0c;不过本篇还是列出在开发过程中用到的网站供大家参考。 1、产品原…

网页嵌入其他网站或新打开其他网页并发送消息

一、背景 公司A想开发一个包含功能1、2、3…的网站&#xff0c;经过调研发现&#xff0c;公司B开发的网站包含了其所需的一半功能&#xff0c;公司A想直接把公司B的网站嵌入到他们的网站中或通过一个按钮跳转到公司B的网站&#xff0c;并希望对公司B的网站做一些控制。 二、相…

20个快速学习CSS的网站

1. A List Apart CSS Topics 老牌CSS站点&#xff0c;从1999年开始一直致力于整理收集面向标准网页开发的优秀文章。 2. CSS Help Pile 收集整理了大量的CSS相关资源&#xff0c;而且归档非常清晰&#xff0c;查询非常方便。 3. CSS Basics 通过一系列教程讲述了CSS的基本概…

个人网站重构

1 占位图片生成 <img src"http://placehold.it/350x150"> 不用引入任何外部文件&#xff0c;会自动形成对应数字大小的图片。 2 关于伪元素和伪类 css3 为了区分两者&#xff0c;已经明确规定了伪类用一个冒号来表示&#xff0c;而伪元素则用两个冒号来表示…

个人网站漏洞修复

环境&#xff1a;Centos 7 && Apache 目录遍历 1.打开Apache 配置文件夹 apache配置文件:/etc/httpd/conf/httpd.conf Apache模块路径&#xff1a;/usr/sbin/apachectl web目录:/var/www/html 2.打开httpd.conf,找到Options Indexes FollowSymLinks 将Options Ind…

Google Code项目代码托管网站上Git版本控制系统使用简明教程

转自http://blog.csdn.net/snowdream86/article/details/6706265 作为一个著名的在线项目代码托管网站&#xff0c;Google Code目前主要支持三种版本控制系统&#xff0c;分别为Git, Mercurial和 Subversion。Subversion即SVN相信大家都已经熟知了&#xff0c;这里我们要介绍的…

利用Vultr主机安转宝塔Web面板搭建wordpress博客建站教程

本篇文章是针对新手个人站长&#xff0c;来教大家利用Vultr主机如何安装宝塔Web面板搭建wordpress博客的方法。 1、一台Vultr VPS主机。 2、注册Vultr账号创建VPS实例 创建VPS实例 点击Deploy Now创建服务器实例&#xff0c;Status显示Running表示已经成功安装&#xff0c;…