如何用python创建一个下载网站-用Python下载一个网页保存为本地的HTML文件实例...

news/2024/5/14 0:03:18/文章来源:https://blog.csdn.net/weixin_37988176/article/details/109429392

我们可以用Python来将一个网页保存为本地的HTML文件,这需要用到urllib库。

比如我们要下载山东大学新闻网的一个页面,该网页如下:

20180521142224.jpg

实现代码如下:

import urllib.request

def getHtml(url):

html = urllib.request.urlopen(url).read()

return html

def saveHtml(file_name, file_content):

# 注意windows文件命名的禁用符,比如 /

with open(file_name.replace('/', '_') + ".html", "wb") as f:

# 写文件用bytes而不是str,所以要转码

f.write(file_content)

aurl = "http://www.view.sdu.edu.cn/info/1003/75240.htm"

html = getHtml(aurl)

saveHtml("sduview", html)

print("下载成功")

打开相应的目录可以看到这个网页已经被下载保存成功了

20180521142342.jpg

我们用浏览器打开这个网页文件如下

20180521142355.jpg

由于我们只是下载了网页的主要源码,其中的很多图片之类的文件都不在这里。因此这种方法只适用于提取文字内容。

以上这篇用Python下载一个网页保存为本地的HTML文件实例就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持我们。

本文标题: 用Python下载一个网页保存为本地的HTML文件实例

本文地址: http://www.cppcns.com/jiaoben/python/228618.html

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.luyixian.cn/news_show_703619.aspx

如若内容造成侵权/违法违规/事实不符,请联系dt猫网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

自学python推荐书籍同时找哪些来实践-Python学习路上有这些论坛、网站、书籍与你同行...

Python学习路上有这些论坛、网站、书籍与你同行 2019-05-03 18:24:41 613点赞 9508收藏 164评论 创作立场声明:希望我的一些经验可以给你少走一些弯路,但人总得走点弯路才可以成长。别怕,在学习python的路上有我陪着你。人生苦短,…

怎么在python下载网站内容-分析某网站,并利用python自动登陆该网站,下载网站内容...

本帖最后由 愤怒的小车 于 2019-5-8 09:41 编辑 一:本代码是我研究了好久才写出来,七功能主要有自动登陆、自动识别验证码、以及自动识别下载格式进行判断下载! 首先,搬上我们的主角网址,http://lavteam.org/&#xff…

python爬虫怎么爬同一个网站的多页数据-不踩坑的Python爬虫:如何在一个月内学会爬取大规模数据...

原标题:不踩坑的Python爬虫:如何在一个月内学会爬取大规模数据Python爬虫为什么受欢迎 如果你仔细观察,就不难发现,懂爬虫、学习爬虫的人越来越多,一方面,互联网可以获取的数据越来越多,另一方面…

白帽社区“乌云”已超9小时无法访问 公告称网站服务升级

7月20日,国内知名白帽子社区“乌云”(http://www.wooyun.org/)今日已无法正常访问,网站挂出公告称“进行升级”。 7月19日晚间23点,微博“互联网的那件事”曝出乌云官方网站显示无法访问。由此算来,截至发稿…

网站发布

转载于:https://www.cnblogs.com/defineconst/p/6380324.html

增长黑盒:零代码基础做智能电商网站,不要重复发明轮子

增长黑盒:零代码基础做智能电商网站 Step0,不破不立,走上增长黑客之路 很多卖货的人最大的问题就是整个团队没有一个懂代码的,更不懂电商网站制作。此时贸然出去外包一个电商网站,问题可能会越来越多。 《增长黑客》中…

【校园先行者】曲径通幽,我用阿里云部署的个人网站及挂机实践分享

未见意趣,必不乐学。目前大二的田程,出于对软件编程的爱好用ECS云服务器部署了一个个人网站。最初使用虚拟机服务的他,认为阿里云服务器的高性价比、丰富的云市场以及详备的售后完美满足了个人需求。 项目初衷 我叫田程,是四川理工…

借助URLOS快速安装python3网站环境

环境需求 1. 最低硬件配置:1核CPU,1G内存(11)提示:如果你的应用较多,而主机节点的硬件配置较低,建议在部署节点时开通虚拟虚拟内存;2. 生产环境建议使用2G或以上内存;3. …

免费猪八戒网站软件任务小助手--小八戒更新版本1.5

前段时间猪八戒网站改版了,我把小八戒也更新了一下,以适应他们新的版面。 界面还是那样,没有做其它的更改。其实本来打算做出来2.0之后再发布的,但是因为这段时间太忙,没有时间去开发2.0,就先把1.5放出来了…

Docker部署网站之后映射域名

Docker中部署tomcat相信大家也都知道,不知道的可以google 或者bing 一下。这里主要是为了记录在我们启动容器之后,tomcat需要直接定位到网站信息,而不是打开域名之后,还得加个blog后缀才能访问到我们的网站首页。 Docker exec -it…

如何用python创建一个下载网站-用Python下载一个网页保存为本地的HTML文件实例...

我们可以用Python来将一个网页保存为本地的HTML文件,这需要用到urllib库。 比如我们要下载山东大学新闻网的一个页面,该网页如下:实现代码如下: import urllib.request def getHtml(url): html urllib.request.urlopen(url).read…

如何用python创建一个下载网站-用Python下载一个网页保存为本地的HTML文件实例...

我们可以用Python来将一个网页保存为本地的HTML文件,这需要用到urllib库。 比如我们要下载山东大学新闻网的一个页面,该网页如下:实现代码如下: import urllib.request def getHtml(url): html urllib.request.urlopen(url).read…

CentOS LAMP一键安装网站环境及添加域名

一般的VPS用户普遍使用一键安装包和WEB管理面板居多,在一键安装包中,使用LAMP和LNMP的普遍居多。 第一个版本的LAMP环境包安装过程以及建站过程分享出来。 第一、LAMP一键包环境的安装 目前这个环境包是 wget http://soft.laozuo.org/lamp/lamp_centos1.…

网站入口页双栏对称布局实现思路

先来一张预览图。 接下来说一说这种页面布局的实现思路,因为自己是从零开始的,所以着实花了好几天功夫才实现了这么一个看起来很简单的布局,所有东西都要自己一点点摸索,不过这种经历对于自己的成长也是很有帮助的。好了&#xff…

使用php与mysql构建我们的网站

技术这个玩意就是要不断的去使用,才能够熟能生巧。今天我记录的使用php与mysql构建我们的网站,其实是我两年前的时候写的项目。 现在看看自己以前写的个人项目,也会感叹时间究竟带走了什么?好记性不如烂笔头,常写常练&…

自学python推荐书籍同时找哪些来实践-Python学习路上有这些论坛、网站、书籍与你同行...

Python学习路上有这些论坛、网站、书籍与你同行 2019-05-03 18:24:41 613点赞 9508收藏 164评论 创作立场声明:希望我的一些经验可以给你少走一些弯路,但人总得走点弯路才可以成长。别怕,在学习python的路上有我陪着你。人生苦短,…

学习编程可以参考哪些网站?

1、Free Online Course Materialshttps://ocw.mit.edu/index.htm免费的麻省理工学院课程,有各种视频讲座、笔记和资源。2、codecademyhttps://www.codecademy.com/catalog/subject/web-development非常有名的学习代码的网站,对于计算机科学家、web开发人…

怎么在python下载网站内容-分析某网站,并利用python自动登陆该网站,下载网站内容...

本帖最后由 愤怒的小车 于 2019-5-8 09:41 编辑 一:本代码是我研究了好久才写出来,七功能主要有自动登陆、自动识别验证码、以及自动识别下载格式进行判断下载! 首先,搬上我们的主角网址,http://lavteam.org/&#xff…

大型网站应用中MySQL的架构演变史

没有什么东西是一成不变的,包含我们的理想和生活!MySQL作为一个免费的开源的关系型数据库,深受大家喜爱,从最初的无人问津到当下的去IOE,都体现出了MySQL举足轻重的作用。今天我们就从淘宝的发展来阐述MySQL在大型网站…

python爬虫怎么爬同一个网站的多页数据-不踩坑的Python爬虫:如何在一个月内学会爬取大规模数据...

原标题:不踩坑的Python爬虫:如何在一个月内学会爬取大规模数据Python爬虫为什么受欢迎 如果你仔细观察,就不难发现,懂爬虫、学习爬虫的人越来越多,一方面,互联网可以获取的数据越来越多,另一方面…