用Teleport Ultra下载网站全部页面 爬虫

news/2024/5/9 15:06:28/文章来源:https://blog.csdn.net/weixin_30820151/article/details/95206556

测试case,就是把Commons-FileUpload 的API下载来

Snap20
上网查的时候我才发现这是一个由很多页面组成的网站,下载起来很麻烦。
Snap26
怎么办呢?呵呵,一定是有办法的。Teleport Ultra这个工具就能帮我们搞定!
这是一个汉化绿版的迅雷下载链接:thunder://QUFodHRwOi8vMS5jcWR4MS5jcnNreS5jb20vMjAwOTAzL1RlbGVwb3J0VWx0cmEtdjEuNTlILnppcFpa 大小只有759K。
下载完成后解压缩,直接运行ultra.exe,然后选择 文件-新建项目向导
Snap19
第一步这里选择第二项:复制一个网站,包含该网站的目录结构。
Snap27
第二步 启始地址填刚才网页的地址:http://commons.apache.org/fileupload/apidocs/index.html
并且指定Teleport的搜索深度为6曾链接。
Snap28
为什么填6呢?细心的朋友应该能发现,最深层Package(包)中的Class(类)的链接是http://commons.apache.org/fileupload/apidocs 后6层链接。
Snap29
第三步 这里选择网页中媒体,因为是API,我们就直接选择 仅文本。
Snap30
第四步 来确定一下,我们刚刚建的项目。这里有提示,点击开始按钮以运行该项目。
Snap31
然后,选择一个目录来保存我们刚刚建好的项目,以及网站页面的下载地址。
Snap32
点击开始来启动项目吧。
Snap33
这是项目进行中,我们能看到,网站结构也被下载到本地。
Snap34
底部有显示信息,我们能了解到项目的进行状况。
Snap35
Snap36 
下载好的就是这样的,一个Teleport Ultra的.tpu项目文件,还有就是网站的页面目录。
Snap37
Snap38
激动人心的时刻到了,去浏览器中访问吧。
Snap39
这样一来,不仅仅是Commons-FileUpload的API我们能下载到本地,几乎任何官方API我们都有了办法,JDK,MySQL等等。
现在我们下载的API是页面目录,我会继续努力,争取制作成CHM格式的API文档。

转载于:https://www.cnblogs.com/qiumingcheng/p/5045520.html

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.luyixian.cn/news_show_725156.aspx

如若内容造成侵权/违法违规/事实不符,请联系dt猫网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

网站收集

1.http://msdn.itellyou.cn/ MSDN很多工具可以下载 将地址拷贝到迅雷下载即可 2.https://visualstudiogallery.msdn.microsoft.com/a1166718-a2d9-4a48-a5fd-504ff4ad1b65 isual Studio示例代码浏览器 免费Visual Studio示例代码浏览器为开发人员提供了一个在Visual Studio 20…

大型网站的标准

大型网站的标准 问题:什么样的网站才能算的上大型网站? 答: 用户访问量(优酷,百度)流量大(优酷:流媒体服务器搭建,主要技术点在于带宽)海量数据的检索问题&am…

python爬取内容乱码_Python爬取网站返回的内容为乱码解决方法

1、爬取某网站内容时,返回的结果为乱码,如图:2、写在前面的解释Requests会基于HTTP头部响应的编码做出有根据的推测,当访问r.text时,Requests会使用其推测的文本编码。查看网页返回的字符集类型:r.apparent…

关于php留言本网站的搭建

1.检查php,http服务是否安装 [rootlocalhost ~]# rpm -qa | grep http httpd-tools-2.4.6-40.el7.centos.x86_64 httpd-2.4.6-40.el7.centos.x86_64[rootlocalhost ~]# [rootlocalhost ~]# rpm -qa | grep http-bash: [rootlocalhost: 未找到命令 2.检查到没有安…

axure web组件下载_04网站设计关于axure原型预览文件访问慢的原因

01背景最近发现原来的原型预览访问速度超级慢,这一切貌似是最近调整了下Axure原型中的几个元件,上传之后,原本访问超级快的文件,变的超级超级慢。02原因分析过程1、首先直接从服务器角度找原因。自认为服务器可能是宽带不够&#…

css3网站代码 html5_HTML5和css3(一)

一、什么是 HTML5HTML5 的概念与定义是一个新版本的 HTML 语言,定义了新的标签、特性和属性拥有一个强大的技术集,这些技术集是指:HTML5 、CSS3 、javascript, 这也是广义上的 HTML5定义:HTML5 定义了 HTML 标准的最新版本&#x…

mysql投票网站_PHP+Mysql实现网站顶和踩投票功能实例

PHPMysql实现网站顶和踩投票功能实例,通过记录用户IP,判断用户的投票行为是否有效,该实例也可以扩展到投票系统中。首先我们在页面上放置“顶”和“踩”的按钮,即#dig_up和#dig_down,按钮上分别记录了投票的票数以及所…

openresty 交给php,openresty搭建网站防火墙

实现一个简单的防火墙,例如:当我提交一个 select * from 疑似 sql注入的参数时,则会直接被拦截下载waf配置:wget https://github.com/loveshell/ngx_lua_waf/archive/v0.7.2.tar.gz解压文件并将./config.lua,./init.lua,./waf.lua,./wafconf/*文件移动到你的项目目录例如在上篇…

学习MVC之租房网站(六)-用户登录和权限控制

在上一篇<学习MVC之租房网站&#xff08;五&#xff09;-权限、角色、用户管理>完成了权限、角色、用户的增删改查&#xff0c;现在将基于前面完成的内容&#xff0c;进行后台用户登录和权限控制功能的开发。 一、用户登录 用户登录涉及到密码的MD5校验、验证码、Session…

普通网站用双路cpu服务器,双路服务器怎么设置CPU

双路服务器怎么设置CPU 内容精选换一换云游戏场景&#xff0c;需要配置专业显卡。具体的场景典型配置如下&#xff1a;问题现象用户配置完成应用发布资源后&#xff0c;通过云堡垒机首次访问应用发布资源&#xff0c;不能正常访问。可能原因原因一&#xff1a;应用程序启动路径…

Web网站实现Google登录

一、打开谷歌控制台&#xff1a;https://console.developers.google.com/apis 二、点击创建凭据&#xff0c;如下图&#xff0c;填写项目地址等 三、创建好客户端ID和秘钥后&#xff0c;填写对应的项目网址和登录页网址 四、修改OAuth同意屏幕网站首页地址和隐私政策网址 五、代…

java如何截取网页数据_我想用java截取网站上的一条数据怎么截取不下来

展开全部苏宁的这个页面没有class"footer-bd"的&#xff0c;你换个试62616964757a686964616fe59b9ee7ad9431333337393562试&#xff0c;我试了下"footer-bom",这个就能拿到,你测试下&#xff1f;附测试代码&#xff1a;import java.io.BufferedReader;impo…

根据网站错误页面判断服务器和系统服务

判断容器 随便找一个网站&#xff0c;比方说这个&#xff1b;https://777kuu.com/ &#xff0c;在网址后面加上不可能存在的东西&#xff0c;比方说&#xff1a;https://777kuu.com/123.jpg ,让他暴露错误信息 像这样白底黑字加红字的就是windows 2008 R2 IIS7.5或IIS7.0 像…

《大型网站技术架构:核心原理与案例分析》读书笔记-高可用

万无一失&#xff1a;网站的高可用架构 1.网站可用性的度量 网站的页面能完整呈现在最终用户面前&#xff0c;需要经过很多个环节&#xff0c;任何一个环节出了 问题&#xff0c;都可能导致网站页面不可访问。DNS会被劫持、CDN服务可能会挂掉、网站服务 器可能会宕机、网络交换…

在自己软件上上传图片没问题到iis发布上就不能_Azure 上使用 Windows Server Core 运行 ASP.NET Core 网站...

点击上方蓝字关注“汪宇杰博客”导语微软智慧云 Azure 上虽然早就有 App Service 这种完全托管的 PaaS 服务可以让我们分分钟建网站。但是不自己配一下环境&#xff0c;就不能体现技术含量&#xff0c;容易被说微软的人都只会点鼠标。年轻的时候不敲命令&#xff0c;什么时候可…

如何在oracle中下载java,如何在oracle官方网站下载JavaSE官方文档

想要學習JAVA,卻又不知道無從下手。不知你是否有這樣的經歷。好不容易把JAVA JDK給下載下來了,也弄清楚了什麼是JDK、JRE、JAVA2、JAVA SE、JAVA EE等一大堆亂七八糟的概念。把JDK與ECLIPSE下載好後,配置開發環境。之後你需要的是JDK API文檔,此類API文檔有兩種方法獲取,一種是…

鸿蒙应用开发在线体验网址,华为鸿蒙应用开发在线体验网站上线,实现跨设备应用协同...

描述华为鸿蒙系统不仅仅是支持华为智能手机&#xff0c;还有应用在平板电脑&#xff0c;智能手表&#xff0c;智能电视以及其他设备上&#xff0c;是一个跨平台的操作系统。华为HarmonyOS应用开发在线体验网站现已上线。开发者可以通过在线体验“To-Do List”Demo&#xff0c;了…

golang 删除文件_Golang丨Java丨Python爬虫实战—Boss直聘网站数据抓取

我们分别通过Golang、Python、Java三门语言&#xff0c;分别实现对Boss直聘网站的招聘数据进行爬取。首先打开Boss直聘网站&#xff1a;然后我们在职位类型中输入Go或者Golang关键字&#xff1a;然后我们可以看到一个列表&#xff0c;和Go语言相关的各种招聘职位&#xff0c;还…

linux服务器安装openwrt,探索openwrt安装宝塔,搭建web网站论坛社区网校

本帖最后由 离人难拥 于 2021-3-14 12:35 编辑本人小白新手&#xff0c;linux命令也不熟悉&#xff0c;学习&#xff0c;有老师的话请指教先认识一下openwrtOpenWrt 可以被描述为一个嵌入式的 Linux 发行版。(主流路由器固件有 dd-wrt,tomato,openwrt,padavan四类)对比一个单一…

蛋白结构建模与优化_这 11 个可以预测蛋白质结构的网站,通通都安利给你!...

蛋白质是生命活动的体现者&#xff0c;其结构决定着功能。由线性氨基酸组成的蛋白质需要折叠成特定的空间结构才具有相应的生理活性和生物学功能。解析蛋白质的空间结构对于认识蛋白质的功能、功能的执行、生物大分子间的相互作用&#xff0c;以及医学和药学的发展(如药物靶点的…