C# 网站静态页面生成器 for 多线程版

news/2024/5/19 9:07:32/文章来源:https://blog.csdn.net/ArvinStudy/article/details/8679108

来自:http://www.cnblogs.com/keke/archive/2010/09/07/1820871.html#2454265

摘要:该生成器是用于放置于服务器上的一个小程序,用于生成站点中需要静态化的页面生成。我写c/s程序不多,所以本程序可能会有些小的bug。还望高手多多指教!

内容:

首先让大家看看该程序的几个流程界面

1.登陆界面:

说明:

        此程序拥有登陆的原因是因公司有不少部门可以访问网站服务器,So构建了一个登陆来限制操作管理员操作。

账号密码位于程序目录debug下的 info.txt 文件中配置,现在默认为账号:123456 密码:654321

2.主要界面:

说明:

       主要界面是用于配置需要抓取的页面地址以及抓取过后的静态页面地址和抓取静态页面的间隔时间

添加的地址以XML的形式储存。

支持抓取的错误日志信息记录。

处理异常网页是抓取网站中默认的错误页面的地址,如果是错误页地址则不抓取。(如果当访问抓取的页面报异常则会跳转到默认的站点错误页面地址)

3.地址编辑界面:

说明:

        该窗口是双击主要界面地址列表中指定地址的时候弹出的界面,主要是修改当前双击的地址信息

4.最小化界面

说明:

        该程序支持最小化后台运行,如果一切配置ok后可以最小化至状态栏中后台运行。

如需再次配置的时候双击小图标可再次唤出操作,不过需再次登陆!

5.代码介绍

(1).ClsAccount.cs            管理员登陆处理类

(2).ClsApp.cs                      记录当前程序是否为第一次加载处理类

(3).ClsErrorPage.cs             将错误日志写入记事本处理类

(4).ClsHotKey.cs                  程序热键唤出处理类 (默认为Shift + S)

(5).ClsLogs.cs                      日志信息处理类

(6).ClsPageBuilder.cs          通过地址抓取到的静态页面生成处理类

(7).ClsPageParser.cs            解析需要抓取地址页面处理类

(8).ClsPageUrl.cs                 处理添加、修改需生成的静态页面地址 (操作XML处理)

(9).ClsPageUrlEntity.cs        页面路径实体类

(10).ClsThread.cs                 多线程管理类(一个静态生成开启就为一个线程)

(11).Commona.cs                全局公用参数类

该程序的主要功能就是以上介绍!如有需要的可下载!

源码:http://files.cnblogs.com/keke/CrawlPage.rar

 

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.luyixian.cn/news_show_872099.aspx

如若内容造成侵权/违法违规/事实不符,请联系dt猫网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

电子商务网站搜索架构方案

来自:http://www.jqpress.com/post/34.aspx 说是电子商务搜索架构方案,其实就是lucene.net的应用,公司庙小,人少,也就自己平时看看,以前做过一点例子,这样就被拉上去写架构方案了。我这个懒惰的…

PhantomJS在Windows7下实现网站自动下载截图

来自:http://www.cnblogs.com/huangcong/archive/2013/04/18/3027654.html 1. phantomjs介绍 基于Javascript驱动的命令行webkit引擎,轻量级,安装简单,开发快速,渲染速度较快,无界面的webkit浏览器。 phont…

做科研必备的良心网站

做科研必备的良心网站 在日常学习工作中,你是否也会因为常常忘记一些文献检索库而烦恼呢?但遇到我后,再也不是事了,我会具体按照中英文献库的分类,对经常使用的数据库不断地总结。如果需要检索对应的数据库,可以直接…

2019-06-04 9个接私活的网站,你有码,我有钱

很多有技术的码农们浑身的葵花宝典,辟邪剑法,十八般武艺,但不能一身的本事空空浪费,现在小编就给大家推荐几个接私活的秘籍,助你收入飙升,纵横码农圈,众猿皆披靡。但你如果只是眼中有码&#xf…

大型高并发高负载网站的系统架构

一个小型的网站,比如个人网站,可以使用最简单的html静态页面就实现了,配合一些图片达到美化效果,所有的页面均存放在一个目录下,这样的网站对系统架构、性能的要求都很简单,随着互联网业务的不断丰富&#…

多语言网站生成静态页面实现思路以及用freemarker作模板生成静态页面的实现

现在呀,越来越多的网站要求做成多种语言,并且,大家好像都知道了html比动态的运行快,所以,也倾向自动生成静态页面这个功能,我就纳闷了,消息怎么传的那么快呀!好吧,说说多语言网站生成静态页面时候的主要瓶颈在哪些方面吧: 1.首先是列表类型的文章分页的生成 这个吧,肯定需要有…

在个人网站中引入Markdown编辑文本

Markdown是一种可以使用普通文本编辑器编写的标记语言,通过简单的标记语法,它可以使普通文本内容具有一定的格式。 下载地址 https://github.com/evilstreak/markdown-js/releases 选择markdown-browser-0.6.0-beta1.tgz 下载后解压会得到两个库文件…

推荐几个免费好用的毕业论文(设计)文献查找网站包括外文文献(亲测有用)

1、剑桥大学 https://www.repository.cam.ac.uk/discover 2、ScienceDirect https://www.sciencedirect.com/ 3、CiteSeerX http://citeseerx.ist.psu.edu/index 4、Open Accsess Library https://www.oalib.com/ 5、国家科技图书文献中心 http://oar.nstl.gov.cn…

推荐两个免费的论文查重网站(24小时一次)

推荐两个免费的论文查重网站(一天24小时一次) 这两个都要扫码登陆,然后选择免费查重,在后面的选择中要钱的都不要选择就能直接提交选择查重。 PaperWord https://www.paperword.com/ PaperYY https://www.paperyy.com/

网站优化策略

网站的优化建议 页面尽量只使用div标签并且嵌套层级不要太多。Html页面不能包含css、JavaScript代码,全部放到单独的文件。title标签包含关键词不要超过3个,每个页面title内容要对应页面内容。Description标签包含关键词4~5次,每个页面描述除…

4000万美元维护一个网站,贵吗?

5亿用户,365*24h连续运行,完美的浏览器(桌面/移动)兼容性,优秀的用户体验,一流的问题解答团队,TB级数据管理,支持300种语言,这是一个网站,非营利性&#xff0…

网站服务配置过程 nginxⅠ

1. nginx程序目录结构信息 /etc/logrotate.d/nginx 利用logrotate实现日志文件自动切割利用脚本定时任务实现日志切割#!/bin/bashmv nginx.log nginx.log_$(date %F_%T)systemctl restart nginx/etc/nginx/nginx.conf 主配置文件 /etc/nginx/conf.d/default…

网站服务架构部署(LNMP)

1. LNMP架构说明 LNMT: linux nginx mysql tomcat LNMP: linux nginx mysql php/python LAMP: linux apache mysql php 作用: 可以使用架构处理动态访问请求2. LNMP架构部署过程 Linux : 1) 系统安全服务需要关闭 selinux iptables 2) 确认系统/tmp目录权限 1777nginx : 1) 安…

网站服务负载均衡 Ⅰ

1. 负载均衡详述部分 Syntax: upstream name { ... } --- 指定可以分配用户请求web节点信息 Default: — Context: http分配后端节点方式方法: 根据能力进行分配用户访问请求 weight --权重 按比例进行权重分配访问资源 upstream oldboy { server 10.0.0.7:80 weight3; se…

python爬虫爬取网站文章

这次爬取网站为:‘http://www.agri.cn/kj/syjs/zzjs/’ 程序大致分为六步: 1、引入相关的库和设置两个正则表达式规则 2、设置爬取的网页数量 3、设置网页中包含文章的HTML部分 4、在获取的部分中提取包含文章连接的HTML语言 5、获取文章连接 6、根…

【服务器】iis的重启服务器、重启iis、回收(重启)线程池、刷新网站

windows自带iis,如果没有的也可以控制面板中启用 1、在开始按钮点击右键,选择控制面板。 2、接着我们从控制面板选择“程序”。 3、然后选择“启用或关闭windows功能”。 4、从列表中选择Internet Infomation Services。 5、并且把相应的功能条…

【调优】网站前后端性能优化

文章目录 前端1. 尽可能减少要传输的数据量2. 减少关键资源的总数3. 缩短关键渲染路径长度4.网络传输优化Total Connection TimeTTFB Content Download 5.预加载 后端1. 批量思想:批量操作数据库2. 异步思想:耗时操作,考虑放到异步执行3. 空…

网站的消息通知系统设计漫谈

现在的很多网站都有消息通知系统,比如新浪微博页面右上角的小黄签,比如Facebook页面左上角的Notifications。但是消息通知系统的说法是个笼统的概念,我理解的其本质功能是网站把某些对用户有价值的信息及时告知用户。比如常见的SNS关系中谁关…

计算机学习网站

C语言中文网:C语言程序设计门户网站(入门教程、编程软件)http://c.biancheng.net/Python3 os.path() 模块 | 菜鸟教程Python3 os.path() 模块 Python3 OS 文件/目录方法 os.path 模块主要用于获取文件的属性。 以下是 os.path 模块的几种常用方法: 方法说…

HTML资料之网站ico图标

◆ 使用ico图标&#xff1a; 将favicon.ico 这个图标放到根目录下&#xff0c;使用link标签引用。 <link rel"shortcut icon" href"favicon.ico" type"image/x-icon"/>注&#xff1a;后面的type“image/x-icon” 属性可以省略。 ◆ ◆ 制…