爬取网站内的全部小说

爬取网站内的全部小说

news/2024/5/10 0:49:43/文章来源:https://blog.csdn.net/GHALB/article/details/102886694

爬取网站内的全部小说

我们需要用到的模块有
re
BeautifulSoup
在这里插入图片描述

首先我们要确定我们爬取的网站：http://www.136book.com/tuijian.php?id=1

一在爬取各个书目录的网址时我选择了用正则表达式来爬取：
选用正则爬取单独的href是比较方便的。爬取后要确定是否为书目录的网站。我发现目录章节的网址的后缀target="blank。用此确定是否为目录的href

具体代码如下：

二，爬取目录的网址后，就是爬取各个章节网址
这次我们要用到新的模块BeautifulSoup。首先先看一下目录章节的网址源代码
地址都在:id=‘book_detail’, class=‘box1’
利用这一点获取各个章节的href
具体代码如

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.luyixian.cn/news_show_901455.aspx

如若内容造成侵权/违法违规/事实不符，请联系dt猫网进行投诉反馈email:809451989@qq.com，一经查实，立即删除！

相关文章

【代码备忘】火狐浏览器插件xpi自动从网站下载安装的代码

【代码备忘】火狐浏览器插件xpi自动从网站下载安装的代码

欢迎加入我们的QQ群，无论你是否工作，学生，只要有c / vc / c 编程经验，就来吧！158427611 【代码备忘】火狐浏览器插件xpi自动从网站下载安装的代码 <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transition…

阅读更多...

Centos 下JBoss as7 + jdk+mysql+nginx 网站配置

Centos 下JBoss as7 + jdk+mysql+nginx 网站配置

网站基本框架设计好了，下来就开始搭建服务器框架了。服务器组选的是 VPS，为什么选VPS,因为我们除了要使用公共的web服务外，还要定制一些系统的软件和服务，自定义上报端口等。除了自己承包整机服务器外，VPS无疑是最佳…

阅读更多...

html5/CSS3进阶——宝贝之家网站首页

html5/CSS3进阶——宝贝之家网站首页

学习了一段时间的框架，最近在复习最早学的html5、css3，拿了一个小案例做了一下，整个过程还算顺利，附图： 其实页面整体结构还是很清晰的，这里我也是直接使用了多个div嵌套划分的常规手段，没有用…

阅读更多...

谈谈用ASP.NET开发的大型网站有哪些架构方式(成本)

谈谈用ASP.NET开发的大型网站有哪些架构方式(成本)

在上篇文章里列举了(国内外用ASP.NET开发的大型网站有哪些)，。最后提到了用.NET开发的大型网站和LAMP/JAVA平台的成本比较。其实在很多时候，收费的不一定就比免费的成本更高。因为开发一个网站要使用哪个平台的技术更合适，需要考虑很多种情况…

阅读更多...

Git中文学习网站

Git中文学习网站

Git中文学习网站：https://git-scm.com/book/zh/v2

阅读更多...

移动开发者的自学宝典：十大在线编程学习网站

移动开发者的自学宝典：十大在线编程学习网站

目前的教育领域，受移动互联网的冲击，MOOC的理念正在风行，但事实却稍显疲软，不尽如人意。相比美国式的全民热衷，国内的线上教育却还流于形式。其他教育尚且如此，移动开发教育更不用谈。在这种情况下&#xf…

阅读更多...

4.4docker基础详细版--在容器中部署静态网站

4.4docker基础详细版--在容器中部署静态网站

利用docker技术在容器中使用nginx部署一个静态网站。容器的端口映射在使用run的时候指定-p或-P来进行端口映射： -P：将为容器暴露的所有端口进行映射eg：docker run -P -it centos /bin/bash-p：指定映射哪些容器的端口eg&#xf…

阅读更多...

9.docker常用命令学习网站常用软件的安装

9.docker常用命令学习网站常用软件的安装

以下是此页面上的基本 Docker 命令列表，以及一些相关命令（如果您要在继续之前进行进一步探索）。 docker build -t friendlyname .# 使用此目录的 Dockerfile 创建镜像 docker run -p 4000:80 friendlyname # 运行端口 4000 到 90 的“友好名…

阅读更多...

SSM众筹网站

SSM众筹网站

注：本文为伪原创，代码主要参考尚硅谷教程。感谢巨人的肩膀，让我可以看得更远。本文全部代码见https://github.com/BnKes/crowdfunding 详细目录见文章尾巴 1.系统架构 Atcrowdfunding-parent 父工程,聚合其他工程(pom)Atcrowdfunding-mai…

阅读更多...

29个非常优秀的纹理背景网站设计

29个非常优秀的纹理背景网站设计

纹理设计一直是不少同学追求的，今天就推荐30个纹理设计出众的网站，希望对你的设计有所帮助。个人比较喜欢第14个，有家的轻松的感觉，更有三维效果，大爱啊！ 1. Banger’s分享一个最好用的UI前端框架&#xff…

阅读更多...

[转载]搭建个人网站 |博客

[转载]搭建个人网站 |博客

一个完全的新人如何搭建自己的个人网站首先，申明下本文所指的新人是指会上网站看网页，会自己聊QQ，会在新浪、网易等平台上写博客的人。当然你要说这个只要会上网的人都会了，是的，我所指的新人就是会上网的人。所以本文…

阅读更多...

推荐一个oracle管理和学习资料网站

推荐一个oracle管理和学习资料网站

http://ajava.org/book/oracle/index.html 很多的oracle管理和学习方面的电子书，值得一看

阅读更多...

将网站打包成桌面程序并生成安装包（跨平台）

将网站打包成桌面程序并生成安装包（跨平台）

一、Nativefier将网站打包成桌面程序介绍 Nativefier 是一个命令行工具，仅仅通过一行代码就可以轻松地为任何的网站创建桌面应用程序，应用程序通过 Electron打包成系统可执行文件（.app .exe等), 对应的可执行文件分别可在 Windows、macOS …

阅读更多...

WSTMall网站系统最新官方版

WSTMall网站系统最新官方版

WSTMall V1.0是在thinkphp 的经典版本3.2.2基础上进行优化开发的， TP 3.2.2不是thinkphp的一个最新的版本，却是thinkphp最金典的一个版本，正所谓站在巨人的肩膀上，WSTMall V1.0继承了thinkphp大道致简的理念，继承了thi…

阅读更多...

天涯孤岸软件商城-.net电子商务网站系统案例

天涯孤岸软件商城-.net电子商务网站系统案例

Asp.net 电子商务商城开发技术项目案例 ASP.NET是作为.NET框架体系结构的一部分推出的。2000年ASP.NET 1.0正式发布，2003年ASP.NET升级为1.1版本。ASP.NET 1.1发布之后更加激发了Web应用程序开发人员对ASP.NET的兴趣。于是在2005年11月微软公司又发布了ASP.NET 2.…

阅读更多...

使用Java开发高性能网站（二）

使用Java开发高性能网站（二）

数据存取数据库服务器的优化和数据的存取，什么类型的数据放在什么地方更好是值得去思考的问题，将来的存储很可能是混用的，Cache，NOSQL，DFS，DataBase在一个系统上都会有，生活的餐具和平日里穿的…

阅读更多...

html/css 个人网站实例(一)

html/css 个人网站实例(一)

显示效果 HTML代码 <!DOCTYPE html> <html lang"en"> <head><meta charset"UTF-8"><meta name"viewport" content"widthdevice-width, initial-scale1.0"><title>alalasheep的个人网站</titl…

阅读更多...

兼容性网站导航主菜单--Head

兼容性网站导航主菜单--Head

<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Strict//EN" "http://www.w3.org/TR/xhtml2/DTD/xhtml1-strict.dtd"> <html xmlns"http://www.w3.org/1999/xhtml" xml:lang"en"> <head> <title>兼容性超强的…

阅读更多...

18 个锻炼编程技能的网站

18 个锻炼编程技能的网站

编程几乎已经成为了人类所知每个行业的必要组成部分，它帮助组织和维护大型系统的方式是无可比拟的，所以越来越多的人开始了他们的编程之旅。要学习编程，你可以通过交互式平台或者书本，随便一种你觉得最适合和容易的学习方式。但是…

阅读更多...

linux企业实战——大型网站架构概述

linux企业实战——大型网站架构概述

阅读更多...

推荐文章

最新文章