使用pycharm爬取小说网站内容并且上传至mysql

使用pycharm爬取小说网站内容并且上传至mysql

news/2024/5/19 8:33:08/文章来源:https://blog.csdn.net/weixin_49198853/article/details/112860471

爬取顶点小说网站首页内容
最近更新区类型书名章节作者名更新日期

import requests
import re
source = requests.get('https://www.23us.com/').content.decode('gbk')
a = '<li><p class="ul1">\[(.*?)\]《<a class="poptext" href=".*?" target="_blank">(.*?)
dome = re.compile(a)
lists = dome.findall(source)
for a,b,c,d,e in lists:print(a,b,c,d,e,)

在这里插入图片描述
将爬取的数据上传至数据库
在数据库中创建一个新表

import requests
import re
import pymysql
conn = pymysql.connect(host='127.0.0.1',user ='root', password ='',database ='xiaoshuo',charset='utf8')   
cursor = conn.cursor()
source = requests.get('https://www.23us.com/').content.decode('gbk')
a = '<li><p class="ul1">\[(.*?)\]《<a class="poptext" href=".*?" target="_blank">(.*?)</a>》</p><p class="ul2"><a href=".*?" target="_blank">(.*?)</a></p><p>(.*?)</p>(.*?)</li>'
dome = re.compile(a)
lists = dome.findall(source)
for a,b,c,d,e in lists:sql = 'insert into xiaoshuo(types,book_name,chapter,author,update_time) values("{}","{}","{}","{}","{}")'.format(a,b,c,d,e)cursor.execute(sql)conn.commit()
conn.close()

在这里插入图片描述

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.luyixian.cn/news_show_898661.aspx

如若内容造成侵权/违法违规/事实不符，请联系dt猫网进行投诉反馈email:809451989@qq.com，一经查实，立即删除！

相关文章

日拱一卒.综合架构网站搭建知识点总结

日拱一卒.综合架构网站搭建知识点总结

文章目录 01. 课程知识概述部分02. 课程知识回顾说明03. 网络IP地址说明：04. 虚拟主机上网原理05. 系统路由配置 01. 课程知识概述部分 1) 网络IP地址说明 ？？192.168.1.100 -- IPv4 (IP地址组成 IP地址分类 IP地址子网划分)xx:x…

阅读更多...

日拱一卒.综合架构网站搭建组成/备份服务知识点总结

日拱一卒.综合架构网站搭建组成/备份服务知识点总结

文章目录 01. 课程知识概述部分02. 课程知识回顾说明03. 综合架构组成部分04. 网站架构服务规划 13台服务器#03. 远程连接优化 sed -i -e 79cGSSAPIAuthentication no -e 115cUseDNS no /etc/ssh/sshd_config systemctl restart sshd yum install -y tree wget vim lrzsz bash-…

阅读更多...

[转] ASP.NET 开发 WAP 网站

[转] ASP.NET 开发 WAP 网站

[转] ASP.NET 开发 WAP 网站使用ASP.NET开发WAP很简单,只需要新建一个空的网站,向其中添加移动WEB窗体即可.可以使用OPERA浏览器与M3GATE来调试网页, 强制输出WML,可以在WEB.CONFIG中 <system.web>下添加以下内容: < browserCaps > < result type "Syst…

阅读更多...

C++ 实用网站(推荐)

C++ 实用网站(推荐)

目录 1.官方网站 2.参考手册（官方-中文版） 3.基础知识 4.在线工具 5. 学习博客 1.官方网站 http://www.cplusplus.com/ http://cpp.sh/(Online Execution Tool) 2.参考手册（官方-中文版） https://zh.cppreference.com/w/c…

阅读更多...

查看谷歌代码网站（含camera）

查看谷歌代码网站（含camera）

目录 1. 查看谷歌代码 http://androidxref.com（IE 浏览器可打开正常使用） https://www.androidos.net.cn/sourcecode（Android社区） 2. 查看Android camera相关网站（camera学习必看） 3. ADB 官方版本下…

阅读更多...

Google 翻译让你的网站拥有不同语言版本

Google 翻译让你的网站拥有不同语言版本

现在流行国际化，自由的网络，让你的网站也拥有了许多外国粉丝，就像我们看其他语种的网站需要一个翻译一样，我想外国朋友看我们的网站也挺吃力的，用个放大镜一个词一个词地翻译，肯定不如整篇翻译后看得方便。…

阅读更多...

阿峰SEO-飘

阿峰SEO-飘

阿峰SEO 你就像那风中飞舞着的树叶没人知道你将要落在何处你属于风，属于天空属于广阔的大地你是自由自在的鱼儿你是活泼好动的猫咪我猜不到什么样的风景会让你驻足我猜不到什么样的风景会让你微笑你走向天空便可化作自由的精灵你依偎大地既是鲜花烂漫我猜…

阅读更多...

网站降权有什么原因,如何解决恢复？

网站降权有什么原因,如何解决恢复？

首先得说明，网站降权是很正常的事情，网站被降权后别天天哭天旱地的，好像天要塌下来一样的。遇到降权站点是所有SEO新手感觉很烦恼的事情，新手因为自身能力的不足，知识面的狭隘，一遇到这样的情况就不知道该怎…

阅读更多...

如何避免网站改版时候导致网站降权排名下降

如何避免网站改版时候导致网站降权排名下降

如何避免网站改版带来的网站降权排名下降问题，这应该是每位站长都会遇到的。没有那个网站的成功是一气呵成的，即使是新浪网他的网站内容栏目也是随着网站的发展壮大慢慢增加的。公司的业务在不断扩张，所以网站也在不断改版。即使是个人站点&a…

阅读更多...

为什么有些网站不设置关键词排名却很好

为什么有些网站不设置关键词排名却很好

常有朋友问，为什么有些网站不设置关键词，排名还很好，这是为什么了？比如大多数站长朋友都去的卢松松博客和月光博客首页keywords里面都没有看到关键词的设置，只写了一个/。为什么他们没有设置关键词排名还这么好呢&…

阅读更多...

为什么网站被降权后关键词排名很难快速恢复

为什么网站被降权后关键词排名很难快速恢复

很多朋友都在咨询网站被降权了，怎么可以快速恢复排名的呢？其实对于这个问题基本是误解，可以恢复排名，这个恢复排名也要根据实际情况，可以快速恢复排名，基本不可能的。良马科技讲一下自己最近手里的一个网站…

阅读更多...

网站的内容页收录不起来是怎么回事？

网站的内容页收录不起来是怎么回事？

这个朋友咨询的问题前提是这样的，网站已经做了1年多了之前网站收录很好，现在网站内页收录非常困难，基本可以说不收录，这个这样的原因也的大多数网站所遇到的情况，本质还是内容的问题。1年的多网站肯定不是新站考核那样…

阅读更多...

初次邂逅 Pair Project —— 记与子禾童鞋的结对编程（附网站地址及完整源码）

初次邂逅 Pair Project —— 记与子禾童鞋的结对编程（附网站地址及完整源码）

结对人员许晓彬&陈子禾时间 2010/11/15 – 2010/11/26 网站地址 http://home.ustc.edu.cn/~xxb263/ChineseChecker.html 源码 http://home.ustc.edu.cn/~xxb263/ChineseChecker.rar （若下载后后缀为.tgz，请改为.r…

阅读更多...

SEO优化-尖叫青蛙screamingfrog-搜索优化-网站地图

SEO优化-尖叫青蛙screamingfrog-搜索优化-网站地图

Hello，嗨，大家好，我是哈喽猿今天推送的是SEO的文章，给大家介绍一个可能大家不太熟悉，功能却非常强大的，只流传于SEO大神之间的一个工具：ScreamingFrogSEOSpider,感谢您宝贵的时间阅读第一步 …

阅读更多...

WebSiteAuditor-SEO优化工具-SEO分析工具-使用教程

WebSiteAuditor-SEO优化工具-SEO分析工具-使用教程

Hello，嗨，大家好，我是哈喽猿。今天推送的是SEO优化的文章，给大家介绍一个国外SEO工具【WebSite Auditor】,这款软件用起来非常方便，它提供SEO健康检查、爬行和索引、页面的内容优化、社交媒体和流量统计、实时审核报告…

阅读更多...

SiteMapX-SEO优化-网站地图-SEO工具

SiteMapX-SEO优化-网站地图-SEO工具

哈喽我是程序猿。今天推送的SEO网站优化是的文章，感谢您宝贵的时间阅读前言网站地图是链接一个网站的通道,网站地图文件一般分为HTML版的和XML版的. HTML版的网站地图文件能够帮助访问者更快的找到所需要的页面,XML版的网站地图文件帮助搜索引擎蜘蛛更好的抓爬…

阅读更多...

什么是网站的Google PR值和世界排名？

什么是网站的Google PR值和世界排名？

1.什么是世界排名? 怎么看?它是怎么排名的? ALEXA根据GOOGLE搜索和安装自己的工具条的用户获取的数据排列的一个并不是很客观的排行榜. 查看地址: http://www.alexa.com 输入你的玉米地址就可以了. ALEXA工具条下载地址: http://download.alexa.com/alexa7/install.…

阅读更多...

Alexa 世界网站排名作弊简单方法

Alexa 世界网站排名作弊简单方法

Alexa 世界网站排名作弊简单方法根据alexa的排名原理，通过一些手段我们可以很容易的进行作弊，效果可是看得到的哦！ 查看世界排名： www.alexa.com/data/details?url 你的网站地址作弊的关键就是要提高网站的访问量&#xff0c…

阅读更多...

java直播毕业设计，使用red5，obs，video.js仿bilibili实现一个视频直播网站

java直播毕业设计，使用red5，obs，video.js仿bilibili实现一个视频直播网站

该项目是本人的毕业设计，先罗列一下使用到的各种开源技术框架软件 red5，开源直播流项目，直播部署使用即可，优点：简单、开源免费obs，免费的视频录制软件，有强大丰富的功能，用于实现电…

阅读更多...

2013年4月IT技术行业网站综合影响力排名

2013年4月IT技术行业网站综合影响力排名

根据2013年4月开元网络与品牌研究最新研究结果，在IT技术行业网站综合影响力评估中，CSDN的综合影响力最强，排名第一，其次是51CTO和ChinaUnix，分别位居第二、三名。详细排名如下表所示： 2013年4月IT技术行业…

阅读更多...

推荐文章

最新文章