第一个爬虫项目-爬取唯美小姐姐网站

news/2024/5/10 15:07:09/文章来源:https://blog.csdn.net/m0_46653437/article/details/108744928

爬取唯美小姐姐网站

链接: 源代码文件下载地址
展示 源代码

import requests
import re
import os
import time# 伪装 用于可以伪装成浏览器。
headers = {'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/80.0.3987.149 Safari/537.36'
}# 请求网页
# 爬取妹子图网站 https://www.tupianzj.com/meinv/mm/meizitu/
print("网页请求中...")
time.sleep(0.5)
response = requests.get("https://www.tupianzj.com/meinv/mm/meizitu/", headers=headers)
html = response.text # 获取html信息
# print(html)
print("网页信息已获取...")
time.sleep(0.5)# 网页部分内容展示示例
# <LI><a href="/meinv/20200728/214746.html" target="_blank"><img src="https://img.tupianzj.com/uploads/allimg/202007/9999/rn815784ca39.jpg" alt="ͲÍàÃÀŮЦØÌÈ绨ƯÁÁÃÃ×Óͼ" border="0" /></a>print("网页信息解析中...")
# 解析网页
urls = re.findall(r'<img src="[a-zA-Z]+://[^\s]*[.jpg]',html) # 使用正则表达式匹配图片的URL
# print(urls[0])
# <img src="https://img.tupianzj.com/uploads/allimg/202009/9999/rn984c2cbc21.jpgtime.sleep(0.5)
print("建立下载目录...")
# 建立下载目录
dir_name = "download"
if not os.path.exists(dir_name):os.mkdir(dir_name)time.sleep(0.5)
print("下载目录:/",dir_name,'建立完成...')# url = "https://img.tupianzj.com/uploads/allimg/202007/9999/rn815784ca39.jpg"
# print(url.split('/'))
# print(url.split('/')[-1]) # 获取图片名time.sleep(0.5)print("网页图片请求中...")
# 下载图片
for url in urls:# 相隔1s# time.sleep(0.01)# 图片的名字file_name = url.split('/')[-1] # 以'/'来分割字符串response = requests.get(url[10:], headers=headers) # url[10:]的作用是出去前缀<img src="# 保存with open(dir_name + "/" + file_name, 'wb') as f:f.write(response.content)  # 将图片写入到文件夹下保存info = "图片文件:    {0:25}{1}".format(file_name," 成功下载...")# print("图片文件: ",file_name," 成功下载...")print(info)time.sleep(0.5)
print("图片爬取完成...")
print("当前时间: ",time.strftime("%Y-%m-%d %H:%M:%S", time.localtime()))

效果展示1:
在这里插入图片描述

效果展示2:
在这里插入图片描述

效果展示3:
在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.luyixian.cn/news_show_749447.aspx

如若内容造成侵权/违法违规/事实不符,请联系dt猫网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

20个学习CSS的绝佳网站——让你从入门到精通

CSS&#xff08;层叠样式表&#xff09;是一种简单的设计语言&#xff0c;能够将页面变漂亮这回事儿变的简单化。在HTML和XHTML中设定页面的样式&#xff0c;这是最常用的应用。但也可以应用于 XML类的文档&#xff0c;包括SVG和XUL。他负责管理网页的设计和外观。使用CSS&…

20个将JavaScript推到极致的网站

对于浏览器上的开发者来说&#xff0c;2011年又是相当精彩的一年。web开发者Phil Hawksworth在这篇文章中总结了web 上经典的JavaScript用法。 那些喜欢冒险体验前沿技术的开发者现在应该会非常开心。浏览器正变得越来越强大&#xff0c;上面有各种丰富的功能可以供开发者选择&…

编程学习好去处:35 个快速学习的编程网站

每个人都暗自地渴望成为一个创业者。现今技术型新兴产业和机会正值繁荣时期&#xff0c;我看到网上创业的公司比线下创业的公司多很多。技术创业&#xff0c;正如其名&#xff0c;意味着你的生意通常不是在线下进行的。像这种类型的创业&#xff0c;创业者应该懂得编码和设计工…

Ubuntu下Nginx做负载实现高性能WEB服务器3—PHP网站的部署和时间同步

接上篇文章&#xff0c;先上架构图 1.环境 网络拓扑 2.部署 此处以天空网络免费的视频网站搭建为例。 2.1 在外网代理机器&#xff08;192.168.80.8&#xff09;上下载网站源码包 rootubuntu:~# wget http://skyuc-download.stor.sinaapp.com/SKYUC_3.4.1_Free_php5.3.tar.bz2 …

zabbix博文和网站

大体思路过程 yum源安装zabbix 安装比较简单&#xff0c;网上资料也普遍是这种安装方法。缺点是卸载的时候需要删一堆文件和文件夹&#xff0c;容易出错。docker安装zabbix 掌握了Docker安装方式比Yum源安装zabbix省心&#xff0c;而且完全做到与宿主机的解耦&#xff0c;卸…

20个创意的的励志时尚电子网站设计推荐

时尚电子商务网站对设计师们来说可以成为一个优秀的设计灵感来源。有吸引力的设计能够吸引更多的游客&#xff0c;产品的销售也就增加了。时尚在我们在每天的生活当中需要追求的。例如&#xff1a;设计像野兔风格的穿衣风格&#xff0c;搭配各样的颜色色调体现了时尚和履行消费…

SEO的Content里面的内容被转义的解决方法

看图&#xff0c;不说话 转义的根源 收工 可能不全面&#xff0c;不过确实解决了这个问题&#xff0c;有更好的方法可以提一下&#xff0c;逆天感激不尽 转载于:https://www.cnblogs.com/dunitian/p/4499673.html

Fixed Responsive Nav – 响应式的单页网站导航插件

Fixed Responsive Nav 是一个响应式的&#xff0c;固定的&#xff0c;触摸友好的单页网站导航插件&#xff0c;响应式导航&#xff0c;流畅的动画滚动。该项目采用渐进增强构建&#xff0c;支持工作在 IE6 及以上版本的浏览器。 你可以给导航打开的内容添加一个遮罩&#xff0c…

高并发高流量网站架构(转)

Web2.0的兴起&#xff0c;掀起了互联网新一轮的网络创业大潮。以用户为导向的新网站建设概念&#xff0c;细分了网站功能和用户群&#xff0c;不仅成功的造就了一大批新生的网 站&#xff0c;也极大的方便了上网的人们。但Web2.0以用户为导向的理念&#xff0c;使得新生的网站有…

使用Visual Studio迁移远程网站到Micorosft Azure

Microsoft Azure中的WebSite我们除了能直接创建网站以外&#xff0c;还支持直接从本地或者远程迁移WEB应用程序&#xff0c;本例子中将采用Visual Studio 2013迁移一个远程asp.net应用程序。本示例的WEB站点&#xff0c;下面步骤将进行该网站到迁移。打开Visual Studio&#xf…

SharePoint 使用PowerShell恢复误删的网站集

//来源&#xff1a;http://www.cnblogs.com/jianyus/p/3666047.html  在SharePoint网站集的使用中&#xff0c;我们很有可能会误删我们需要的网站集&#xff0c;SharePoint其实并没有把网站集删掉&#xff0c;只是放到了SPDeletedSite中&#xff0c;这样&#xff0c;我们还可以…

java response.sendredirect_「response.sendredirect」HttpServeltResponse接口中sendRedirect方法详解 - seo实验室...

response.sendredirectHTTP协议规定了一种重定向机制&#xff1a;用户在浏览器端输入特定的URL&#xff0c;请求访问服务器端的某个组件服务器端的组件返回一个状态代码为302的响应结果&#xff0c;该响应结果的含义为&#xff1a;让浏览器端再请求访问另一个Web组件。在响应的…

如何实现网站的防盗链?

背景 A是网站站长&#xff0c;在A的网站的网页里有一些图片和音频视频的链接&#xff0c;这些静态资源都保留在阿里云对象存储OSS上。B是另一个网站的站长&#xff0c;B在未经A允许的情况下&#xff0c;偷偷使用A的网站的图片资源&#xff0c;放置在自己网站的网页中&#xff0…

生成结合图表_闭着眼也能做出高颜值的Excel图表,你只需这3个网站

今天的推文比较简单&#xff0c;为大家分享3个可以在线制作图表的宝藏网站。欢迎大家在看完之后&#xff0c;在留言区选出你心中觉得最实用的网站&#xff0c;或者跟大家分享你觉得更好用的网站。01. 图表秀全能又方便的在线图表制作神器https://www.tubiaoxiu.com/一款在线图表…

网站服务架构(转)

服务器划分 对于访问量大的网站而言&#xff0c;将网站的各个部分拆分分别部署到不同服务器上是很有必要的。例如将图片和web站点分开。一般而言&#xff0c;在网站的整个服务器部署上分为如下几种类型&#xff1a; 文件服务器&#xff1a;一般存储系统的相关图片和文件&#x…

赣州SEO优化市场最新分析-魏子龙博客

【魏子龙博客导读】赣州市是江西的第二大城市&#xff0c;赣州市所辖2区1市15县。赣州市主要的企业集中在沙河工业园、黄金开发区。企业类型主要包括机械制造、旅游、地产、稀土、脐橙、餐饮等。现在我对以上各行业做个赣州SEO优化市场分析。1.制造&#xff1a;赣州制造主要有电…

mysql springmvc 源码_spring MVC+easyUI+mybatis开发网站后台管理系统源代码下载

urls.properties中需要修改为你本地的静态文件的访问路径。转载js是封装好的大家可以讨论一下使用Java平台,采用SpringMVCMybatis等主流框架数据库:使用免费MYSQL前端:使用Jquery和Easyui技术.界面清晰简洁,易操作权限:对菜单,按钮控制.仅展示有权限的菜单和按钮.拦截:对所有无…

金昌搜索引擎优化网络推广_在网络推广外包中企业网站排名优化在网络推广外包中如何实现?...

随着互联网市场中企业网站数量的增加&#xff0c;网站优化人才的需要与日俱增&#xff0c;据资料显示&#xff0c;与国内当下亿万网民相比&#xff0c;我国目前仅有不足100万家企业从事网络营销&#xff0c;对于网络营销人才的需求也是巨大&#xff0c;未来几年将产生数以百万计…

nginx 隐藏目录_提升网站安全性-隐藏nginx信息

一般使用nginx的web网站&#xff0c;访问网站时&#xff0c;可以从请求头中看到使用了nginx以及nginx的版本号。暴露这些信息将给网站带来一定的风险&#xff0c;因此安装nginx时最好把这些信息隐藏。隐藏nginx 版本号与WEB服务器信息如果未安装nginx&#xff0c;先去官网下载压…

【转载】国内网站博客数据统计选免费Google Analytics还是百度统计

【转载】国内网站博客数据统计选免费Google Analytics还是百度统计 Google Analytics谷歌统计是我用的第一个网站统计工具&#xff0c;当然现在也一直在用。Google Analytics凭借其强大的功能和超强的稳定性、快速的反应能力、广泛的数据应用功能&#xff0c;受到了广大站长的追…