图像网站下载图片

news/2024/5/21 19:39:22/文章来源:https://blog.csdn.net/weixin_49374896/article/details/113986462

图像网站下载图片

文章目录

      • 准备工作
      • 方法一:
      • 方法二:

准备工作

实现从百度图片中下载某一类型的图片

import requests
from selenium import webdriver

通过webdriver打开浏览器,如果遇到问题可以参考https://blog.csdn.net/weixin_49374896/article/details/113982517

browser=webdriver.Firefox()
browser.get('https://image.baidu.com/')

找到输入框元素,输入内容

kw_elem=browser.find_element_by_id('kw')
kw_elem.send_keys('猫')

点击搜索

s_newBtn_elem=browser.find_element_by_class_name('s_newBtn')
s_newBtn_elem.click()

这里已经是搜索结果(页面切换了,但没有产生新的窗口,后面将会说明产生新的窗口怎么办)

在页面右键->查看元素,进入调试。然后用元素选择器选中一张图片(注意里面前几个是广告,不要选广告图片)观察这个图像元素的找到合适的方法选中该元素(建议用find_element_by_xpath)

imgs_elem=browser.find_elements_by_xpath("//*[@class='imgbox']/a/img")

方法一:

获取链接,下载图片

new_url=imgs_elem.get_attribute(‘src’)获取到的信息用不了,只能用get_attribute(‘data-imgurl’)

n=len(imgs_elem)
for i in range(n):new_url=imgs_elem[i].get_attribute('data-imgurl')r = requests.get(new_url)# 将获取到的图片二进制流写入本地文件with open('猫_'+str(i)+'.png', 'wb') as f:f.write(r.content)

方法二:

上面那种方法是在搜索页面获得的,还可以点击图片进入详情下载

from selenium.webdriver. common.keys import Keys
new_img_elem=browser.find_element_by_xpath("//*[@class='imgbox']/a/img")
new_img_elem.click()

注意,这里由于点击搜索之后打开了一个新的窗口,而我们的browser还停留在原来的窗口。

print(browser.title)
猫_百度图片搜索

先保存原来的窗口,以便之后返回回来

mainWindow = browser.current_window_handle
print(mainWindow)
15

在这里进行页面切换,获取到当前所有的窗口,选中搜索的结果

for handle in browser.window_handles:browser.switch_to.window(handle)if '搜索结果' in browser.title:break

现在已经是在新的窗口啦

print(browser.title)
猫的搜索结果_百度图片搜索

进入搜索结果,进入之后可以通过键盘左右键切换图片

标签是 HTML 文件中的基本标签:HTML 文件的完整内容包含在和标签之内
html_elem=browser.find_element_by_tag_name('html')
#下载多少张图片就循环多少次
for i in range(20):#获得图片元素img=browser.find_element_by_xpath("//*[@class='img-wrapper']/img")url=img.get_attribute('src')r = requests.get(new_url)# 将获取到的图片二进制流写入本地文件with open('猫2_'+str(i)+'.png', 'wb') as f:f.write(r.content) #通过模拟键盘右键切换图片html_elem.send_keys(Keys.RIGHT)

关闭当前窗口,回到原来的窗口(这一步可有可无)

browser.close()
browser.switch_to.window(mainWindow)
print(browser.title)
猫_百度图片搜索

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.luyixian.cn/news_show_886855.aspx

如若内容造成侵权/违法违规/事实不符,请联系dt猫网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

婚外情网站的谎言和资料外泄故事 企业该吸取怎样的教训

近日被曝全球最大的偷情网站Ashley Madison已遭黑客组织入侵,黑客宣称已掌握超过3700万已婚外遇男女的个人资料,除非达到他们的要求,否则将公布客户的真实姓名、裸照、信用卡详细资料与“性幻想内容”。Ashley Madison去年曾推出只要支付19美…

高考志愿填报小心钓鱼网站 趋势科技PC-cillin 2012保护学生网上报名无忧

[趋势科技中国]– [2012年5月11日] 细节决定成败,随着高考志愿网上集中填报的来临,针对这一高考关口时间的钓鱼网站和网站木马病毒开始明显增多。全球服务器安全、虚拟化及云计算安全领导厂商趋势科技提醒广大考生和家长,在查看高校网站和填写…

适合做个人博客网站的一套静态页面模板,非常不错哦

分享一下我老师大神的人工智能教程。零基础!通俗易懂!风趣幽默!还带黄段子!希望你也加入到我们人工智能的队伍中来!https://blog.csdn.net/jiangjunshow 原文:适合做个人博客网站的一套静态页面模板&#x…

开发多用户注册使用的网站---享元模式

我们在实际项目开发过程中,肯定遇到以下类似的情况:专为小型公司注册并显示的公司信息,提供不同样式的显示方式;我们不会为每个注册的账户的公司都开发出一套量身打造的网站,而且才用共享技术的方式来实现核心技术、其…

大型网站架构系列:负载均衡详解(1)

大型网站架构系列:负载均衡详解(1) 面对大量用户访问、高并发请求,海量数据,可以使用高性能的服务器、大型数据库,存储设备,高性能Web服务器,采用高效率的编程语言比如(Go,Scala)等&…

大型网站架构系列:负载均衡详解(3)

大型网站架构系列:负载均衡详解(3) 本次分享大纲 软件负载均衡概述Ngnix负载均衡Lvs负载均衡Haproxy负载均衡本次分享总结 一、软件负载均衡概述 硬件负载均衡性能优越,功能全面,但是价格昂贵,一般适合初期…

大型网站架构系列:负载均衡详解(4)

大型网站架构系列:负载均衡详解(4) 本文是负载均衡详解的第四篇,主要介绍了LVS的三种请求转发模式和八种负载均衡算法,以及Haproxy的特点和负载均衡算法。具体参考文章,详见最后的链接。 三、LVS负载均衡 L…

大型网站架构系列:电商网站架构案例(2)

大型网站架构系列:电商网站架构案例(2) 电网网站架构案例系列的第二篇文章。主要讲解网站架构分析,网站架构优化,业务拆分,应用集群架构,多级缓存,分布式Session。 五、网站架构分析 根据以上预估&#xff…

大型网站架构系列:电商网站架构案例(3)

大型网站架构系列:电商网站架构案例(3) 本文章是电商网站架构案例的第三篇,主要介绍数据库集群,读写分离,分库分表,服务化,消息队列的使用,以及本电商案例的架构总结。 6.5数据库集群&#xff0…

大型网站架构系列:电商网站架构案例(1)

大型网站架构系列:电商网站架构案例(1) 大型网站架构是一个系列文档,欢迎大家关注。本次分享主题:电商网站架构案例。从电商网站的需求,到单机架构,逐步演变为常用的,可供参考的分布式架构的原型。除具备功…

大型网站架构系列:分布式消息队列(一)

大型网站架构系列:分布式消息队列(一) 以下是消息队列以下的大纲,本文主要介绍消息队列概述,消息队列应用场景和消息中间件示例(电商,日志系统)。 本次分享大纲 消息队列概述消息队列…

大型网站架构系列:消息队列(二)

大型网站架构系列:消息队列(二) 本文是大型网站架构系列:消息队列(二),主要分享JMS消息服务,常用消息中间件(Active MQ,Rabbit MQ,Zero MQ&#x…

大型分布式网站架构技术总结

大型分布式网站架构技术总结 本文是学习大型分布式网站架构的技术总结。对架构一个高性能,高可用,可伸缩,可扩展的分布式网站进行了概要性描述,并给出一个架构参考。一部分为读书笔记,一部分是个人经验总结。对大型分布…

如何让数据说话! —网站实例分析

数据在很多网站都被看作是衡量一个产品或者一个设计好坏的基本指标之一。数据指标也曾经压的我很长一段时间喘不过气来。但是现在想想确实有时候数据能告诉你很多很多。它未必是衡量产品好坏的唯一标准,但是它也确实能告知你很多。 那么数据究竟能告知我们些什么呢&…

看CSDN博客,用电脑访问其手机版网站——更清爽!

一、效果图对比 A.第一张图为电脑版谋篇博客; B.第二张图为对应手机版博客; ----------------------------------------------------------------------------------------------------------------------------------------------- 对比效果不言而喻&…

爬虫日记之05两种Web请求渲染过程(附图解和网站实例)

爬虫日记之两种Web请求渲染过程 2022-3-5 Part1 首先我们来对两种Web请求过程的概念进行一下区分~ 1.服务器渲染:在服务器那边直接把数据和html整合在一起,统一返回给浏览器 这种方法的好处是在页面代码中能看到数据,且只需要浏览器请求一…

wamp(3.1.0版本)网站根目录的更改及多站点配置

网站根目录的更改: 更改wamp网站根目录的目的:使代码既能被服务器执行,又使代码和wamp安装文件包分离。 需要修改的文件: httpd.conf,httpd-vhosts.conf,wampmanager.ini,wampmanager.tpl 操…

【裁员警告】这是一段让各大电影网站的资料整理人员下岗的代码,用BeautifulSoup+urllib+python爬虫豆瓣top250电影详细信息,哪还需要低效的人力呢?

我们发现很多电影网站的电影信息,和豆瓣网中的电影信息一模一样,连标点符号都分毫不差!!!各大平台的数据维护人员如此严谨敬业有耐心??NO!!他们只是靠爬虫直接把豆瓣里的…

【超详细Django网站开发过程1】服务器的搭建、项目的创建、路由器的配置

WEB系统分为前端和后端,我以往做前端比较多,不喜欢后端密密麻麻的数据处理,活得像个网页美工,十分有耐心,而现在可没这些闲情雅致了…… 一般来讲,各大知名网站的架构师都会亲自参与项目后端的设计开发&…

【超详细Django网站开发过程2】便利店管理系统之——创建数据库→定义数据库表→创建数据库表

假装自己拥有一家小便利店,名叫——7-Twelve,我希望制作一个便利店管理系统对我的顾客、销售人员、货物等数据进行管理,先不管前端,后端总免不了对数据的一顿操作,那如何在Django中对数据库进行增删查改呢?…