Chrome 浏览器的 ChromeOptions 参数介绍,selenium 动态渲染必看

news/2024/5/19 18:13:56/文章来源:https://blog.csdn.net/weixin_44259720/article/details/127095705

背景 

        在使用 selenium 浏览器渲染技术,爬取网站信息时,默认情况下就是一个普通的纯净的chrome浏览器,而我们平时在使用浏览器时,经常就添加一些插件,扩展,代理之类的应用。相对应的,当我们用chrome浏览器爬取网站时,可能需要对这个chrome做一些特殊的配置,以满足爬虫的行为。

        常用的行为有:

  1. 禁止图片和视频的加载:提升网页加载速度。
  2. 添加代理:用于翻墙访问某些页面,或者应对IP访问频率限制的反爬技术。
  3. 使用移动头:访问移动端的站点,一般这种站点的反爬技术比较薄弱。
  4. 添加扩展:像正常使用浏览器一样的功能。
  5. 设置编码:应对中文站,防止乱码。
  6. 阻止JavaScript执行。

正文

1. chromeOptions 介绍

       chromeOptions 是一个配置 chrome 启动是属性的类,通过这个类,我们可以为chrome配置如下参数(这个部分可以通过selenium源码看到):

  • 设置 chrome 二进制文件位置 (binary_location)
  • 添加启动参数 (add_argument)
  • 添加扩展应用 (add_extension, add_encoded_extension)
  • 添加实验性质的设置参数 (add_experimental_option)
  • 设置调试器地址 (debugger_address)

2. chromeOptions 源码

class Options(object):def __init__(self):# 设置 chrome 二进制文件位置self._binary_location = ''# 添加启动参数self._arguments = []# 添加扩展应用self._extension_files = []self._extensions = []# 添加实验性质的设置参数self._experimental_options = {}# 设置调试器地址self._debugger_address = None

3. 使用案例

try:# 创建谷歌浏览器驱动参数对象chrome_options = webdriver.ChromeOptions()# 不加载图片prefs = {"profile.managed_default_content_settings.images": 2}chrome_options.add_experimental_option("prefs", prefs)# 使用headless无界面浏览器模式chrome_options.add_argument('--headless')chrome_options.add_argument('--disable-gpu')# chrome_options.binary_location = r'...\chrome.exe'# 加载谷歌浏览器驱动driver = webdriver.Chrome(r'...\chromedriver.exe')# 请求地址driver.get('https://item.jd.com/100038004369.html')wait = WebDriverWait(driver,10)    # 等待10秒# 等待页面加载class名称为m-item-inner的节点,该节点中包含商品信息wait.until(EC.presence_of_element_located((By.CLASS_NAME,"w")))# 退出浏览器驱动driver.quit()except Exception as e:print(e)

4. 参数介绍 

参数含义
.add_argument('--disable-infobars') 禁止策略化
.add_argument('--no-sandbox')解决DevToolsActivePort文件不存在的报错
.add_argument('window-size=1920x3000')指定浏览器分辨率
.add_argument('--disable-gpu')谷歌禁用GPU加速
.add_argument('--disable-javascript')禁用javascript
.add_argument('--incognito')隐身模式(无痕模式)
.add_argument('--start-maximized')最大化运行(全屏窗口),不设置,取元素会报错
.add_argument('--hide-scrollbars')隐藏滚动条, 应对一些特殊页面
.add_argument('blink-settings=imagesEnabled=false')不加载图片, 提升速度
.add_argument('--headless')浏览器不提供可视化页面(无头模式). linux下如果系统不支持可视化不加这条会启动失败
.add_argument('disable-infobars')去掉Chrome提示受到自动软件控制
.add_argument('lang=en_US')设置语言
.add_argument('User-Agent=xxxxxx')设置User-Agent属性
.add_argument('--kiosk-printing') 默认打印机进行打印
.binary_location = r"...\chrome.exe"手动指定使用的浏览器位置
.add_experimental_option("debuggerAddress", "127.0.0.1:9222") 调用原来的浏览器,不用再次登录即可重启

prefs = {"":""}

prefs["credentials_enable_service"] = False

prefs["profile.password_manager_enabled"] = False

.add_experimental_option("prefs", prefs) 

设置prefs属性,屏蔽'保存密码'提示框
.add_experimental_option('excludeSwitches', ['enable-automation'])以开发者模式启动调试chrome,可以去掉提示受到自动软件控制
.add_experimental_option('useAutomationExtension', False) 去掉提示以开发者模式调用

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.luyixian.cn/news_show_15601.aspx

如若内容造成侵权/违法违规/事实不符,请联系dt猫网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

SpringBoot+SpringSecurity+JWT

声明: 该文章为b站博主“三更草堂”视频讲解文档。 视频链接: https://www.bilibili.com/video/BV1mm4y1X7Hc/?spm_id_from333.1007 文章目录SpringSecurity从入门到精通课程介绍0. 简介1. 快速入门1.1 准备工作1.2 引入SpringSecurity2. 认证2.1 登陆校…

Windows系统深度学习Anaconda、PyTorch软件安装教程

1.作者介绍 陈梦丹,女,西安工程大学电子信息学院,2022级研究生,张宏伟人工智能课题组 研究方向:机器视觉与人工智能 电子邮件:1169738496qq.com 安装思路: 根据电脑显卡选择cuda版本&#xf…

软件供应链中代码签名的重要性

你怎麼知道你的代碼是可信的? 在一個難以獲得信任的世界裡,這是一個重要的問題要問自己。 我們如何知道我們正在運行的應用程序、我們正在部署的容器或我們交付給客戶的代碼是真實的? 我們怎麼知道它沒有被篡改? 這一切都歸結為…

VUE3-实习笔记02

本节:ant design 3 的自定义校验规则 这里是获取数据,保存数据,有两个接口,测试邮箱的校验是非必要的,点击“发送测试邮件”才校验,所以规则是要另外加进去的,然后点击保存的时候,把…

python基本操作的作业

查看变量类型的Python内置函数是____。type () 返回单字符在unicode编码表中的值的函数为____。ord() Python中的布尔型只有两个值,分别为:____和____。True 和 False 执行下列语句后,从键盘输入10,程序的结果是: 1…

ActiveReportsJS 在 React 应用程序中添加和自定义查看器

谷歌搜破解版:ActiveReportsJS 3.2中文版是一个客户端报告解决方案,可用于各种不同的前端框架和库。从 vanilla JavaScript 到 NuxtJS,ARJS 在设计应用程序和使用其组件时非常灵活。在本文中,我们将讨论如何通过 Visual Studio Co…

Delphi 开发过程中简单的版本管理与回退

前言 很多时候,我们在进行代码编写或者窗体设计的时候,如果需要回退某些早前修改的内容,基本是使用CtrlZ做刚刚修改内容的回退处理,但如果某些修改已经过了一段时间我们就不能再这样退回,并且CtrlZ只能按顺序一个一个回…

用QT的modbus相关类编写ModbusTcp主站

目标程序运行界面, 1.新建Qwiget工程,工程文件如下, #------------------------------------------------- # # Project created by QtCreator 2022-09-28T14:53:02 # #------------------------------------------------- QT co…

MYSQL介绍——数据库查询

条件查询 很多时候,我们使用数据库时并不是关心表里所有的数据,而是一部分满足条件的数据,这类条件要用WHERE子 句来实现数据的筛选。 SELECT …… FROM …… WHERE 条件 [ AND | OR ] 条件 …… ;下面给出一个示例: SELECT * …

Android init.rc语言全解析

读懂init语言并不难,难的是有人愿意去做这个事情然后分享出来,如果不是接触到这块的知识,没有谁会专门研究这个,这也是为什么我写第一篇initrc文章到现在过去了7年多了一直没更新的原因,经常有小伙伴私信我希望我写一篇关于init文件解读的文章,或者是想请教下如何在custo…

vue搭建项目、创建登录页面和后台交互之引入axios

目录 1. 搭建项目 1.1 使用vue-cli创建项目 1.2 通过npm安装element-ui 1.3 导入组件 2 创建登录页面 2.1 创建登录组件 2.2 引入css(css.txt) 2.3 配置路由 2.4 在Login组件中将提交按键调整为100%宽度 2.5 运行效果 3. 后台交互 3.1 引入ax…

北京跨境电商开发

受疫情影响,许多国际航班停运,民众只能通过网络购买海外商品。越来越多的商家嗅到了这个商机,于是扩大经营范围。2021年以来,跨境电商投资不断升温,随着SaaS体系的完善,需求也在增加。跨境电商在市场上的潜…

SpringCloud之注册中心

1.SpringCloud电商示例 1.1.示例架构 以常见的电商业务为例 cloud-demo:- order-service # 订单服务- user-service # 用户服务- product-service # 商品服务— cloud-common # 不是应用服务,主要用于存放一些公共的内容,如pojo、baseservice这种、还有utilsc…

冰冰学习笔记:反向迭代器的模拟

欢迎各位大佬光临本文章!!! 还请各位大佬提出宝贵的意见,如发现文章错误请联系冰冰,冰冰一定会虚心接受,及时改正。 本系列文章为冰冰学习编程的学习笔记,如果对您也有帮助,还请各位…

06-使用pytorch实现手写数字识别

目录 1.思路和流程分析 2.准备训练集和测试集 2.1 torchvision.transforms的图形数据处理方法 2.1.1 torchvison.transforms.ToTensor 2.1.2 torchvision.transforms.Normalize(mean,std) 2.1.3 torchvision.transforms.Compose(transforms) 2.2 准备MNIST数据集的Datas…

数据结构<5>二叉树和堆——原理+实现

前面所讲到的数据结构比如:顺序表,链表,栈,队列都是属于线性结构,但是到了二叉树这里就是非线性结构了。下面我们先来认识一下什么是树。 文章目录树的概念和结构树的结构树的概念树的表示树的应用二叉树的概念和结构二…

神经网络在控制中的作用,神经网络控制基本原理

什么是神经网络控制 神经网络控制技术是一项复杂的系统控制技术,一般应用在变频器的控制中,它是通过对系统的辨识、运算后对变频器进行控制的一种新技术。 而且神经网络控制可以同时控制多个变频器,所以应用在多个变频器级联控制中比较合适…

【c语言】-指针进阶(下)

文章目录前言一、回调函数的定义二、回调函数的实例:qsort函数1.qsort函数的功能2.qsort函数的参数3.qsort函数的实现总结前言 指针的学习已经接近尾声了,指针进阶(下)的内容少,但是很重要,它就是回调函数…

Java—字符流

目录 1.IO流小结 1.1字节流 1.2字符流 2、字符流 2.1为什么会出现字符流 2.2编码表 2.3字符串中的编码解码问题 2.4字符流抽象基类 2.5字符流写数据的五种方式 2.6字符流读数据的2种方式 复制文件过程 2.7字符缓冲流 2.8字符缓冲流特有功能 1.IO流小结 1.1字节…

【ROS机器人】Autolabor Pro RTK室外厘米级导航

Autolabor Pro RTK室外厘米级导航 目录 功能介绍传感器介绍实现原理 功能介绍 RTK循迹是机器人循着用户提前录好的轨迹自主行走,行走过程中机器人能够自动躲避障碍物,自动规划路线,达到目标点。 RTK循迹要求配置好RTK接收机,…