spark 基于minikube部署cluster模式

news/2024/4/27 4:51:00/文章来源:https://blog.csdn.net/Andrew_2018/article/details/129194898

前提条件

spark的版本需要在2.3及以上的版本

k8s的版本需要在1.6以上

serviceaccount需要有创建pod,service,configmap的权限

集群中需要有k8s dns

由于是在自己的电脑上,所以采用的是minikube来部署,minikube的安装,可以参考minikube官网

启动minikube及准备

minikub在启动时需要3 cpus和4g以上的资源,在启动前,如果minikube已经存在了,先删除原有的集群

  minikube delete

在启动minikube时可采用

   minikube start --cpus 3 --memory 4  --image-mirror-country='cn' --kubernetes-version=v1.23.6  

或者通过

 minikube config set cpus 3minikube config set memory 4minikube start --image-mirror-country='cn' --kubernetes-version=v1.23.6

启动时参数解释:

cpus和memory:指定cpu个数,memory 指定内存大小,默认为gb

image-mirror-country:针对在国内的环境,加快minikube下载相应的镜像速度,如果不加,可能会启动的比较慢

kubernetes-version: 当k8s的版本大于24时,minikube 启动失败,原因暂时还未弄清楚。

创建命名空间

 kubectl create namespace spark

创建serviceaccount并赋予权限

kubectl create serviceaccount spark-serviceaccount --namespace spark
kubectl create clusterrolebinding spark-rolebinding --clusterrole=edit --serviceaccount=spark:spark-serviceaccount --namespace=spark

打包spark镜像

spark下载地址:https://spark.apache.org/downloads.html ,下载相应平台的spark,写本文档时的环境为ubuntu 20.04版本,spark版本3.1.3 hadoop版本3.2。将下载下来的文件解压,进入目录中,先执行如下命令:

 eval $(minikube docker-env)docker build -t   test/spark:3.1.3  -f  kubernetes/dockerfiles/spark/Dockerfile .

打包时的注意事项:

在打包前一定要执行eval $(minikube docker-env),否则后面在提交时,找不到镜像。

在打包前,自己写的spark jar包需要一起打到该镜像中,否则后面提交时,找不到jar包(可能有其他的方法,但暂时未找到)

打包的时候,最后面的点号一定要加,否则有可能报错

提交spark任务

  ./bin/spark-submit \--master k8s://https://xxx.xxx.xx.xx:8443 \--deploy-mode cluster \--name spark-pi \--class   mainClasss \--conf  spark.executor.instances=1 \--conf spark.kubernetes.driver.volumes.hostPath.driverv.options.path=/tmp/spark-minikube-demo \--conf spark.kubernetes.driver.volumes.hostPath.driverv.mount.path=/tmp/spark/k8s-demo \--conf spark.kubernetes.executor.volumes.hostPath.driverv.options.path=/tmp/spark-minikube-demo \--conf spark.kubernetes.executor.volumes.hostPath.driverv.mount.path=/tmp/spark-minikube-demo \--conf spark.kubernetes.authenticate.driver.serviceAccountName=spark-serviceaccount\--conf spark.kubernetes.container.image.pullPolicy=Never \--conf spark.kubernetes.namespace=spark \--conf spark.kubernetes.container.image=registry.cn-hangzhou.aliyuncs.com/spark:3.1.3 \local:///opt/spark/jars/sparkDemo.jar

参数解释:

master: k8s地址,可以执行下面命令获取

kubectl cluster-info

spark.kubernets.driver/executor.volumes.[]volumType].[volumName].options/mount:挂载卷信息

spark.kubernetes.container.image.pullPolicy:获取镜像的方式,Never指的是从本地仓库获取,如果是Always指的是从远程仓库获取。

local:///file:指的是spark jar包在镜像内的位置,在测试中,我的jar包是打在了/opt/spark/jars这个目录下

排错

如果在启动的过程中,遇到执行出错,执行如下命令

kubectl get pods --namespace=spark

找到报错的podid

kubectl logs podId  --namespace=spark

查看输出的日志信息,定位问题

参考文章

1、https://blog.csdn.net/john1337/article/details/110261723

2、https://spark.apache.org/docs/latest/running-on-kubernetes.html

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.luyixian.cn/news_show_73587.aspx

如若内容造成侵权/违法违规/事实不符,请联系dt猫网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Web前端学习:一

编辑器的基础使用 编辑器推荐使用: HBuilderx(免费中文)(建议使用) Sublime(免费英文) Sublime中文设置方法,下载语言插件: 1、进入Sublime后,ShiftCtrlP…

wait/notify方法 等待唤醒机制

线程正在运行,调用这个线程的wait()方法,这个线程就会进入一个集合进行等待(这个集合的线程不会争抢cpu),此时线程的状态就是waiting 当有线程调用notify()方法的时候,就会从集合中挑选一个线程进入到排队队列里面 notifyAll就是…

【样式】轮播图样式 uview 版本 : “2.0.31“

![在这里插入图片描述](https://img-blog.csdnimg.cn/6cd568ce932b4ea7ae52f10365979680.png html <view class"addSwiperdiv"><image src"/static/66.png" mode"aspectFill" class"titleimg"></image><view c…

VC++ 解决dll库动态库加载失败问题(调用LoadLibrary加载失败)(附源码)

目录 1、动态加载dll库去调用库中的函数 1.1、调用系统dll库中未公开的接口 1.2、调用控件库中的注册接口向系统中注册该控件 2、LoadLibrary动态加载dll库失败的场景 2.1、自制安装包中遇到的LoadLibrary加载dll库失败问题 2.2、主程序底层模块调用LoadLibrary加载dll库…

秒杀测试案例 Java Redis Mysql

基于redis和MySQL乐观锁实现秒杀优惠券场景&#xff0c;一人一单。MySQL乐观锁改良控制不出现超卖和少卖问题&#xff0c;使用redisson分布式锁在用户维度加锁控制一人一单。 源码&#xff1a;https://github.com/hanhanhanxu/SeckillTest 文中图片看不清的地方可以鼠标右键-&…

谷歌外推留痕,谷歌搜索留痕快速收录怎么做出来的?

本文主要分享谷歌搜索留痕的收录效果是怎么做的&#xff0c;让你对谷歌留痕技术有一个全面的了解。 本文由光算创作&#xff0c;有可能会被修改和剽窃&#xff0c;我们佛系对待这样的行为吧。 谷歌搜索留痕快速收录怎么做出来的&#xff1f; 答案是&#xff1a;通过谷歌蜘蛛…

C语言-结构体对齐

详细说明参考博客 (1条消息) C语言结构体对齐&#xff0c;超详细&#xff0c;超易懂_haozigegie的博客-CSDN博客 (1条消息) #pragma pack详解_OuJiang2021的博客-CSDN博客_#pragma pack 以下个人理解总结 出现结构体对齐考虑的根本原因就是&#xff1a;【数据存取执行效率】…

Openwrt中动态IPV6 防火墙的正确设置方法

环境&#xff1a;光猫桥接公网IPV6 问题&#xff1a;动态IPV6地址不知道怎么设置防火墙 解决办法&#xff1a;模糊匹配前缀&#xff0c;特定后缀 背景&#xff1a;将家中光猫桥接后&#xff0c;获得了公网的IPV6地址&#xff0c;可以从外部用IPV6访问家中的设备&#xff0c;但I…

【AI写作】 机器人流程自动化 介绍 - Robotic Process Automation (RPA) Introduction

写一篇文章介绍RPA技术,未来的发展。使用markdown格式,有3级索引,超过3000字。 某位大师说过的: 任何行业、任何部门都有大量的场景,涉及重复、有规则逻辑的工作,都可以用 RPA 开发一个软件机器人帮助完成。 文章目录 机器人过程自动化(RPA)简介RPA的定义RPA的好处Robo…

【centos7下部署mongodb】

一.安装环境 CentOS7MongoDB4.0.13正式版。 二.下载MongoDB 1.1 官网下载地址&#xff1a;https://fastdl.mongodb.org/linux/mongodb-linux-x86_64-4.0.13.tgz 1.2 将压缩包通过xftp上传到服务器/opt目录&#xff0c;然后解压、改名 三. 配置环境变量及配置文件 3.1配置系…

有限差分法求解不可压NS方程

网上关于有限差分法解NS方程的程序实现不尽完备&#xff0c;这里是一些补充注解 现有的优秀资料 理论向 【1】如何从物理意义上理解NS方程&#xff1f; - 知乎 【2】NS方程数值解法&#xff1a;投影法的简单应用 - 知乎 【3】[计算流体力学] NS 方程的速度压力法差分格式_…

pytorch1.2.0+python3.6

一、说明 pytorch1.2.0python3.6CUDA10.0cudnn7.4.1.5 二、步骤 在conda中创建一个新的虚拟环境 查看一下自己的所有环境 激活虚拟环境 conda activate torch1.2.0 关于cuda和cudnn 1、查看自己电脑系统是10.2版本 http://链接&#xff1a;https://pan.baidu.com/s/1v5cN6…

自学前端,你必须要掌握的3种定时任务

当你看到这篇博客的时候&#xff0c;一定会和狗哥结下不解之缘&#xff0c;因为狗哥的博客里不仅仅有代码&#xff0c;还有很多代码之外的东西&#xff0c;如果你可以看到最底部&#xff0c;看到投票环节&#xff0c;我相信你一定感觉到了&#xff0c;狗哥的真诚&#xff0c;狗…

DateTimeParseException

前端请求为字符串的时间格式2023-02-16 19:19:51&#xff0c;服务端用LocalDateTime类型接收时报解析异常java.time.format.DateTimeParseException: Text 2023-02-16 19:19:51 could not be parsed at index 10方法一&#xff1a;JsonFormat(shape Shape.STRING, pattern &q…

Redis 主从复制-服务器搭建【薪火相传/哨兵模式】

Redis 安装参考文章&#xff1a;Centos7 安装并启动 Redis-6.2.6 注意&#xff1a;本篇文章操作&#xff0c;不能在 静态IP地址 下操作&#xff0c;必须是 动态IP地址&#xff0c;否则最后主从服务器配置不成功&#xff01; 管道符查看所有redis进程&#xff1a;ps -ef|grep re…

Linux->父子进程初识和进程状态

目录 前言&#xff1a; 1. 父子进程创建 2. 进程状态 R(running)状态&#xff1a; S(sleep)状态&#xff1a; D(disk sleep)状态&#xff1a; T(stopped)状态&#xff1a; X(dead)和Z(zombie)状态&#xff1a; 孤儿进程&#xff1a; 前言&#xff1a; 本篇主要讲解关…

同事每天早下班,原来是用了这8个开发工具

引言 工欲善其事必先利其器&#xff0c;说的就是工匠要想更加高效的做事情&#xff0c;就得先将工具变得锋利。那么对于程序员来说同样也是如此&#xff0c;如果要想每天早点下班&#xff0c;就必须借助于一些开发工具来提高自己的工作效率&#xff0c;今天慕枫就给大家总结一…

365智能云打印怎么样?365小票无线订单打印机好用吗?

365智能云打印怎么样&#xff1f;365智能云打印是有赞官方首推的订单小票打印机&#xff0c;荣获2016年有赞最佳硬件服务商。可以实现远程云打印&#xff0c;无需连接电脑&#xff0c;只需通过GPRS流量或者WIFI即可连接&#xff0c;不受地理位置和距离限制。365小票无线订单打印…

关于高并发场景和进程线程协程的一些总结

1、IO复用和线程池哪个好&#xff1f;应用场景&#xff1f; IO复用就是一个线程处理多个客户端连接。如果自己实现的话&#xff0c;就是要不断轮询每个客户端连接&#xff0c;看看有没有事件发生&#xff08;数据到达&#xff09;&#xff0c;即使可以用非阻塞的read函数&…

Python编写GUI界面,实现小说下载器

嗨害大家好鸭&#xff01;我是小熊猫~思路一、数据来源分析二. 代码实现步骤代码实现一、单章小说下载二、整本小说下载三、多线程采集四、采集排行榜所有小说五、搜索小说功能六、GUI界面<center>**&#x1f447;问题解答 源码获取 技术交流 抱团学习请联系&#x1f…