【学习版】WeDataSphere组件容器化部署实战

news/2024/5/15 22:56:54/文章来源:https://blog.csdn.net/qq_34226628/article/details/130789526

WeDataSphere组件容器化部署文档

WeDataSphere是微众银行的大数据开发平台。目前为让用户能够快速体验WeDataSphere所有组件,我们提供一个使用Docker构建的镜像包,里面包括基础组件Hadoop, Spark, Hive, Flink, MySQL。WeDataSphere的组件有DSS,Linkis,Schedulis, Qualitis, Visualis, Exchangis。您只需要准备一台内存大小为32G,磁盘100G的机器,系统推荐使用CentOS或Red Hat,不推荐Ubuntu。按照如下步骤操作就能够在半小时内完成所有服务的部署与使用。

参考文章
WeDataSphere/Docker版本部署指南.md at wds-hadoop2.7.2 · WeBankFinTech/WeDataSphere · GitHub

一、准备工作

  1. 需要准备一台内存大小最少为32G,磁盘大小约为100G的服务器,部署前请确保该服务器上无其他服务在运行,以避免端口冲突

  2. 将Docker安装在服务器

#1.下载docker依赖环境 
yum -y install yum-utils device-mapper-persistent-datalvm2#2.设置docker镜像源 
yum-config-manager --add-repo http://mirrors.aliyun.com/docker-ce/linux/centos/docker-ce.repo   #3.安装docker 
yum makecache fast yum install docker-ce docker-ce-cli containerd.io
##上面的命令systemctl start docker 报错Failed to start docker.service: Unit not found.所以我是用了下面的命令。
yum install docker-ce docker-ce-cli containerd.io#4.启动docker服务 
systemctl start docker  #5.测试服务是否正常启动   
docker run hello-world

docker的安装因网络环境的差异,上述步骤可能无法完全适配,用户可根据实际网络环境安装docker并保证docker可用

  1. 下载WeDataSphere容器化镜像包点我下载

镜像包较大,请在空闲时间下载

  1. 上传镜像包到服务器,或直接在服务器上下载

二、部署步骤

  1. 查看是否存在名称为wedatasphere的镜像,存在的话建议修改已有镜像的名称
docker images
  1. 在服务器上加载镜像包(预计需要五分钟左右)和查看是否加载成功
#加载镜像包 
docker load -i wedatasphere.tar 
#查看是否存在REPOSITORY名称为wedatasphere的镜像 
docker images
  1. 将镜像运行在容器中 (请确保没有相同名称的container在运行)
docker run -itd --name='wedatasphere' --privileged -p 8085:8085 -p 8087:8087 -p 8083:8083 -p 9500:9500 -p 9400:9400 -p 8090:8090 -p 8080:8080 -p 50070:50070 -p 8088:8088 -p 9001:9001 wedatasphere init
  1. 进入容器
docker exec -it wedatasphere /bin/bash
  1. 在容器中切换到hadoop用户和切换目录到/data/docker下
su hadoop
cd /data/docker
  1. 执行脚本docker_start_all.sh,无报错的情况下就可以去登录DSS并使用
sh docker_start_all.sh
  1. 在页面登录的ip为所在服务器的ip,端口为8085,用户名和密码均为hadoop/hadoop

  2. 停止服务可执行docker_stop_all.sh脚本

sh docker_stop_all.sh

三、安装后的效果

  1. 安装的时候会提示输入ip
You can check all server by acessing eureka URL:http://ip:8087
本人的路径就是:http://192.168.19.142:8087/

在这里插入图片描述

合计16个微服务,如下
DSS-APISERVICE-SERVER
DSS-EXCHANGIS-MAIN-SERVER-DEV
DSS-FLOW-ENTRANCE
DSS-FRAMEWORK-ORCHESTRATOR-SERVER-DEV
DSS-FRAMEWORK-PROJECT-SERVER
DSS-GUIDE-SERVER
DSS-SCRIPTIS-SERVER
DSS-WORKFLOW-SERVER-DEV
LINKIS-CG-ENGINECONNMANAGER
LINKIS-CG-ENTRANCE
LINKIS-CG-LINKISMANAGER
LINKIS-MG-EUREKA
LINKIS-MG-GATEWAY
LINKIS-PS-PUBLICSERVICE
STREAMIS-SERVER
VISUALIS-DEV
  1. 安装的时候会提示输入ip
You can check all server by acessing eureka URL:http://ip:8087
本人的路径就是:http://192.168.19.142:8087/

四、Docker版本使用指南

本文档主要介绍在使用Docker镜像包启动WeDataSphere所有组件后该如何使用

需要注意,由于镜像中部署的Hadoop, Spark等基础组件均是单节点的,稳定性必然不高,因此Docker版本无法用于生产

  1. 容器中各组件安装包均在/data/docker/Install目录下,除Streamis的配置文件在/data/docker/Install/streamis/streamis-server/conf目录,其他组件配置文件均在/data/docker/config目录下,日志均在/data/docker/logs目录,

  1. Linkis和Visualis的前端包分别在目录/data/docker/Install/web/dss/linkis和/data/docker/Install/web/dss/visualis;DSS前端包在/data/docker/Install/web/dist;Schedulis前端包在/data/docker/Install/schedulis/schedulis-web/;Qualitis前端包在目录/data/docker/config/qualitis/dev/static;Exchangis前端包在目录/data/docker/Install/exchangis/frontend;Streamis前端包在/data/docker/Install/streamis/streamis-server/frontend

  1. 镜像中提供了两个简单Demo项目TestDemoDocker和TestStreamis,用户登录后选择首页在默认工作空间bdapWorkspace下能够看到

  1. 项目TestDemoDocker中有工作流TestDemo,该工作流主要包含DataSphereStudio中常用的节点,您可以选择执行并查看执行结果,并且可以将该工作流发布到调度中心,再从左侧菜单栏进入Schedulis调度中心,查看发布过去的工作流,对其进行调度

  1. 项目TestStreamis是流式生产中心的Demo,您打开项目后需要在从开发中心切换到流式生产中心,启动作业名称为flink-cdc的作业。该作业的功能是读取数据库streamis_test中表streamis_source_table的binlog信息,写到表streamis_sink_table中

  1. 除已有的两个项目外,您也可以选择自己创建项目和工作流,进行简单测试和演示,但是需要主要的是由于基础引擎对资源要求较高,若部署镜像的机器可用内存只有32G,执行复杂的任务会出现OOM异常

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.luyixian.cn/news_show_492587.aspx

如若内容造成侵权/违法违规/事实不符,请联系dt猫网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

【动态规划专栏】--基础-- 动态规划经典题型

目录 动态规划 动态规划思维(基础) 状态表示(最重要) 状态转移方程(最难) 初始化(细节) 填表顺序(细节) 返回值(结果) 1、第 …

[山海关crypto 训练营 day17]

[HNCTF 2022 WEEK3]pnearq 题目代码和数据 from Crypto.Util.number import * from gmpy2 import next_prime from flag import flagp getPrime(1024) q next_prime(p) n p*q e 0x10001 c pow(bytes_to_long(flag), e, n) print(f"n {n}") print(f"c {…

代理、正向代理与反向代理

一、代理 1.1 什么是代理 代理也被叫做网络代理,是一种比较特殊的网络服务,允许一个终端(通常指客户端)通过这个服务与另一个终端(通常指服务器端)进行非直接的连接。例如:一些网关、路由器等…

队列的实现(附含两道经典例题)

🍉文章主页:阿博历练记 📖文章专栏:数据结构与算法 🚍代码仓库:阿博编程日记 🍥欢迎关注:欢迎友友们点赞收藏关注哦🌹 文章目录 🌾前言🎬队列&…

[web安全原理分析]-XXE漏洞入门

前言 XXE漏洞 XXE漏洞全称(XML External Entity Injection)即xml外部实体注入漏洞,XXE漏洞发生在应用程序解析XML输入时,没有禁止外部实体的加载,导致可加载恶意外部文件,造成文件读取、命令执行、内网端口扫描、攻击内网网站、…

国内IEEEXplore访问加速(adblock)

访问IEEEXplore,需要加载一个网页需要等好久,然后才出来,就很奇怪,查到网上有同样这个问题 感谢原博主:ieeexplore加载慢的解决办法 核心原因: 国内无法访问地址: https://cdn.jwplayer.com/…

Redis数据结构——QuickList、SkipList、RedisObjective

承接上文,本文主要介绍QuickList、SkipList、RedisObjective 四、 Redis数据结构-QuickList 问题1:ZipList虽然节省内存,但申请内存必须是连续空间,如果内存占用较多,申请内存效率很低。怎么办? ​ 答&a…

C++入门篇---(命名空间、缺省参数、以及输入、输出)

前言 c 我来了,恭喜牛牛解锁新世界.开启c的学习之旅. 🎈个人主页:🎈 :✨✨✨初阶牛✨✨✨ 🐻推荐专栏: 🍔🍟🌯C语言进阶 🔑个人信条: 🌵知行合一 🍉本篇简介:>:讲解C…

pg事务:子事务

什么是子事务? 一般事务只能整体提交或回滚,而子事务允许部分事务回滚。 SAVEPOINT p1 在事务里面打上保存点标记。不能直接提交子事务,子事务也是通过事务的提交而提交。不过可以通过ROLLBACK TO SAVEPOINT p1回滚到该保存点。 子事务在大…

【场景方案】如何去设计并二次封装一个好用的axios,给你提供一个好的参考(1.0版)

文章目录 前言文件结构建议封装的文件结构接口管理文件 二次封装axios的初始配置initutilswebConfig 再封一层环境配置使用 前言 以下演示基于vue3与element-plus 文件结构建议 封装的文件结构 把二次封装axios所有有关的代码全部放在request文件夹中,其中init.js…

【TypeScript】TS中type和interface在类型声明时的区别

🐱 个人主页:不叫猫先生 🙋‍♂️ 作者简介:2022年度博客之星前端领域TOP 2,前端领域优质作者、阿里云专家博主,专注于前端各领域技术,共同学习共同进步,一起加油呀! 💫优质专栏:vue3+vite+typeScript从入门到实践 📢 资料领取:前端进阶资料可以找我免费领取 …

南京邮电大学算法与设计实验二:贪心算法(最全最新,与题目要求一致)

三、实验原理及内容 实验原理: 1、用贪心法实现求两序列的一般背包问题。要求掌握贪心法思想在实际中的应用,分析一般背包的问题特征,选择算法策略并设计具体算法,编程实现贪心选择策略的比较,并输出最优解和最优解值。…

机器学习项目实战-能源利用率 Part-4(模型构建)

博主前期相关的博客可见下: 机器学习项目实战-能源利用率 Part-1(数据清洗) 机器学习项目实战-能源利用率 Part-2(探索性数据分析) 机器学习项目实战-能源利用率 Part-3(特征工程与特征筛选) 这…

【JVM】6. 堆

文章目录 6.1. 堆(Heap)的核心概述6.1.1. 堆内存细分6.1.2. 堆空间内部结构(JDK7)6.1.3. 堆空间内部结构(JDK8) 6.2. 设置堆内存大小与OOM6.2.1. 堆空间大小的设置6.2.2. OutOfMemory举例 6.3. 年轻代与老年…

如何在IDEA中显示时序图

如何在IDEA中显示时序图 有时候,我们想要了解代码的运行过程的时候,想要看到方法的调用流程。 这个时候就希望有一个时序图可以看,但是人工来画时序图太麻烦了,有没有办法在IDEA中直接生成呢? 当然是可以的。 这里…

知识积累(1)

(1) 当您在Git中看到消息 "HEAD is now at 1343ccb FAB-17419 Fix off_chain_data sample error (#146)" 时,这是Git告知您当前所在的分支和最新的提交哈希。 这条消息通常出现在使用Git命令后,如git pull或git check…

【我的创作纪念日】—— 纪念四年的坚持

这是一篇和技术无关的博客,但对我而言,它承载了不菲的价值 普通且宁静的一天,被一条消息戳中,于是,写一篇分享帖,纪念我这 1460 天的坚持初衷: 前言:对过去的回顾 4 年前的我&#…

Python图片转字符画,太好玩啦(46)

小朋友们好,大朋友们好! 我是猫妹,一名爱上Python编程的小学生。 和猫妹学Python,一起趣味学编程。 今日主题 什么是字符画呢? 如何用Python将图片转为字符画? 我们先找一幅原画,比如它吧&…

卡方检验.医学统计实例详解

卡方检验是一种常用的假设检验方法,通常用于分析两个或多个分类变量之间的关系。在医学研究中,卡方检验被广泛应用于分析两种或多种治疗方法的疗效,或者分析某种疾病的发病率与某些危险因素之间的关系。下面我们来看一个卡方检验在医学实例中…

WALN网络不存在? 离谱事件解决方法

前情: 本来在高高兴兴赶ddl,突然发现网断了。尝试重连,显示无法连接... 遂重启,结果事情更糟了,WALN就没了,没了,没了... 这张是修好之后的图,但是当时所有包括蓝牙,waln…