基于Elasticsearch构建网站日志处理系统

news/2024/5/10 2:50:05/文章来源:https://blog.csdn.net/weixin_34235135/article/details/85094346

Elasticsearch在离线和在线日志处理场景的应用

日志处理可以分为三个场景,离线场景、在线场景,以及流式场景。今天给大家分享的话题是,如何使用Elasticsearch和X-Pack在离线和在线日志处理场景的应用。
_

日志处理系统架构简介

我们通过搭建网站日志处理系统这个案例来探讨。便于理解,下面是一个简化的网络架构图。

_

导入到Elasticsearch的数据源可以非常多样化,比如各类beats,或者logstash,或者kafka等消息队列。在实际的应用环境中,架构可能非常复杂,维护成本也会非常高。在日志归档和日志搜索场景下,当日志量不大时,可以直接通过beats将服务器日志数据同步到ES里做索引,然后同过Kibana做在线查询或分析。但这样处理的弊端是,无法处理日志数据的结构。而Logstash的filter可以解决这个弊端,Logstash作为通道再将过滤处理后的日志推送到ES。

_
但在日志量不断增大,Logstash的处理压力越来越多,出现性能瓶颈。如果对ES数据做update,会导致数据不停做merge,内存、CPU开销激增,甚至影响到线上业务。所以,在企业级应用中,我们会前置消息队列系统,比如Kafka、MetaQ等。

_

我们再聊聊离线部分,日志处理不仅仅是检索日志这么简单的需求,还有用户画像挖掘等高级的数据探索。这是需要借助Hadoop、MaxCompute等离线计算引擎来来实现底层数据的挖掘。我们来看看整个的处理流程,数据库里面或者其他网络日志,通过离线的数据导入,进入到离线的计算引擎,然后进行数仓模型的加工,最终将数据通过ES-Hadoop插件或者是直接把数据同步到Elasticsearch里面去。

比如我需要搭建一个游戏APP的用户运营分析系统。可能会涉及到几方面的日志:

  • 服务器上面的用户访问行为,
  • SDK里面采集到的用户交互行为,如点击、滑动等操作
  • 记录在关系型数据库里面的用户交易行为
    可以通过如上所述的日志系统搜集和聚合这些散乱在各处的日志,然后索引在Elasticsearch里面,再通过Kibana去做在线行为分析。或者,我通过我本身的应用系统去调它,获取一个用户的模型结构。

利用ES中的Graph功能做数据探索

以手机APP的用户访问数据为例。通过访客关系探索的案例介绍X-Pack的Graph组件的相关功能和配置。Demo短视频:

另一个应用是基于用户协同过滤的个性化推荐。Demo视频即将上线,敬请期待。


阿里云 MVP Meetup 第5期活动视频回顾。点击观看

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.luyixian.cn/news_show_776127.aspx

如若内容造成侵权/违法违规/事实不符,请联系dt猫网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

网站安全检测服务之PHP代码的后台绕过登录漏洞

针对于PHP代码的开发的网站,最近在给客户做网站安全检测的同时,大大小小的都会存在网站的后台管理页面被绕过并直接登录后台的漏洞,而且每个网站的后台被绕过的方式都不一样,根据SINE安全渗透测试多年来经验,来总结一下…

结合案例教你如何做好SEO搜索引擎优化

这是一个很很普通老生常谈的标题,没有任何的吸引力,但是真正能做好的草根站长估计少之又少,我问我一个做了多年草根站长的朋友,我说如何做好SEO搜索引擎优化,他给我的答复是很难,范围太广了,没法…

WAMPServer自定义网站根目录

一、WAMPServer默认的网站根目录是: 如要改成自己想要的网站根目录: 需要将下图中的httpd.conf打开 然后找到DocumentRoot,并改成自己想要的网站根目录(改两个地方),如图: 然后点击图中的Restar…

如何10分钟建立一个网站

1、将网站模板压缩,并以英文名命名,后缀为zip; 2、在服务器中添加站点,并创建数据库 3、文件-上传安装包并解压 4、查看install文件夹中,有没有文件的后缀为.lock字样,如果有将后缀去掉 5、进入安装界面 6、填写数据库…

威运通:信息时代,网站和安全缺一不可。

企业名称:深圳威运通科技有限公司公司行业:化学品工业公司规模:21-50人建站目的:展示企业理念、公司产品、解决方案网址:https://www.hgq99.com/建站产品:云企业官网--阿里云市场自营建站产品 深圳威运通科…

PHP网站打开太慢,如何解决!

如果你们公司的业务是用PHP语言开发的,那么使用的环境十有八九就是LNMP。在日常的运维工作中,占到9成以上的故障是遇到性能问题。 你可能会想,我们的业务运行的好好的,为啥平白无故就出现性能问题? 原因有太多可能&…

企业网站怎么才能防御DDOS***?

昨天一个政府的站长告诉墨者安全,他想要做一个网络安全防护,因为网站设计到了支付这一块的业务,所以要做网络安全防护,想要实时监测,如果有***发生需要第一时间知道情况。墨者安全告诉他可以的,那今天就讲讲…

大型网站技术架构(二)架构模式

2019独角兽企业重金招聘Python工程师标准>>> 每一个模式描述了一个在我们周围不断重复发生的问题及该问题解决方案的核心。这样,你就能一次又一次地使用该方案而不必做重复工作。 所谓网站架构模式即为了解决大型网站面临的高并发访问、海量数据、高可靠…

使用github+hexo搭建自己的博客网站--入门篇

前言 这一篇主要介绍如何使用搭建GitHub.io网站 我自己的网站:https://lijie-1024.github.io 使用hexonext主题GitHub搭建,具体问题可以留言问我。 本篇所包含的内容如下: 正文 一、申请github.io网站 github注册我就不讲了。。。能想到这…

网站服务器改数据库密码忘记了怎么办,服务器数据库密码忘记了怎么办

服务器数据库密码忘记了怎么办 内容精选换一换FTP/SFTP连接适用于从线下文件服务器或ECS服务器上迁移文件到OBS或数据库。当前仅支持Linux操作系统的FTP 服务器。连接FTP或SFTP服务器时,他们的连接参数相同,如表1所示。FTP/SFTP连接参数参数名说明取值样…

python过滤违禁词_网站全站敏感词检测、广告违禁词查询很简单,一个python脚本轻松搞定...

做网站的同学都有一个共同的苦恼:就是自己辛辛苦苦经营的网站,如果内容中涉及色情、暴恐涉政、恶意推广、辱骂、违反广告法、涉及违禁品等文本内容,小则被搜索引擎处罚,严重的可能还会被请去喝茶。还有很多企业站因为编辑的不小心…

echarts案例大全,echarts的Demo网站有哪些

很多开发人员用到echarts做大屏展示,一般常用的网站是 Apache Echarts,但是这个一个网站的demo不一定满足我们,那么除了Apache Echarts还有哪些我们可以用的echarts网站呢? 1.分享你我 网站:分享你我 – ECharts 作…

黑苹果未能与恢复服务器_淘客新事件 09.24 1、某千万用户淘客APP内部腐败案 2、误会,大淘客网站疑似被黑!...

1、某千万用户淘客APP内部腐败案评:某淘客APP在昨天公布了他们自家的内部腐败案!大概就是有离职员工后进入竞品公司,还把原公司开发的云发单源码拷贝复制成自己的软件,并且推广到市场!当然这个不算什么,主要…

python 图片文件_初学Python-只需4步,爬取网站图片(附py文件)

很多人学习Python很重要的一个原因是,可以很简单的把一个网站的数据爬下来。尤其是做我们这一行,产品经理,电商行业。领导:弄一个买卖游戏周边商品的交易APP出来。我:行,那我们卖什么呀?领导&am…

程序员入门必备网站 (技术云集的网站)tutorialspoint

https://www.tutorialspoint.com/index.htm 这个网站是印度的一个IT教学网站 前后端技术,应有尽有,还有数据库学习,这个网站很棒,大家,加油~

轻文章-使用URL Rewrite实现网站伪静态

文章目录基础介绍案例代码urlrewrite.xmluserinf.jsp验证结果注意事项参考文档案例来源:《轻量级Java EE企业应用实战(第4版)-Struts2Spring4Hibernate整合开发》,李刚编著 基础介绍 伪静态的作用:将*.jsp、*.php这种…

阿里云服务器Linux主机搭建网站环境

首先准备好连接linux服务器的工具,推荐用xshell和xftp。 xshell 是一个强大的安全终端模拟软件,它支持SSH1, SSH2, 以及Microsoft Windows 平台的TELNET 协议。 下载地址:http://www.newhua.com/soft/36383.htmXftp 是一个基于 MS windows 平…

linux 画直线 c程序,绘制直线 - Ubuntu+OpenGL程序设计_Linux编程_Linux公社-Linux系统门户网站...

这次主要学习的是关于在opengl中绘制直线,也比较简单现上图吧这图乍一看上去是不是像是一条条弯曲的直线???我开始就把他看成这样了,不过这是个视觉问题,仔细看过起,其实还是一个同心的直线&…

如何得到一个网站的后台地址

一、猜测常见的网站后台 1、http://你的网址/login.asp 2、http://你的网址/admin/login.asp 3、http://你的网址/admin/ /admini/ 二、查看该网站的robots.txt 如:网站为:http://www.mmfi.net/ 在后面添加:robots.txt 得到: …

Eclipse添加J2EE开发功能(网站开发)

添加J2EE 其实很简单啦: 1、打开Eclipse,点击Help 2、选择Install New Software 3、在work with中输入网址:http://download.eclipse.org/releases/ 在下面出现的选项选择自己的Eclipse版本 4、在下面框框中选择“Web,XML,Java EE and OSG…