项目实现:电商网站日志分析平台(二:采集日志数据)

news/2024/5/15 11:41:49/文章来源:https://blog.csdn.net/weixin_57821489/article/details/121944604

本篇为第二篇,剩余请移步主页查看

第二步:采集日志数据
准备工作:
(1)开启3台虚拟机
(2)3台虚拟机用xshell启动zookeeper

在这里插入图片描述

在这里插入图片描述
在这里插入图片描述(3)3台启动Hadoop
在master群起后jps查看节点

在这里插入图片描述在slave1查看节点:

在这里插入图片描述在slave2查看节点:
在这里插入图片描述1.创建/home/hadoop/web_log目录,使用以下命令:

mkdir /home/hadoop/web_log

在这里插入图片描述
2.进入/home/hadoop/web_log目录,使用以下命令:

cd /home/hadoop/web_log/

在这里插入图片描述
3.创建nginx_memory_hdfs.properties文件,编辑文件使用以下命令:

vim nginx_memory_hdfs.properties

在这里插入图片描述
填写以下内容:

# agent 起个名字叫做 a1
# 设置 a1 的 sources 叫做 r1
a1.sources = r1# 设置 a1 的 sinks 叫做 k1
a1.sinks = k1# 设置 a1 的 channels 叫做 c1
a1.channels  = c1# 设置 r1 的类型是 exec,用于采集命令产生的数据
a1.sources.r1.type = exec# 设置 r1 采集 tail -F 命令产生的数据
a1.sources.r1.command= sudo tail -F /var/log/nginx/access.log# 设置 c1 的类型是 memory
a1.channels.c1.type = memory# 设置 c1 的缓冲区容量
a1.channels.c1.capacity = 1000
a1.channels.c1.transactionCapacity = 100# 设置 k1 的类型是 hdfs
a1.sinks.k1.type = hdfs# 设置 k1 输出路径,按照时间在 hdfs 上创建相应的目录
a1.sinks.k1.hdfs.path = /web/log/%y-%m-%d/%H
a1.sinks.k1.hdfs.filePrefix = events-# 设置 k1 输出的数据保存为文本
a1.sinks.k1.hdfs.fileType = DataStream
a1.sinks.k1.hdfs.writeFormat = Text# 把时间戳放入数据的头中
a1.sinks.k1.hdfs.useLocalTimeStamp = true# 设置 r1 连接 c1
a1.sources.r1.channels = c1# 设置 k1 连接 c1
a1.sinks.k1.channel = c1

4.使用nginx_memory_hdfs.properties文件启动flume,使用以下命令:

flume-ng agent -n a1 -c conf -f /home/hadoop/web_log/nginx_memory_hdfs.properties

在这里插入图片描述在浏览器进去http://ip/shop.html后在master使用以下命令监控访问日志:

sudo tail -F /var/log/nginx/access.log

在这里插入图片描述
5.在hdfs检查日志数据是否采集到/web/log目录
在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.luyixian.cn/news_show_904953.aspx

如若内容造成侵权/违法违规/事实不符,请联系dt猫网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

项目实现:电商网站日志分析平台(三:etl数据清洗)

本篇为第三篇,剩余请移步主页查看 本篇需要eclipse 三.Etl数据清洗 (1)在eclipse连接Hadoop,通过xshell进行连接,并进行Hadoop可视化 (2)在eclipse创建Etl mapreduce项目 &#…

项目实现:电商网站日志采集(四.搭建数据仓库)

本篇为项目第4步,详情请移步主页 四.搭建数据仓库 数仓搭建分为 Ods(数据运营层)数据原始层,最接近数据源中数据的一层 Dwd(数据仓库层)从ODS获得数据建立数据模型 DWB:data warehou…

项目实现:电商网站日志采集系统(五:保存分析结果)

(1)使用管理员账户和密码登录MySQL,使用以下命令: mysql -u debian-sys-maint -p(2)创建web_log数据库,使用以下命令: CREATE DATABASE IF NOT EXISTS web_log;(3)创建web_log用户,设置密码为…

项目实现:电商网站日志采集系统(六:定时任务)

本篇为项目结尾,详细请移步主页 六.定时任务 编辑定时任务,使用以下命令: Crontab -e 如图:输入3 写入以下内容: 10 * * * * /home/hadoop/web_log/web_log_import.sh 15 * * * * /home/hadoop/web_log/…

C语言网站开发测试 WAMP配置CGI

CGI是什么&#xff1f; // C_Web.cpp : 定义控制台应用程序的入口点。 //#include "stdafx.h"int _tmain(int argc, _TCHAR* argv[]) {printf("Content-Type:text/html;charsetgbk\r\n\n");printf("<font colorred>hello ptspzy</font>&…

百度SEO浏览器插件开发,能够实时显示百度搜索排名的一款插件 seo.lantianye3.top出品

今天给大家分享一款本人写的能够实时显示百度搜索结果页面排名的插件&#xff0c;主要是因为做SEO需要经常查询网站关键词的排名&#xff0c;但是如果排名如果不在前几页的话&#xff0c;查询起来就比较费时间了&#xff0c;得一个个数。有了这个插件&#xff0c;网站排名实时显…

用python和flask开发的一个极简约高效率自定义导航网站 小邱导航 lantianye3.top大家看看

网站用python和flask开发 学python时间也不长 做个小项目练练手 主要功能有这些&#xff1a; 1.分类导航&#xff1a;导航网站最重要的是网址导航&#xff0c;小邱导航可以让用户分类别添加网站导航&#xff0c;还可以设置网站的图标等信息。 2.个性化设置&#xff0c;用户可以…

一个可以在线播放解析m3u8,mp4的网站 m3u8player.lantianye3.top

自己写的一个可以在线播放m3u8的网页&#xff0c;在这里分享一下。借助m3u8 player网页播放器&#xff0c;只需将您的M3U8文件地址或者mp4链接复制粘贴到播放器地址栏中然后点击播放即可。 网站 http://m3u8player.lantianye3.top/ 如有不足&#xff0c;多多指教。 首页截图&am…

网站推广--我是站长我怕谁

辛辛苦苦&#xff0c;捣鼓了个把月&#xff0c;个人网站&#xff08;www.tiantianfilm.com&#xff09;终于上线见光了&#xff0c;寄予厚望的网站&#xff0c;希望不是见光死。 网站主推在线电影&#xff0c;整个架构采用前后台形式&#xff0c;前台展示发布的电影信息&#x…

同一网站不同和二级域名和不同子目录的cookie

1、cookie二级域名的实现: 用户其中一个站点登录&#xff0c;而且可以各个子频道间切换&#xff0c;保持登录状态设置Cookie时&#xff0c;使用如下代码即可&#xff1a; setcookie(name,value,expire,path,"domain.com"); 这样&#xff0c;在每个二级域名都能读取这…

了解facebook网站框架技术-LAMP

网址: http://www.dbanotes.net/arch/facebook_arch_note.html 作者: Fenng | 设计原则 尽可能的使用开源软件&#xff0c;并且在需要优化的时候进行优化Unix 哲学。包括&#xff0c;模块化原则&#xff1b;整合化原则&#xff1b;清晰化原则等任何组件具备扩展性最小化故障…

《大型网站系统与Java中间件实践》读后感

《大型网站系统与Java中间件实践》读后感 这几天逛ITEYE&#xff0c;首页老提示新书有奖试读活动&#xff0c;我是看了看书单&#xff0c;正好第一本书就是我最近看完的《大型网站系统与Java中间件实践》。不在乎奖不奖&#xff08;最多送本书&#xff0c;不过我已经买了&#…

大型网站架构系列:分布式消息队列(一)

以下是消息队列以下的大纲&#xff0c;本文主要介绍消息队列概述&#xff0c;消息队列应用场景和消息中间件示例&#xff08;电商&#xff0c;日志系统&#xff09;。 本次分享大纲 消息队列概述消息队列应用场景消息中间件示例JMS消息服务&#xff08;见第二篇&#xff1a;大型…

大型网站架构系列:消息队列(二)

本文是大型网站架构系列&#xff1a;消息队列&#xff08;二&#xff09;&#xff0c;主要分享JMS消息服务&#xff0c;常用消息中间件&#xff08;Active MQ&#xff0c;Rabbit MQ&#xff0c;Zero MQ&#xff0c;Kafka&#xff09;。【第二篇的内容大部分为网络资源的整理和汇…

基于Vue+Element-ui+Laravel的牙齿矫治器定制厂家网站

BlueTooth 蓝牙医疗-后台管理 项目简介 本项目的应用场景是某牙齿矫治器定制厂家的网站&#xff0c;其功能目的是提供牙医与厂家的交互平台&#xff0c;网站涉及三个角色&#xff1a;游客、牙医、专家(网站管理员)。 根据需求&#xff0c;专家和网站管理员的功能具有高度相似…

大型网站架构之分布式消息队列

以下是消息队列以下的大纲&#xff0c;本文主要介绍消息队列概述&#xff0c;消息队列应用场景和消息中间件示例&#xff08;电商&#xff0c;日志系统&#xff09;。 本次分享大纲 消息队列概述消息队列应用场景消息中间件示例JMS消息服务常用消息队列参考&#xff08;推荐&…

个人网站的简易数据分析

大数据时代&#xff0c;不会一点数据分析总觉得会被时代淘汰。但是&#xff0c;数据分析看起来很难的样子&#xff0c;每个人都能学会吗&#xff1f;就笔者个人观点来看&#xff0c;数据分析要做的深&#xff0c;的确不容易&#xff0c;涉及到许多的工具和模型建设。但仅仅只是…

YSLOW测测网站速度

一个网站打开的速度有多快?除了机房带宽,线路,IP级别,等不能或不好改变的因素外,跟网站本身的程序也有很大关系,这里谈谈一个测试工具,YSLOW,测测网站的内部因素以提升用户的访问速度; YSLOW是FIREFOX的一个插件,所以必须先装FIREFOX,下载地址http://www.mozilla.org.cn YSL…

网站接入QQ登录

在网站接入QQ登录时遇到很多麻烦&#xff0c;主要是QQ互联和腾讯开放平台的关系比较乱&#xff0c;不知道要从哪个接入。 最终解决方式&#xff1a;在腾讯开放平台注册个人开发者&#xff0c;验证通过后&#xff0c;在QQ互联平台会有腾讯开放平台的注册信息&#xff0c;然后依次…

基于SSM(Spring+SpringMVC+MyBatic)+JSP的少儿编程教育网站管理系统

项目背景 在国家重视教育影响下&#xff0c;教育部门的密确配合下&#xff0c;对教育进行改革、多样性、质量等等的要求&#xff0c;使教育系统的管理和运营比过去十年前更加理性化。依照这一现实为基础&#xff0c;设计一个快捷而又方便的网上少儿编程教育网站系统是一项十分…