项目实现：电商网站日志分析平台（二:采集日志数据）

news/2024/5/15 11:41:49/文章来源:https://blog.csdn.net/weixin_57821489/article/details/121944604

本篇为第二篇，剩余请移步主页查看

第二步：采集日志数据
准备工作：
（1）开启3台虚拟机
（2）3台虚拟机用xshell启动zookeeper
在这里插入图片描述

在这里插入图片描述
（3）3台启动Hadoop
在master群起后jps查看节点
在slave1查看节点：

在这里插入图片描述 在slave2查看节点：
1.创建/home/hadoop/web_log目录，使用以下命令：

mkdir /home/hadoop/web_log

在这里插入图片描述
2.进入/home/hadoop/web_log目录，使用以下命令：

cd /home/hadoop/web_log/

在这里插入图片描述
3.创建nginx_memory_hdfs.properties文件，编辑文件使用以下命令：

vim nginx_memory_hdfs.properties

在这里插入图片描述
填写以下内容：

# agent 起个名字叫做 a1
# 设置 a1 的 sources 叫做 r1
a1.sources = r1# 设置 a1 的 sinks 叫做 k1
a1.sinks = k1# 设置 a1 的 channels 叫做 c1
a1.channels  = c1# 设置 r1 的类型是 exec，用于采集命令产生的数据
a1.sources.r1.type = exec# 设置 r1 采集 tail -F 命令产生的数据
a1.sources.r1.command= sudo tail -F /var/log/nginx/access.log# 设置 c1 的类型是 memory
a1.channels.c1.type = memory# 设置 c1 的缓冲区容量
a1.channels.c1.capacity = 1000
a1.channels.c1.transactionCapacity = 100# 设置 k1 的类型是 hdfs
a1.sinks.k1.type = hdfs# 设置 k1 输出路径，按照时间在 hdfs 上创建相应的目录
a1.sinks.k1.hdfs.path = /web/log/%y-%m-%d/%H
a1.sinks.k1.hdfs.filePrefix = events-# 设置 k1 输出的数据保存为文本
a1.sinks.k1.hdfs.fileType = DataStream
a1.sinks.k1.hdfs.writeFormat = Text# 把时间戳放入数据的头中
a1.sinks.k1.hdfs.useLocalTimeStamp = true# 设置 r1 连接 c1
a1.sources.r1.channels = c1# 设置 k1 连接 c1
a1.sinks.k1.channel = c1

4.使用nginx_memory_hdfs.properties文件启动flume，使用以下命令：

flume-ng agent -n a1 -c conf -f /home/hadoop/web_log/nginx_memory_hdfs.properties

在这里插入图片描述 在浏览器进去http://ip/shop.html后在master使用以下命令监控访问日志：

sudo tail -F /var/log/nginx/access.log

在这里插入图片描述
5.在hdfs检查日志数据是否采集到/web/log目录

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.luyixian.cn/news_show_904953.aspx

如若内容造成侵权/违法违规/事实不符，请联系dt猫网进行投诉反馈email:809451989@qq.com，一经查实，立即删除！

项目实现：电商网站日志分析平台（二:采集日志数据）

相关文章

项目实现：电商网站日志分析平台（三：etl数据清洗）

项目实现：电商网站日志采集（四.搭建数据仓库）

项目实现：电商网站日志采集系统（五：保存分析结果）

项目实现：电商网站日志采集系统（六：定时任务）

C语言网站开发测试 WAMP配置CGI

百度SEO浏览器插件开发，能够实时显示百度搜索排名的一款插件 seo.lantianye3.top出品

用python和flask开发的一个极简约高效率自定义导航网站小邱导航 lantianye3.top大家看看

一个可以在线播放解析m3u8,mp4的网站 m3u8player.lantianye3.top

网站推广--我是站长我怕谁

同一网站不同和二级域名和不同子目录的cookie

了解facebook网站框架技术-LAMP

《大型网站系统与Java中间件实践》读后感

大型网站架构系列：分布式消息队列（一）

大型网站架构系列：消息队列（二）

基于Vue+Element-ui+Laravel的牙齿矫治器定制厂家网站

大型网站架构之分布式消息队列

个人网站的简易数据分析

YSLOW测测网站速度

网站接入QQ登录

基于SSM（Spring+SpringMVC+MyBatic）+JSP的少儿编程教育网站管理系统