MySQL查询用户行为,网站用户行为分析

news/2024/5/10 4:48:26/文章来源:https://blog.csdn.net/weixin_39557087/article/details/115927465

网站用户行为分析

步骤

1.1 本地数据集上传到数据仓库Hive

数据集下载与查看

数据集预处理

把数据集导入HDFS中

在Hive上创建数据库

37653db8fef5625f8eaa111808337e0b.png

ddef114db9bbb9e46f65f9e76c79de22.png

234a9cb7dfa1508cd3965979679b6c0c.png

b0a75c3615d71556ab17e7ff0b310bd1.png

d6857b816f9e2fbf0d78a81435718968.png

2a921f566d3cc97720fd50a761622b51.png

1.2 Hive数据分析

给出数据分析需求

用select语句实现数据分析

数据分析结果查看与保存

1.3 Hive、MySQL、HBase数据互导

Hive数据分析结果(如用户购买与浏览比例),从Hive传输到MySQL中。

Hive数据分析结果(如用户购买与浏览比例),从MySQL传输到Hbase中。

参照博客步骤,依次将user_action传入Hive、MySQL、HBase中。

http://dblab.xmu.edu.cn/blog/1059-2/

4bfb83ad647f22458a8bdeb54345ed2d.png

474ed168ed81f1e5d7b80b8e4e81e790.png

14cfba303fa3bd87b5125b2548c59709.png

(1)用户行为分析需求:2014-12-11~12号有多少条购买商品的记录

分析步骤

语句:select count(*) from bigdata_user where visit_date >'2014-12-10' and visit_date

结果截图:运行或存为表格后的查询显示

0e2647f7f46192b3835031582073b29f.png

(2)用户行为分析需求:分析每月1-31号购买情况

语句:代码:select count(distinct uid),month(visit_date) from bigdata_user where behavior_type='4' group by month(visit_date) limit 10;

结果截图:运行或存为表格后的查询

a63a61d76842a26117b67482647cb2a0.png

(3)按某一特殊日期(如双12)进行用户行为分析

各省份购买商品数量

商品购买与浏览比例

用户活跃度分析

购买5件以上商品的用户

d01dcfd6affcce741179be607fa633da.png

a0a2ae111609c53328dc4624d949ce85.png

546546356ce6cd5d7caadf308350032b.png

(4)用户购买与浏览比例。

1.计算拥护购买数与浏览数的比值。

2.创建表格保存结果

49d3492b22d493fc94b556b9e897de46.png

300c3f9f5a679c66fa5da486ed45e4f2.png

标签:数据分析,网站,visit,用户,Hive,购买,MySQL,行为

来源: https://www.cnblogs.com/yeliqin/p/14242702.html

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.luyixian.cn/news_show_714613.aspx

如若内容造成侵权/违法违规/事实不符,请联系dt猫网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

linux子系统gdp调试,GDB调试命令_Linux编程_Linux公社-Linux系统门户网站

1、查看源码:list [函数名][行数]2、暂停程序(1)设置断点:a、break [源代码行号][源代码函数名][内存地址]b、break ... if condition ...可以是上述任一参数,condition是条件。例如在循环体中可以设置break ... if i 100 来设置循环次数(…

c底层用什么网站编写服务器,c编写服务器

c编写服务器 内容精选换一换简要介绍clang是一个C编写、基于LLVM、发布于LLVM BSD许可证下的C/C/Objective-C/Objective-C编译器。语言:C一句话描述:C/C/Objective-C/Objective-C编译器开源协议:Apache License Version 2.0建议的版本建议使用…

程序员经常访问的技术网站

作为一个工作几年的程序员,分类总结一下经常会访问的技术网站。 一.项目源码 (1).Github 代码托管 GitHub的使用可是程序员在职业生涯中技能必不可少的技能。它可以做Git代码托管平台,很多开源项目都放在Github上,因此我们就可以借鉴别人的…

好看的网站主页截图

好看的网站主页截图 总结 1、大图大气 2、网站界面好,用好图 截图 这个网站的美工挺不错的,但是这样东西并不难做啊 大图,大气

挖一挖那些让公司网站瘫痪的SQL“终结者”

IT实战联盟博客:http://blog.100boot.cn 一条慢查询会造成什么后果?之前我一直觉得不就是返回数据会慢一些么,用户体验变差? 其实远远不止,我经历过几次线上事故,有一次就是由一条 SQL 慢查询导致的。 那…

大型网站架构系列:缓存在分布式系统中的应用(三)

https://mp.weixin.qq.com/s/TrPlYj-3ymiLCIK8dQEiEw 上次主要给大家分享了,缓存在分布式系统中的应用,主要从不同的场景,介绍了CDN,反向代理,分布式缓存,本地缓存的常规架构和基本原理。 因为时间关于&a…

大型网站应用之海量数据和高并发解决方案总结一二!

https://mp.weixin.qq.com/s?__bizMzUxOTAxODc2Mg&mid2247483781&idx3&sn19959b3978281e9bcadd7d19d8ecc178&chksmf98141e0cef6c8f6d6d53da7886906308660b6aa820f5d1fc2b55721db23ce9bfa73fe128a44&scene21#wechat_redirect 作者:徐刘根 | …

千万级用户的大型网站,应该如何设计其高并发架构?(彩蛋)

转发自今日头条 目录 (1)单块架构 (2)初步的高可用架构 (3)千万级用户量的压力预估 (4)服务器压力预估 (5)业务垂直拆分 (6)用…

一个开源vue网站博客,nuxt开源网站,前后端分离项目

unNue.com 开媛笔记,基于nuxt ssr首屏服务器端渲染 。用于分享、记录、交流和学习,希望可以帮助到小伙伴们。同时网站在不断更新,创造属于猿(媛)的世界 -$Bao Yalong ..Lets Go! https://unnue.com 简述 前端 Github地…

怎样将优酷网站下载的视频KUX转MP4格式

在休息之余,相信大多数人都会拿手机看电视剧听音乐之类的,最近拍了很多的新片子:《毒液:致命守护者》、《无名之辈》、《亡命救赎》《影》等等优质电影,但是很多的电影都只能在电影院观看的,如果不去电影院…

网站关键词编写方法,注意事项。

1.Title标签&#xff1a; 即网站标题&#xff08;沙发超人&#xff09;&#xff0c;指的是目标关键词或者主关键词在源代码中的表现形式。 代码格式1&#xff1a;<title>关键词1_关键词2_关键词3 – 网站的品牌</title> &#xff08;常用格式&#xff09; 代码格式…

分享一些省心的PPT模板下载网站资源(附5G优质PPT模板)

每次需要做PPT时&#xff0c;总是为找省心的模板二发愁&#xff0c;用搜索引擎搜索“免费PPT模板”时&#xff0c;展示出的大量所谓“免费”的网站。心动的点开一个后&#xff0c;最终却是&#xff1a;开通会员才免费&#xff0c;满满的套路 现在我们急需那些&#xff0c;省去搜…

network 关于PV,网站访问量和服务器带宽的选择

网站用户访问流量图 对于PV&#xff0c;流量和带宽的理解&#xff0c;可以分成几个问题可能更加容易理解 问题1&#xff1a;首先什么是PV 技术角度讲,1个PV是指从浏览器发出一个对网络服务器的Request 网络服务器接到Request之后会开始把该Request对应的一个Page &#xff08…

[IIS网站问题]设置防火墙协议及端口等问题

如果AppWeb网站通过域名公开访问,请选择 域 ;如果AppWeb网站只通过类似 http://192.168.3.107:6789 局域网访问,选择 专用 即可。如果实在搞不懂这个规则,就全选即可。见下图: 另外,名称可以自由定义.

小型的搜索引擎设计_广州网站设计工作室-赛致信息科技

很多人都在为自己企业的网站而发愁&#xff0c;担心的就是自己企业的网站做不好&#xff0c;在开始做网站的时候就很犹豫&#xff0c;不知道究竟该选择哪家网站建设好点&#xff0c;造成这一现状的根本原因就是现在网站建设的行业鱼龙混杂&#xff0c;让很多企业迷茫不知所措&a…

iis10 asp 如何连接mdb_网站500内部服务器错误如何解决 - 最蜘蛛池

原出处&#xff1a;最蜘蛛池原文链接&#xff1a;网站500内部服务器错误如何解决&#xff1f; - 最蜘蛛池在SEO工作过程中&#xff0c;我们偶尔会遇到http500内部服务器错误&#xff0c;这样的问题&#xff0c;它是一个明显的http状态码&#xff0c;它告诉站长&#xff0c;你的…

linux svn服务的维护,Linux服务器搭建svn环境方法详解_网站服务器运行维护,Linux,svn...

关于nginx location指令详解_网站服务器运行维护^~ 开头,注意这不是一个正则表达式(是提升优先级的字符串匹配)–它的目的是优先于正则表达式的匹配。如果该location是最佳匹配&#xff0c;则不再进行正则表达式检测。下面由Linux教程栏目给大家介绍Linux服务器搭建svn环境的方…

如何找到网站服务器的源代码_如何花3-5分钟找到网站Bug?

如何使用GA审核网站&#xff1f;只需7个步骤&#xff08;以下为问题形式出现&#xff09;&#xff0c;就会快速查出哪里出现了问题。1、网站上有损坏的页面吗&#xff1f;操作概览&#xff1a;行为>网站内容>页面标题维度&#xff0c;过滤“找不到页面”如果访问者访问错…

搜索引擎提交软件_网站如何被搜索引擎快速收录?

搭建好了你自己的网站&#xff0c;一定会有一个疑问&#xff0c;怎么让网站被搜索引擎快速收录&#xff1f;别人可以在搜索引擎搜到你的网站呢&#xff1f;我们总说怎么优化网站&#xff0c;怎么优化关键词&#xff0c;目的都是为了提升排名&#xff0c;提高网站在搜索引擎的收…

提高网站性能之 —— 减少图片HTTP 请求的方案

《Higb Performance Web Sites》&#xff08;中文名&#xff1a;“高性能网站建设指南”&#xff09;这本书对于前端工程师来说&#xff0c;绝对值得一读。本人有幸从公司借阅了&#xff0c;但不幸的是感觉翻译有点怪怪的。尤其是在翻译CSS Sprites的关键部分&#xff0c;让人不…