MySQL百万级高并发网站实战攻略

news/2024/5/9 12:06:26/文章来源:https://blog.csdn.net/weixin_34194551/article/details/91583555

为什么80%的码农都做不了架构师?>>>   hot3.png

在一开始接触PHP接触MYSQL的时候就听不少人说:“MySQL就跑跑一天几十万IP的小站还可以,要是几百万IP就不行了”,原话不记得了,大体就是这个意思。一直也没有好的机会去验证这个说法,一是从没有接手过这么大流量的网站,二是平时工作也比较忙,懒得去管这些,反正现在用不着,抱着这个想法把这个问题一直留到了最近,才把这个问题搞明白。

  就在前几天公司旗下一网站(由于这是公司的商业内容我就不说是那个网站了)以下简称A站,这A站在年后流量猛增从一天的七八十万猛跑到了好几百万的IP,一天下来接近一千万的PV让整个服务器在高压下超负荷的工作着,时不时的服务就出现宕机。

  最首先反映出情况的是数据统计,一天下来一个数据也没有统计上,原来是MySQL停止工作了。

  本文就围绕这个问题来讲讲我们公司几个技术人员的解决方案。

  1. MySQL服务器集群

  由于是小公司在资金和成本上都有所限制,而且在技术上也没有几个技术员接触过,所以这个方法自然就让大伙否决了。

  这里说说我个人的理解!做集群不但添加资费的开销,而且在技术上也有很大的挑战,对于我们公司目前的情况是不大现实的。集群无非就是把一台服务器的压力转接到两台或是多台服务器上,我是这么理解的,也许我理解有误,还请大家指教。

  2. 分而治之

  这个方法和集群差不多,不过是把统计的代码放在不同的服务器上跑,由于公司有不少配置低的服务器跑几万到几十万IP还是没有问题的,我们可以把几百万流量分成十来个几十万的量分而统计。

  优点:充分的利用了现在的资源,解决了目前的问题。

  缺点:这样的方法不是长久之计,迟早还是会出问题的。而且在统计数据的时候比较麻烦。

  3. 统计代码的修改

  由于之前采用的是在插入数据之前加以判断,这个IP是否存在,来路等的处理,无形中增加了服务器的压力,所以大伙把统计代码改成来一个就插入数据库,不管三七二十一等以后在处理。

  这个方法基本上把当天的数据保留下来了,可是在处理的时候由于数据量的庞大,来来回回还是把服务器跑死了,而且在插入的时候由于当时设计数据结构的时候留有的索引,也大大的消耗了不少的服务器资源。

  那么把索引去掉到最后处理的时候又是老慢的,得不偿失。

  4. 统计方式的修改

  最后这一个方法,效果非常的明显。那是什么方法呢!

  这里就主要介绍这个方法:

  A、 保留原用的数据结构不变,并把所有的数据按一定的结构存入文件

  结构:可以是xml,json,也可以是你自己想的任何有规律的数据排放。

  例如:

  1 221.2.70.52,http://www.baidu.com,windowxp\r\n

  2 221.2.70.52,http://www.baidu.com,windowxp\r\n

  写入文件:fopen,fwrite??no 这里介绍一个非常好用的技巧,也许大家都知道,但是像我这样的菜鸟大概都不知道,那就是用error_log,这不是写错误日志的吗?对就是他,非常方便。

  格式:

  1 error_log("内容", 3, "/date.dat");

  这里我就不说他的具体用了,不明白的朋友可以查一下手册。

  B、数据文件的命名

  为什么这里要讲文件的命名呢?如果就一味的把数据的写入文件不作任何的处理那么他和直接插入数据库有多大的区别呢?那么我们所作的一切都是无用功了。

  首先是在时间的利用上:date(‘YmdH’)得到的值是如:2008121112这有什么好入,这样一来这个数据就是一个小时一个文件必免了文件过大,而且不用去判断自动生成。

  IP的应用:由于在很多数据上都是一个IP操作的,所以把相同IP的数据放在一个文件里在后面的处理就非常方便处理。请看后面的介绍,这里我们取IP成三位为文件名字的一部分。

  C、数据的导入处理

  通过以上两位的操作当天的数据会一个不少的保留下来,接下来怎么处理其实并不是很重要了。但是这里还是讲讲我的想法。

  入库前处理:

  前面讲到把IP三位相同的放一个文件就是为了入库前到它们进行处理,首先可以用最笨的方法把数据拆成N个数据。在进行重复数据的删除。

  如果一个IP浏览多页那么PV在这里就可以得到统计,并把访问的页面进行处理,组成新的数据。

  导入方法:

  这里要介绍一下数据的导入方法

  1 $sql="LOAD DATA INFILE '".$file."' INTO TABLE `test` FIELDS TERMINATED BY ',

  ' LINES TERMINATED BY '\r\n'(2 3 `time` , `md5`4 5 )";

  就这一个语句,在导入几十万数据的时候可以说是十分快速的,用法我这里也不过多介绍了,大家有不明白的可以查手册,所以说解决数据库的瓶颈的办法不定要加设备,也不一定要换数据库,只要换一个思路就能解决不少问题。

转载于:https://my.oschina.net/cimu/blog/164134

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.luyixian.cn/news_show_717551.aspx

如若内容造成侵权/违法违规/事实不符,请联系dt猫网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Nginx配置HTTPS证书网站

前提: 1、主机需要先安装openssl 2、编译安装nginx时,要加上--with-http_ssl_module 这个ssl模块 现在开始配置:(我当时配置时,主机已安装了openssl,但编译时没有加载http_ssl_module模块,所以…

全球顶尖的移动交互设计网站集萃 转

2019独角兽企业重金招聘Python工程师标准>>> Android App Patterns http://www.android-app-patterns.com/category/grid Androidux http://androidux.com/ Uxarchive http://www.uxarchive.com/ Lovely UI http://www.lovelyui.com/ Mobile Patterns h…

PHP使用Apache 中的ab 测试网站的压力性能

打开Apache服务器的安装路径(我用的是 WampServer)在bin目录中有一个ab.exe的可执行程序它就是要介绍的压力测试工具。 在Windows系统的命令行下进入ab.exe程序所在目录执行ab.exe程序。注意直接双击无法正确运行。<喎"http://www.2cto.com/kf/ware/vc/" target&q…

网站建设过程中容易被忽略的元素

网站从建设到真正运营&#xff0c;会忽略很多元素。其实一个网站能否达到预期的效果&#xff0c;网站建设与网站优化做好的同时&#xff0c;很关键一点&#xff0c;客户自身的问题。比如我们帮企业建设网站&#xff0c;网站提供的主要服务还是掌握在客户手上。下面福建SEO谈谈网…

Android上PhoneGap打包本地网站和在线网站

谢谢刚子提供这么个社区交流平台&#xff0c;特别感谢刚子提供上传权限&#xff0c; 哈哈&#xff0c;今天也发一个简单的Demo上来上来&#xff0c;给社区贡献一点绵薄之力。最近一直关注移动web开发&#xff0c;更多看的是web开发的程序的效果&#xff0c;还没有深入的去编程或…

利用HTTP Cache来优化网站

原文地址&#xff1a; http://www.cnblogs.com/cocowool/archive/2011/08/22/2149929.html 对于网站来说&#xff0c;速度是第一位的。用户总是讨厌等待&#xff0c;面对加载的Video和页面&#xff0c;是非常糟糕的用户体验。所以如何利用Cache来优化网站&#xff0c;值得深入研…

本土视频网站盈利艰难,海外会是新掘金场吗?

6月22日&#xff0c;爱奇艺会员数量突破1亿人&#xff0c;标志着中国本土视频网站之间的竞争进一步加剧。毕竟随着互联网人口红利消失&#xff0c;未来会员增速将会放慢&#xff0c;在多元化收入难以撑起视频网站成本前&#xff0c;会员制收入将是最重要的营收之一&#xff0c;…

网站漏洞检测之WordPress 5.0.0 修复方案

2019独角兽企业重金招聘Python工程师标准>>> 2019年正月刚开始&#xff0c;WordPress最新版本存在远程代码注入获取SHELL漏洞&#xff0c;该网站漏洞影响的版本是wordpress5.0.0&#xff0c;漏洞的产生是因为image模块导致的&#xff0c;因为代码里可以进行获取目录…

关于大型网站技术演进的思考(六)--存储的瓶颈(6)

2019独角兽企业重金招聘Python工程师标准>>> 在讲数据库水平拆分时候&#xff0c;我列出了水平拆分数据库需要解决的两个难题&#xff0c;它们分别是主键的设计问题和单表查询的问题&#xff0c;主键问题前文已经做了比较详细的讲述了&#xff0c;但是第二个问题我没…

keepalived+LVS实现网站负载均衡和HA

如上图所示&#xff0c;102和103是内网nginx服务器&#xff0c;100和101是边界LB&#xff0c;clinet是1&#xff0c;这个实验是为了实现在LB上虚拟出一个VIP&#xff0c;client通过访问该VIP&#xff0c;来动态负载到两台内网nginx服务器上面来。流量的来回&#xff0c;都需要经…

大型网站的HTTPS实践一:HTTPS协议和原理一

1 前言百度已经于近日上线了全站 HTTPS 的安全搜索&#xff0c;默认会将 HTTP 请求跳转成 HTTPS。本文重点介绍 HTTPS 协议, 并简单介绍部署全站 HTTPS 的意义。2 HTTPS 协议概述HTTPS 可以认为是 HTTP TLS。HTTP 协议大家耳熟能详了&#xff0c;目前大部分 WEB 应用和网站都是…

在github搭建个人网站

2019独角兽企业重金招聘Python工程师标准>>> 在github搭建个人网站 标签&#xff1a;github [TOC] 先搜篇中文博客了解下流程&#xff0c;再根据下面的官方文档按顺序看一遍就差不多了。 这里不得不吐槽windows太垃圾了&#xff0c;linux下三行指令解决的问题&#…

揭秘SEO快排原理

很多的SEOer每天绝大部分的时间都耗在撰写原创文章/伪原创文章以及发布软文外链&#xff0c;更换行业不相关的友链&#xff0c;年复一年&#xff0c;日复一日&#xff0c;关键词的排名依旧排在100名开外-20名以内&#xff0c;心里很是着急。看看同行竞争对手的网站&#xff0c;…

某搜索网站HR校园招聘被怼引争议,为啥危机偏爱30+人士?

豆瓣上有个热帖&#xff0c;网友去参加校园招聘会&#xff0c;某搜索网站HR表示&#xff0c;他们公司平均年龄都很年轻、很阳光&#xff0c;于是有人怼了句“那你们公司年龄大的都去哪里了&#xff1f;”&#xff0c;HR直接懵了。 是啊&#xff01;年纪大的去哪里了&#xff1f…

如何将自己的网站分享到QQ空间,微信,微博等等。

2019独角兽企业重金招聘Python工程师标准>>> 逛一些网站的时候经常会看到右侧挂个分享栏&#xff0c;让用户把自己的站分享到qq空间&#xff0c;微信等等&#xff0c;所以自己也研究了下&#xff0c;把他加到了自己的网站上&#xff0c;喜欢的可以先看看效果&#x…

草根站长这一年用血的教训换来的SEO终极算法

导读&#xff1a;标题言过其实&#xff0c;但是草根站长都有自己真实的故事。我2015年6月1日买的空间和域名&#xff0c;到现在的2016年6月1日正好1年。这篇文章主要讲我这个草根站长这一年用来血的教训换来的SEO终极算法。血的教训1、学习了半个多月网络营销&#xff0c;弃学了…

全球银行网站成黑客主攻目标 阿里云提供安全防御应急方案

2019独角兽企业重金招聘Python工程师标准>>> 近日&#xff0c;阿里云监控发现&#xff0c;匿名者&#xff08;Anonymous&#xff09;组织成员正在发起针对全球中央银行网站的攻击行动&#xff0c;截止目前&#xff0c;国内有超过2家以上的重要网站被攻击&#xff0c…

SpringCloud GateWay 相关图形,文档、网站

一 业务&#xff1a;多个微服务的应用可能部署在不同机房&#xff0c;不同地区&#xff0c;不同域名下。 二 需求&#xff1a;统一入口、路由、权限认证...... 三 解决方案&#xff1a; 1 集群与架构&#xff08;11&#xff09; &#xff08;1&#xff09;逻辑 &#xff0…

Docker相关图形,网站、文档

一 引擎 引擎&#xff08;Engine&#xff09;是电子平台上开发程序或系统的核心组件。 一般而言&#xff0c;引擎是一个程序或一套系统的支持部分。 常见的程序引擎有游戏引擎、搜索引擎、杀毒引擎等。 游戏引擎&#xff1a;就是“用于控制所有游戏功能的主程序“。搜索引擎&a…

PHP搭建网站登录页面(一个iOS开发者的PHP之路)

前言 最近几年各个技术论坛流传着一句话&#xff1a;未来是全栈程序员的世界&#xff01;程序员作为社会的一门职业&#xff0c;越来越多的人加入这个行业&#xff0c;在这个行业内分工很明晰的情况下&#xff0c;越来越多的程序员开始不安分追求一门编程语言&#xff0c;开始在…