用户行为分析大数据系统(实时统计每个分类被点击的次数,实时计算商品销售额,统计网站PV、UV )

news/2024/5/20 11:31:55/文章来源:https://blog.csdn.net/qq_22473611/article/details/88085050

Spark Streaming实战对论坛网站动态行为pv,uv,注册人数,跳出率的多维度分析_小强签名设计 的博客-CSDN博客_spark streaming uv

实时统计每天pv,uv的sparkStreaming结合redis结果存入mysql供前端展示

实时统计每天pv,uv的sparkStreaming结合redis结果存入mysql供前端展示_大数据技术派-CSDN博客_spark streaming uv

Flume+Kafka+Storm+Redis构建大数据实时处理系统:实时统计网站PV、UV+展示

flume+kafka+slipstream实现黑名单用户访问实时监测

实战SparkStream+Kafka+Redis实时计算商品销售额实战SparkStream+Kafka+Redis实时计算商品销售额_小哈-whzhaochao-CSDN博客_sparkstream+kafka

spark streaming从kafka获取数据,计算处理后存储到redis

深入理解Spark Streaming流量控制及反压机制_lzf的博客-CSDN博客_spark streaming反压机制

大数据采集、清洗、处理:使用MapReduce进行离线数据分析完整案例大数据采集、清洗、处理:使用MapReduce进行离线数据分析完整案例_香飘叶子的技术博客_51CTO博客_mapreduce数据清洗案例大数据采集的方法

 

一、大数据处理的常用方法、项目的流程:

大数据采集、清洗、处理:使用MapReduce进行离线数据分析完整案例

在互联网应用中,不管是哪一种处理方式,其基本的数据来源都是日志数据,例如对于web应用来说,则可能是用户的访问日志、用户的点击日志等。

大数据处理目前比较流行的是两种方法,一种是离线处理,一种是在线处理,基本处理架构如下:

当然,如果只是希望得到数据的分析结果,对处理的时间要求不严格,就可以采用离线处理的方式,比如我们可以先将日志数据采集到HDFS中,之后再进一步使用MapReduce、Hive等来对数据进行分析,这也是可行的。 

  • Flume将网站日志数据采集到HDFS分布式存储系统中
  • Spark SQL清洗存储在HDFS的网站日志数据,清洗完后将其数据继续存储在HDFS中
  • Hive建立数据仓库,建立外部表,将清洗完的日志数据从HDFS中导入到Hive的外部表中,作为基础数据的存储
  • 在Hive中新建新的外部表用于存储PV、UV的结果数据
  • 用Hive的HQL统计分析日志数据,统计出PV、UV并将结果数据存到新的外部表中
  • 将统计完的PV、UV数据使用Sqoop从Hive同步到外部的MySQL中供给WEB前端使用

如果对于数据的分析结果在时间上有比较严格的要求,则可以采用在线处理的方式来对数据进行分析,如使用Spark、flink等进行处理。比较贴切的一个例子是天猫双十一的成交额,在其展板上,我们看到交易额是实时动态进行更新的,对于这种情况,则需要采用在线处理。

  • 如何一步步构建我们的实时处理系统(Flume+Kafka+Storm+Redis)
  • 1.Flume将网站日志数据采集到kafka、
  • 2.sparkstreaming实时处理kafka数据网站的用户访问日志,并统计出该网站的PV、UV
  • 3.将实时分析出的PV、UV等指标,实时处理后发送kafka+node.js展示
  • 动态地展示在我们的前面页面上

本文主要分享对某个电商网站产生的用户访问日志(access.log)进行离线处理与分析的过程,基于MapReduce的处理方式,最后会统计出某一天不同省份访问该网站的uv与pv。

1 、数据源

在我们的场景中,Web应用的部署是如下的架构:

即比较典型的Nginx负载均衡+KeepAlive高可用集群架构,在每台Web服务器上,都会产生用户的访问日志,业务需求方给出的日志格式如下:

1001    211.167.248.22  eecf0780-2578-4d77-a8d6-e2225e8b9169    40604   1       GET /top HTTP/1.0       408     null      null    1523188122767
1003    222.68.207.11   eecf0780-2578-4d77-a8d6-e2225e8b9169    20202   1       GET /tologin HTTP/1.1   504     null      Mozilla/5.0 (Windows; U; Windows NT 5.1)Gecko/20070309 Firefox/2.0.0.3  1523188123267
1001    61.53.137.50    c3966af9-8a43-4bda-b58c-c11525ca367b    0       1       GET /update/pass HTTP/1.0       302       null    null    1523188123768
1000    221.195.40.145  1aa3b538-2f55-4cd7-9f46-6364fdd1e487    0       0       GET /user/add HTTP/1.1  200     null      Mozilla/4.0 (compatible; MSIE 7.0; Windows NT5.2)       1523188124269
1000    121.11.87.171   8b0ea90a-77a5-4034-99ed-403c800263dd    20202   1       GET /top HTTP/1.0       408     null      Mozilla/5.0 (Windows; U; Windows NT 5.1)Gecko/20070803 Firefox/1.5.0.12 1523188120263appid   ip  mid   userid   login_type   request   status   http_referer   user_agent  time
其中:
appid包括 : web:1000,android:1001,ios:1002,ipad:1003
mid:         唯一的id此id第一次会种在浏览器的cookie里。如果存在则不再种。作为浏览器唯一标示。移动端或者pad直接取机器码。
login_type: 登录状态,0未登录、1:登录用户
request:    类似于此种 "GET /userList HTTP/1.1"
status:     请求的状态主要有:200 ok、404 not found、408 Request Timeout、500 Internal Server Error、504 Gateway Timeout等
http_referer:请求该url的上一个url地址。
user_agent:  浏览器的信息,例如:"Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/47.0.2526.106 Safari/537.36"
time:       时间的long格式:1451451433818。

如果备份日志或者日志切割:
vim /opt/cut_nginx.sh

#!/bin/bash
#切割日志
datetime=$(date -d "-1 day" "+%Y%m%d")
log_path="/usr/local/nginx/logs" 
pid_path="/usr/local/nginx/logs/nginx.pid" 
[ -d $log_path/backup ] || mkdir -p $log_path/backup 
if [ -f $pid_path ] 
then 
mv $log_path/access.log $log_path/backup/access.log-$datetime 
kill -USR1 $(cat $pid_path) 
find $log_path/backup -mtime +30 | xargs rm -f#mtime :文件被修改时间 atime:访问时间(文件中的数据库最后被访问的时间) ctime:改变时间(文件的元数据发生变化。比如权限,所有者等)
else 
echo "Error,Nginx is not working!" | tee -a /var/log/messages 
fi

chmod +x /opt/cut_nginx.sh

crontab -e 设置定时任务

0  0  *  *  *     /opt/cut_nginx.sh

1、模拟生成实时数据

public class SimulateData {public static void main(String[] args) {BufferedWriter bw = null;try {bw = new BufferedWriter(new FileWriter("G:\\Scala\\实时统计每日的品类的点击次数\\data.txt"));int i = 0;while (i < 20000){long time = System.currentTimeMillis();int categoryid = new Random().nextInt(23);bw.write("ver=1&en=e_pv&pl=website&sdk=js&b_rst=1920*1080&u_ud=12GH4079-223E-4A57-AC60-C1A04D8F7A2F&l=zh-CN&u_sd=8E9559B3-DA35-44E1-AC98-85EB37D1F263&c_time="+time+"&p_url=http://list.iqiyi.com/www/"+categoryid+"/---.html");bw.newLine();i++;}} catch (IOException e) {e.printStackTrace();}finally {try {bw.close();} catch (IOException e) {e.printStackTrace();}}}
} 
/*
ver=1&en=e_pv&pl=website&sdk=js&b_rst=1920*1080&u_ud=12GH4079-223E-4A57-AC60-C1A04D8F7A2F&l=zh-CN&u_sd=8E9559B3-DA35-44E1-AC98-85EB37D1F263&c_time=1526975174569&p_url=http://list.iqiyi.com/www/9/---.html
ver=1&en=e_pv&pl=website&sdk=js&b_rst=1920*1080&u_ud=12GH4079-223E-4A57-AC60-C1A04D8F7A2F&l=zh-CN&u_sd=8E9559B3-DA35-44E1-AC98-85EB37D1F263&c_time=1526975174570&p_url=http://list.iqiyi.com/www/4/---.html
ver=1&en=e_pv&pl=website&sdk=js&b_rst=1920*1080&u_ud=12GH4079-223E-4A57-AC60-C1A04D8F7A2F&l=zh-CN&u_sd=8E9559B3-DA35-44E1-AC98-85EB37D1F263&c_time=1526975174570&p_url=http://list.iqiyi.com/www/10/---.html*/

模拟数据实时的写入data.log:需要一直启动着:

#!/bin/bash
cat demo.csv | while read line
do 
echo "$line" >> data.log
sleep 1
done

 或者生成数据直接发送kafka


/*** 这里产生数据,就会发送给kafka,kafka那边启动消费者,就会接收到数据,这一步是用来测试生成数据和消费数据没有问题的,确定没问题后要关闭消费者,* 启动OnlineBBSUserLogss.java的类作为消费者,就会按pv,uv等方式处理这些数据。* 因为一个topic只能有一个消费者,所以启动程序前必须关闭kafka方式启动的消费者(我这里没有关闭关闭kafka方式启动的消费者也没正常啊) */
public class SparkStreamingDataManuallyProducerForKafkas extends Thread{//具体的论坛频道static String[] channelNames = new  String[]{"Spark","Scala","Kafka","Flink","Hadoop","Storm","Hive","Impala","HBase","ML"};//用户的两种行为模式static String[] actionNames = new String[]{"View", "Register"};private static Producer<String, String> producerForKafka;private static String dateToday;private static Random random;//2、作为线程而言,要复写run方法,先写业务逻辑,再写控制@Overridepublic void run() {int counter = 0;//搞500条while(true){//模拟实际情况,不断循环,异步过程,不可能是同步过程counter++;String userLog = userlogs();System.out.println("product:"+userLog);//"test"为topicproducerForKafka.send(new KeyedMessage<String, String>("test", userLog));if(0 == counter%500){counter = 0;try {Thread.sleep(1000);} catch (InterruptedException e) {// TODO Auto-generated catch blocke.printStackTrace();}}}}private static String userlogs() {StringBuffer userLogBuffer = new StringBuffer("");int[] unregisteredUsers = new int[]{1, 2, 3, 4, 5, 6, 7, 8};long timestamp = new Date().getTime();Long userID = 0L;long pageID = 0L;//随机生成的用户ID if(unregisteredUsers[random.nextInt(8)] == 1) {userID = null;} else {userID = (long) random.nextInt((int) 2000);}//随机生成的页面IDpageID =  random.nextInt((int) 2000);          //随机生成ChannelString channel = channelNames[random.nextInt(10)];//随机生成action行为String action = actionNames[random.nextInt(2)];userLogBuffer.append(dateToday).append("\t").append(timestamp).append("\t").append(userID).append("\t").append(pageID).append("\t").append(channel).append("\t").append(action);   //这里不要加\n换行符,因为kafka自己会换行,再append一个换行符,消费者那边就会处理不出数据return userLogBuffer.toString();}public static void main(String[] args) throws Exception {dateToday = new SimpleDateFormat("yyyy-MM-dd").format(new Date());random = new Random();Properties props = new Properties();props.put("zk.connect", "h71:2181,h72:2181,h73:2181");props.put("metadata.broker.list","h71:9092,h72:9092,h73:9092");props.put("serializer.class", "kafka.serializer.StringEncoder");ProducerConfig config = new ProducerConfig(props);producerForKafka = new Producer<String, String>(config);new SparkStreamingDataManuallyProducerForKafkas().start(); }
} /**
product:2017-06-20      1497948113827   633     1345    Hive    View
product:2017-06-20      1497948113828   957     1381    Hadoop  Register
product:2017-06-20      1497948113831   300     1781    Spark   View
product:2017-06-20      1497948113832   1244    1076    Hadoop  Register
**/

2、数据采集:获取原生数据

数据采集工作:使用Flume对于用户访问日志的采集,将采集的数据保存到HDFS中 (离线)、发送数据到kafka(实时)

2、flume发送数据到kafka

从data.log文件中读取实时数据到kafka:

第一步:配置Flume文件:(file2kafka.properties)

a1.sources = r1
a1.sinks = k1
a1.channels =c1a1.sources.r1.type = exec
a1.sources.r1.command = tail -F /home/hadoop/data.loga1.channel.c1 = memorya1.sinks.k1.type = org.apache.flume.sink.kafka.KafkaSink
a1.sinks.k1.topic = aura
a1.sinks.k1.brokerList = hodoop02:9092
a1.sinks.k1.requiredAcks = 1
a1.sinks.k1.batchSize = 5a1.sources.r1.channels = c1
a1.sinks.k1.channel = c1

第四步:启动Flume命令

[hadoop@hadoop02 apache-flume-1.8.0-bin]$

bin/flume-ng agent --conf conf --conf-file /usr/local/flume/example/file2kafka.properties --name a1 -Dflume.root.logger=INFO,console 
 

第三步:启动kafka消费者

[hadoop@hadoop03 kafka_2.11-1.0.0]$

bin/kafka-console-consumer.sh --zookeeper hadoop:2181 --from-beginning --topic aura

4 数据清洗:将不规整数据转化为规整数据(存入hdfs或者hive用于离线分析统计)

4.3.3 执行MapReduce程序

将上面的mr程序打包后上传到我们的Hadoop环境中,这里,对2018-04-08这一天产生的日志数据进行清洗,执行如下命令:

yarn jar data-extract-clean-analysis-1.0-SNAPSHOT-jar-with-dependencies.jar\
cn.xpleaf.dataClean.mr.job.AccessLogCleanJob \
hdfs://ns1/input/data-clean/access/2018/04/08 \
hdfs://ns1/output/data-clean/access

5 数据处理:对规整数据进行统计分析

6、Kafka消费者,SparkStream时实计算商品销售额--redis

实战SparkStream+Kafka+Redis实时计算商品销售额_小哈-whzhaochao-CSDN博客_sparkstream+kafka

object OrderConsumer {//Redis配置val dbIndex = 0//每件商品总销售额val orderTotalKey = "app::order::total"//每件商品上一分钟销售额val oneMinTotalKey = "app::order::product"//总销售额val totalKey = "app::order::all"def main(args: Array[String]): Unit = {// 创建 StreamingContext 时间片为1秒val conf = new SparkConf().setMaster("local").setAppName("UserClickCountStat")val ssc = new StreamingContext(conf, Seconds(1))// Kafka 配置val topics = Set("order")val brokers = "127.0.0.1:9092"val kafkaParams = Map[String, String]("metadata.broker.list" -> brokers,"serializer.class" -> "kafka.serializer.StringEncoder")// 创建一个 direct streamval kafkaStream = KafkaUtils.createDirectStream[String, String, StringDecoder, StringDecoder](ssc, kafkaParams, topics)//解析JSONval events = kafkaStream.flatMap(line => Some(JSON.parseObject(line._2)))// 按ID分组统计个数与价格总合val orders = events.map(x => (x.getString("id"), x.getLong("price"))).groupByKey().map(x => (x._1, x._2.size, x._2.reduceLeft(_ + _)))//输出orders.foreachRDD(x =>x.foreachPartition(partition =>partition.foreach(x => {println("id=" + x._1 + " count=" + x._2 + " price=" + x._3)//保存到Redis中val jedis = RedisClient.pool.getResourcejedis.select(dbIndex)//每个商品销售额累加jedis.hincrBy(orderTotalKey, x._1, x._3)//上一分钟第每个商品销售额jedis.hset(oneMinTotalKey, x._1.toString, x._3.toString)//总销售额累加jedis.incrBy(totalKey, x._3)RedisClient.pool.returnResource(jedis)})))ssc.start()ssc.awaitTermination()}
} 
/*
id=4 count=3 price=7208
id=8 count=2 price=10152
id=7 count=1 price=6928
id=5 count=1 price=3327
id=6 count=3 price=20483
id=0 count=2 price=9882
*/

Redis客户端

object RedisClient extends Serializable {val redisHost = "127.0.0.1"val redisPort = 6379val redisTimeout = 30000lazy val pool = new JedisPool(new GenericObjectPoolConfig(), redisHost, redisPort, redisTimeout)lazy val hook = new Thread {override def run = {println("Execute hook thread: " + this)pool.destroy()}}sys.addShutdownHook(hook.run)def main(args: Array[String]): Unit = {val dbIndex = 0val jedis = RedisClient.pool.getResourcejedis.select(dbIndex)jedis.set("test", "1")println(jedis.get("test"))RedisClient.pool.returnResource(jedis)}
}

 

DAU日活 

  // 转换处理val startuplogStream: DStream[Startuplog] = inputDstream.map {record =>val jsonStr: String = record.value()val startuplog: Startuplog = JSON.parseObject(jsonStr, classOf[Startuplog])val date = new Date(startuplog.ts)val dateStr: String = new SimpleDateFormat("yyyy-MM-dd HH:mm").format(date)val dateArr: Array[String] = dateStr.split(" ")startuplog.logDate = dateArr(0)startuplog.logHour = dateArr(1).split(":")(0)startuplog.logHourMinute = dateArr(1)startuplog}// 利用redis进行去重过滤val filteredDstream: DStream[Startuplog] = startuplogStream.transform {rdd =>println("过滤前:" + rdd.count())//driver  //周期性执行DataFrameval curdate: String = new SimpleDateFormat("yyyy-MM-dd").format(new Date)val jedis: Jedis = RedisUtil.getJedisClientval key = "dau:" + curdateval dauSet: util.Set[String] = jedis.smembers(key) //SMEMBERS key 获取集合里面的所有keyval dauBC: Broadcast[util.Set[String]] = ssc.sparkContext.broadcast(dauSet)val filteredRDD: RDD[Startuplog] = rdd.filter {startuplog =>//executorval dauSet: util.Set[String] = dauBC.value!dauSet.contains(startuplog.mid)}println("过滤后:" + filteredRDD.count())filteredRDD}//去重思路;把相同的mid的数据分成一组 ,每组取第一个val groupbyMidDstream: DStream[(String, Iterable[Startuplog])] = filteredDstream.map(startuplog => (startuplog.mid, startuplog)).groupByKey()val distinctDstream: DStream[Startuplog] = groupbyMidDstream.flatMap {case (mid, startulogItr) =>startulogItr.take(1)}// 保存到redis中distinctDstream.foreachRDD { rdd =>// redis  type set// key  dau:2019-06-03    value : midsrdd.foreachPartition { startuplogItr =>//executorval jedis: Jedis = RedisUtil.getJedisClientval list: List[Startuplog] = startuplogItr.toListfor (startuplog <- list) {val key = "dau:" + startuplog.logDateval value = startuplog.midjedis.sadd(key, value)println(startuplog) //往es中保存}MyEsUtil.indexBulk(GmallConstant.ES_INDEX_DAU, list)jedis.close()}}

7、SparkStreaming接收kafka数据并处理--Hbase

创建一个HBase表: 

实时统计每日的分类的点击次数,存储到HBase(HBase表示如何设计的,rowkey是怎样设计)

原文: SparkStreaming项目(实时统计每个品类被点击的次数)_potter-CSDN博客_sparkstreaming项目


object DauApp {def main(args: Array[String]): Unit = {val sparkConf: SparkConf = new SparkConf().setAppName("dau_app").setMaster("local[*]")val ssc = new StreamingContext(sparkConf, Seconds(5))val inputDstream: InputDStream[ConsumerRecord[String, String]] = MyKafkaUtil.getKafkaStream(GmallConstant.KAFKA_TOPIC_STARTUP, ssc)//    inputDstream.foreachRDD{rdd=>//      println(rdd.map(_.value()).collect().mkString("\n"))//    }//    val dStream: DStream[String] = inputDstream.map { record =>//      val jsonStr: String = record.value()//      jsonStr//    }//处理数据,完了,保存偏移量inputDstream.foreachRDD(rdd => {//手动指定分区的地方val ranges: Array[OffsetRange] = rdd.asInstanceOf[HasOffsetRanges].offsetRangesprintln("长度=" + ranges.length)ranges.foreach(println)val result: RDD[(String, Int)] = rdd.map(_.value()).flatMap(_.split(",")).map((_, 1)).reduceByKey(_ + _)result.foreach(println)result.foreachPartition(p => {val jedis: Jedis = RedisUtil.getJedisClientp.foreach(rdd2 => {//      数据数理逻辑jedis.hincrBy("wc1", rdd2._1, rdd2._2)})//把通过hset,把对应的partition和offset写入到redis中val map = new util.HashMap[String, String]()for (o <- ranges) {val offset = o.untilOffsetval partition = o.partitionval topic = o.topicval group_id = "gmall_consumer_group"map.put("offset", offset.toString)jedis.hmset("offsetKey", map)}jedis.close()})// 把偏移量的Array  写入到mysql中//      ranges.foreach(rdd2 => {//        // 思考,需要保存哪些数据呢?   起始的offset不需要  还需要加上 groupid//        val pstm = conn.prepareStatement("replace into mysqloffset values (?,?,?,?)")//        pstm.setString(1, rdd2.topic)//        pstm.setInt(2, rdd2.partition)//        pstm.setLong(3, rdd2.untilOffset)//        pstm.setString(4, groupId)//        pstm.execute()//        pstm.close()//      })})// 转换处理val startuplogStream: DStream[Startuplog] = inputDstream.map {record =>val jsonStr: String = record.value()val startuplog: Startuplog = JSON.parseObject(jsonStr, classOf[Startuplog])val date = new Date(startuplog.ts)val dateStr: String = new SimpleDateFormat("yyyy-MM-dd HH:mm").format(date)val dateArr: Array[String] = dateStr.split(" ")startuplog.logDate = dateArr(0)startuplog.logHour = dateArr(1).split(":")(0)startuplog.logHourMinute = dateArr(1)startuplog}// 利用redis进行去重过滤val filteredDstream: DStream[Startuplog] = startuplogStream.transform {rdd =>println("过滤前:" + rdd.count())//driver  //周期性执行DataFrameval curdate: String = new SimpleDateFormat("yyyy-MM-dd").format(new Date)val jedis: Jedis = RedisUtil.getJedisClientval key = "dau:" + curdateval dauSet: util.Set[String] = jedis.smembers(key) //SMEMBERS key 获取集合里面的所有keyval dauBC: Broadcast[util.Set[String]] = ssc.sparkContext.broadcast(dauSet)val filteredRDD: RDD[Startuplog] = rdd.filter {startuplog =>//executorval dauSet: util.Set[String] = dauBC.value!dauSet.contains(startuplog.mid)}println("过滤后:" + filteredRDD.count())filteredRDD}//去重思路;把相同的mid的数据分成一组 ,每组取第一个val groupbyMidDstream: DStream[(String, Iterable[Startuplog])] = filteredDstream.map(startuplog => (startuplog.mid, startuplog)).groupByKey()val distinctDstream: DStream[Startuplog] = groupbyMidDstream.flatMap {case (mid, startulogItr) =>startulogItr.take(1)}// 保存到redis中distinctDstream.foreachRDD { rdd =>// redis  type set// key  dau:2019-06-03    value : midsrdd.foreachPartition { startuplogItr =>//executorval jedis: Jedis = RedisUtil.getJedisClientval list: List[Startuplog] = startuplogItr.toListfor (startuplog <- list) {val key = "dau:" + startuplog.logDateval value = startuplog.midjedis.sadd(key, value)println(startuplog) //往es中保存}MyEsUtil.indexBulk(GmallConstant.ES_INDEX_DAU, list)jedis.close()}}ssc.start()ssc.awaitTermination()}
}


 

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.luyixian.cn/news_show_734597.aspx

如若内容造成侵权/违法违规/事实不符,请联系dt猫网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

机器学习(三)-- KNN(K近邻分类算法)、电影分类、改进约会网站的配对效果

决策树< 朴素贝叶斯< KNN K近邻算法&#xff1a;根据距离来做排序&#xff0c;距离哪些同类的数据比较近则属于哪一类 &#xff08;1&#xff09;从计算结果直观上来看&#xff0c;在这三种算法中&#xff0c;KNN算法的计算准确率普遍较高&#xff0c;且kNN算法在训练数…

【大型分布式网站】抗住千万流量的大型分布式系统架构设计

一、大型分布式网站架构技术 1.1 大型网站的特点 用户多&#xff0c;分布广泛 大流量&#xff0c;高并发 海量数据&#xff0c;服务高可用 安全环境恶劣&#xff0c;易受网络攻击 功能多&#xff0c;变更快&#xff0c;频繁发布 从小到大&#xff0c;渐进发展 以用户为中…

基于服务器的个人博客网站搭建

网站搭建 目录 网站搭建 A1 基础 A2 域名 2.1 域名解析 2.2 添加记录 2.2 域名备案 A3 ECS云服务器搭建博客 3.1 安全组添加8888端口 3.2 安装宝塔 3.3 访问网站&#xff0c;登录宝塔 3.4 安装wordpress 3.5 配置wordpress 3.6 进入后台 A4 问题 4.1 关于访问公…

网站备案后没有找到站点

A1 问题&#xff1a; A2 原因&#xff1a; 您没有将此域名或IP绑定到对应站点!配置文件未生效! A3 解决&#xff1a; 检查是否已经绑定到对应站点&#xff0c;若确认已绑定&#xff0c;请尝试重载Web服务&#xff08;大部分是这个问题&#xff0c;添加对应站点和开放端口&am…

linux一键卸载安装脚本,在使用LANMP Linux一键包卸载安装网站服务器要注意的事情...

前言之前在某个论坛里看到了一个关于Nginx如何限制并发的问题&#xff0c;也知道一些朋友也对博客做了一些访问限制(各种什么Js验证、cookie验证&#xff0c;还加了个Fail2ban什么的)然后觉得自己的博客很稳&#xff0c;恩&#xff0c;可能&#xff0c;也许&#xff0c;大概………

个人网站www.pixysoft.net设计系列: 数据库同步的思考

个人网站www.pixysoft.net设计系列: 数据库同步的思考Introduction:本网站使用WebService进行远程网站管理.因此有数据同步的问题表结构设计 说明:网站管理分为本地数据库(如上图设计)和网站数据库. 通过本地数据库管理网站数据库..SiteMapContent保存导航文件.WebPageInfo保存…

使用Web标准建站

使用Web标准建站第1天:选择什么样的DOCTYPE 前言 大家好&#xff01;这个系列文章是按阿捷自己制作这个站点的过程编写的。之前阿捷也一直没有制作过一个真正符合web标准的网站。现在边参考国外资料边制作&#xff0c;同时把过程中的心得和经验记录下来&#xff0c;希望对大家有…

一步一步SharePoint 2007之二十一:解决实现注册用户后,自动具备访问网站的权限的问题(3)——创建用户...

摘要  本篇文章将记录如何解决实现注册用户后&#xff0c;自动具备访问网站的权限的第三部分。   前面各项准备工作都做完了&#xff0c;现在我们就来进行解决实现注册用户后&#xff0c;自动具备访问网站的权限的最后一步设置吧&#xff01;正文  下面将记录每一步的实现…

[电子商务网站设计] 之 Passport

从所承担的功能上来说&#xff0c;Passport 是一个系统级别的服务&#xff0c;而不仅仅用来进行用户管理。对于任何一个网站而言&#xff0c;随着业务的发展&#xff0c;多业务的网站群整合不可避免&#xff0c;那么作为整合的通道之一&#xff0c;用户数据共享自然就是一个关键…

[CSS]30种时尚的CSS网站导航条

【原文地址】&#xff1a;http://coolshell.cn/?p562 我想&#xff0c;大家在上网的时候一定见过很多很多种各式各样的网站导航条的设计。这些导航条基本上来说都是用CSS来做的。这里&#xff0c;我们将向你介绍几种最不错的用CSS设计的网站导航条。希望你会喜欢。 1. The Men…

用python爬取网页内容_用python爬取网页文本内容,让你快速浏览网站内容

大家好&#xff0c;我是咿哑呀。今天我教大家学习网络爬虫&#xff0c;这个爬虫能够爬取网页文本内容&#xff0c;提高大家浏览网页的速度。下面我把代码贴出&#xff0c;大家仔细研究&#xff1a;from urllib import request, parsefrom urllib.parse import quoteimport stri…

python语言的主要网站是_TIOBE:2018年度编程语言 Python八年后重登王座

2003-2018 年度最佳编程语言&#xff1a;可以看到&#xff0c;Python 上一次获得此荣誉&#xff0c;是在 2010 年。 其他值得关注的变化还有&#xff1a; MATLAB —— 从第 18 名升至第 11 名 Kotlin —— 从第 39 名升至第 31 名 Rust —— 从第 46 名升至第 33 名 Julia ——…

网站变成灰色

昨天是4月4日清明节&#xff0c;全国都在为抗击疫情&#xff08;新冠肺炎&#xff09;做斗争牺牲的烈士和逝世的同胞哀悼&#xff0c;各大网站都会让自己的网站的全部网页变成灰色&#xff08;黑白色&#xff09;&#xff0c;以表示我们对逝者的悼念。当然&#xff0c;今天已经…

网站企业信息查询

1. 站长工具 2. 爱站网 3. ICP备案查询 4. 公安备案查询 5. 企业查询 站长工具中的【星网大数据】 全国组织机构统一社会信用代码公示查询平台 爱企查 天眼查

web developer tips (84):在Visual Web Developer中设置web网站的起始页

原文地址&#xff1a;How to set a Start page for your Web Site in Visual Web Developer? 如果你正在开发网站&#xff0c;为了测试网站你想启动某个特定的网页。默认的情况下&#xff0c;当你启动调试的时候&#xff0c;Visual Studio 2008运行的页面是设计器中当前激活的…

ajax nginx 转发 sessionid_教你快速使用nginx部署网站

前言如果服务器只需要放置一个网站程序&#xff0c;解析网站到服务器的网站&#xff0c;网站程序监听80端口就可以了。如果服务器有很多应用&#xff0c;借助nginx不仅可以实现端口的代理&#xff0c;还可以实现负载均衡。本文将详细介绍前端及nodeJS项目在服务器配置时需要用到…

谈谈互动型网站中垃圾贴的应对方案

在互动型网站中常常会受到垃圾贴的困扰。我分享一点个人在垃圾贴处理方面的一点心得&#xff1a; 要处理垃圾贴必然需要分析垃圾贴的特征1. 在内容上垃圾贴通常会带有一个固定域名的外部链接&#xff0c;或者带有QQ号码&#xff0c;手机号码&#xff0c;或者重复内容&#xff1…

python爬虫登录网站_Python爬虫模拟登录带验证码网站

爬取网站时经常会遇到需要登录的问题&#xff0c;这是就需要用到模拟登录的相关方法。python提供了强大的url库&#xff0c;想做到这个并不难。这里以登录学校教务系统为例&#xff0c;做一个简单的例子。 首先得明白cookie的作用&#xff0c;cookie是某些网站为了辨别用户身份…

vue企业网站模板_什么样的模板是高端企业网站模板?

要建立一个高端的企业网站&#xff0c;不管是哪种行业的企业网站&#xff0c;建立高端网站办法就是定制网站了&#xff0c;但除了定制网站&#xff0c;还有一种方法就是&#xff0c;使用高端的企业网站模板建站&#xff0c;通过对网站模板的修改达到建站目的。但是要找到一款高…

php网站绕狗,[WEB]绕过XX狗与300PHP一句话的编写

00x01XX狗的确是让人很头痛&#xff0c;尤其是在上传一句话或者写入一句话的时候&#xff0c;会被XX狗拦截从而拿不下shell。当然&#xff0c;安全狗是最简单的一款waf&#xff0c;很容易就进行一个绕过。00x02对于绕过XX狗跟300&#xff0c;我姿势不多&#xff0c;但是却很实用…