第四章. Pandas进阶—时间序列

news/2024/4/26 14:37:26/文章来源:https://blog.csdn.net/weixin_45116749/article/details/128094178

第四章. Pandas进阶

4.9 时间序列

1.重采样(resample)

在Pandas中,对时间序列频率的调整称为重采样,即时间序列从一个频率转换到另一个频率的过程,由周统计变成月统计

1).语法:

  • 4.8章 第4点 已介绍过:链接: DataFrame.resample

2).示例:

import pandas as pd#重采样:将1分钟的时间序列转换成5分钟
index=pd.date_range('2022/11/29',periods=10,freq='T')
Series=pd.Series(range(10),index=index)
print(Series)
print("*"*50)df_sum=Series.resample('5T').sum()
print(df_sum)

结果展示:
在这里插入图片描述

2.降采样(resample)

在Pandas中,周期由高频率转向低频率称为降采样,例如按日统计变成按年统计

1).示例1:

import pandas as pd# 降采样:按年统计销售量
pd.set_option('display.unicode.ambiguous_as_wide', True)  # 处理数据的列标题与数据无法对齐的情况
pd.set_option('display.unicode.east_asian_width', True)  # 无法对齐主要是因为列标题是中文df = pd.read_excel('F:\\Note\\图书采购清单.xlsx', sheet_name='Sheet1')
df1 = df.set_index('发货日期')
df2 = df1['原价'].resample('AS').sum()
print(df2)
print('*' * 50)

结果展示:
在这里插入图片描述

3.升采样(resample)

在Pandas中,周期由低频率转向高频率称为升采样,例如按天统计变成按小时统计

1).示例1:

import pandas as pd
import numpy as np# 升采样:
index = pd.date_range('2022/11/29', periods=2, freq='D')
Series = pd.Series(np.arange(1, 3), index=index)
print(Series)
print("*" * 50)df1 = Series.resample('8H').asfreq().bfill()  # ffill:向前填充 bfill:向后填充
print(df1)

结果展示:
在这里插入图片描述

4.时间序列数据汇总(ohlc)

1).语法:

DataFrame.resample.ohlc()

参数说明:
返回值:DataFrame对象, 即每组数据的open(开),close(关),high(高),low(低)值

2).示例:

import pandas as pd# 时间序列数据汇总:找出一组数据的开始数据,结束数据,最大值,最小值
import numpy as npindex = pd.date_range('2022/11/29', periods=12, freq='T')
Series = pd.Series(np.random.random(12), index=index)
print(Series)
print("*" * 50)df1 = Series.resample('6T').ohlc()
print(df1)

结果展示:
在这里插入图片描述

5.移动窗口数据计算(rolling)

通过重采样可以得到想要的任何频率的数据,但是这些数据也只是一个时点的数据,那么就存在一个数问题:时点的数据波动较大,某一点的数据就不能很好的表现它本身的特性,就引入了移动窗口的概念,简单得说:为了提升数据的可靠性,将某点的取值扩大到包含这个点的一段区域,用区间来进行判断,这个区间就是窗口

1).语法:

DataFrame.rolling(window, min_periods=None, center=False, win_type=None, on=None, axis=0, closed=None)

参数说明:
window:时间窗的大小,数值int:即向前几个数据,offset:即表示时间窗口的大小
min_periods:每个窗口最少包含的观测值数量,小于这个值的窗口结果为NA,值可以是int,offset类型(默认值为1)
center:把窗口的标签设置为居中,布尔型,默认False
win_type: 窗口的类型,截取窗的各种函数。字符串类型,默认为None
on: 可选参数,对于dataframe而言,指定要计算移动窗口的列,值为列名
axis:0:表示列,1:表示行 ,默认值为0
closed:定义区间的开闭,支持int类型的window,对于offset类型默认是左开右闭,即默认为right,可以根据情况指定为left、both等

2).示例:

import pandas as pd
import numpy as np# 移动窗口数据计算
index = pd.date_range('2022/11/29', periods=8, freq='T')
Series = pd.Series(np.random.random(8), index=index)
print(Series)
print("*" * 50)df_mean = Series.rolling('3T', min_periods=1).mean()
print(df_mean)

结果展示:
在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.luyixian.cn/news_show_38967.aspx

如若内容造成侵权/违法违规/事实不符,请联系dt猫网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

MySQL数据库行级锁之间隙锁、临键锁

间隙锁 默认情况下,InnoDB在 REPEATABLE READ事务隔离级别运行,InnoDB使用 next-key 锁进行搜索和索引扫描,以防止幻读。 索引上的等值查询(唯一索引),给不存在的记录加锁时, 优化为间隙锁 。索引上的等值查询(非唯一普通索引)&…

如果把网络原理倒过来看,从无到有,一切如此清晰(下)

人生若只如初见。 前言 当我在台灯下,听着远隔17年前五月天的歌,而在数日后,我的文字也会纵使相隔万里远的来到你的屏幕前,就觉得这一切妙不可言。 OSI 网络七层模型 《如果把网络原理倒过来看,从无到有&#xff0c…

Seal库官方示例(二):encoders.cpp解析

补充一个常用的SIMD操作原理 图片来自的Hang Shao的文章。 完整代码 这个代码主要功能是编码明文,使得能够使用更加完整的明文多项式(前一个只用到了一个多项式的常量),也就是SIMD操作。主要包含了两个部分,一个是BG…

HLS + ffmpeg 实现动态码流视频服务

一、简介 如下图,包含三部分,右边一列为边缘节点;中间一列代表数据中心;左边一列是项目为客户提供的一系列web管理工具: 具体来说在我们项目中有一堆边缘节点,每个节点上部署一台强大的GPU服务器及N个网络…

精彩回顾 | 苏州农商银行新一代云原生信息科技架构体系实践

11月18日,2022年第五届中国金融科技产业大会暨第四届中新(苏州)数字金融应用博览会“基础软件与云原生系统软件”分论坛成功举办。该论坛由由中国计算机学会CTO CLUB(苏州)承办,江苏省金融科技云原生融合创…

目标检测数据标注项目分析-产品缺陷检测

什么是生产过程中的产品缺陷检测? 生产过程中的缺陷检测是保证产品质量的重要环节。及时发现故障或缺陷,并采取适当的措施,我们可以降低运行和质量相关的风险。但在一般视觉系统中,每个缺陷都必须经过检查及预处理才能被检测到,…

javaSE - Arrays - 数组的定义与使用

一、数组基本用法 1.1、什么是数组 数组本质上就是让我们能 “批量” 创建相同类型的变量 也可以说是存储一组相同数据类型的数据的集合 如: 如果需要表示两个数据, 那么直接创建两个变量即可 int a; int b 如果需要表示五个数据, 那么可以创建五个变量 int a1; int a2; int …

[附源码]Python计算机毕业设计Django的4s店车辆管理系统

项目运行 环境配置: Pychram社区版 python3.7.7 Mysql5.7 HBuilderXlist pipNavicat11Djangonodejs。 项目技术: django python Vue 等等组成,B/S模式 pychram管理等等。 环境需要 1.运行环境:最好是python3.7.7,…

DPU网络开发SDK——DPDK(一)

随着软件定义网络SDN的不断发展,网络数据转发面的需求越来越多样化,这体现在更快的数据包处理速率,更高的网络吞吐带宽,更灵活的自定义网络协议。传统的硬件设备无法满足网络协议的自定义,而基于Linux内核网络协议栈的…

【能效管理】变电所运维云平台在上海某医院的设计分析

摘要:本文概述了变电所电力运维技术,分析了医院变电所中存在的技术设备老化和技术荷载不足的技术性问题,并从主变低压进出线路监测故障、环境监测故障、设备档案记录、运维排班记录、分析报告五个方面探讨了变电所电力运维技术的具体应用。变…

Java定时器选择

java计时器和死循环哪个好?哪个建议使用? 计时器性能更好,但是写起来稍微复杂一点。如果是非常短暂的延迟,用死循环也未尝不可。一般来说能不用死循环的尽量不用死循环!如果你使用的是JDK1.5以上的,可以使…

高空简易水果采摘装置设计(CAD+proe)

目 录 摘 要 I Abstract II 1 绪论 1 1.1 选题背景及意义 1 1.2研究现状 1 1.2.1国外果园采摘机械现状 1 1.2.2国内果园采摘机械现状 4 1.2.3果园机械存在问题 5 1.2.4果园采摘机械的发展趋势 6 1.3研究主要内容 7 2 高空简易水果采摘装置原理 8 2.1 水果实采摘方式的选择 8 2.…

时间序列:时间序列模型---随机游走过程(The Random Walk Process)

本文是Quantitative Methods and Analysis: Pairs Trading此书的读书笔记。 随机游走过程是一种特殊的ARMA序列。从分子运动到股价波动等现象都被建模为随机游走。 随机游走过程是AR(1)序列,而且,时间序列在时刻的值为: 随机游走过程本质上是到当前时间…

供应双功能螯合剂THP-Mal,THP 马来酰亚胺,CAS:1314929-99-1

一:产品描述 1、名称 THP-Mal THP Maleimide THP 马来酰亚胺 2、CAS编号:1314929-99-1 3、分子式:C44H57N9O13 4、分子量:919.41 5、外观:白色或者灰白色粉末 6、沸点:1389.365.0 C(Predicted) …

Lint-staged自动修复格式错误及小结

文章目录一、背景二、Lint-staged2.1 简介2.2 修改package.json2.3 修改pre-commit2.4 测试三、小结3.1 代码格式规范3.2 Git提交规范一、背景 通过前面几节的介绍,目前想要提交代码,就要保证代码格式规范和提交信息格式规范,特别是pre-subm…

CSS布局的三种方式

绝对定位 绝对定位&#xff1a; ​ 属性&#xff1a;position 值&#xff1a;absolute <style> p.abs{position: absolute;left: 150px;top: 50px; }</style><p >正常文字1</p> <p >正常文字2</p> <p class"abs" >绝对定…

图库 | 图计算的适用场景有哪些?

图计算适用的场景非常广泛。在其肇始的早期阶段&#xff0c;图计算仅限于学术界以及工业界资深的研究机构内部&#xff0c;随着计算机体系架构的发展&#xff0c;图计算也在更广泛的行业和场景中得到应用。按照时间维度我们大体可以把图计算的发展及适用范围分为如下几个阶段&a…

umask 设置文件权限掩码

我们在创建文件或者目录时&#xff0c;看到的权限往往和我们设置的不一样&#xff0c;原因就在于创建文件时要受到 umask的影响。 目录 一、实际情景介绍 二、文件权限掩码 1、什么是权限掩码&#xff1f; 2、权限掩码的作用过程 3、设置权限掩码的两种方式 (1) umask 命…

【SpringCloud】08 分布式事务 seata

文章目录seata一、seata服务端的搭建&#xff08;1&#xff09;下载seata服务端&#xff08;2&#xff09;解压&#xff08;3&#xff09;配置seata的存储方式&#xff08;4&#xff09;创建seata数据库并导入相关表&#xff08;5&#xff09;把mysql的驱动jar放入到seata服务的…

智能运维应用之道,告别企业数字化转型危机

面临的问题及挑战 数据中心发展历程 2000 年中国数据中心始建&#xff0c;至今已经历以下 3 大阶段。早期&#xff1a;离散型数据中心 IT 因以项目建设为导向&#xff0c;故缺乏规划且无专门运维管理体系&#xff0c;此外&#xff0c;开发建设完的项目均是独立运维维护&#…