方差怎么算举个例子(时间序列定义、均值、方差、自协方差及相关性)

编者:机器学习学院

大家好,分享一篇时间序列干货文章。

时间序列的定义

时间序列过程(时间序列过程)它被定义为一个随机过程,是一组按时间排序的随机变量,即每个时间位置的点被视为一个随机变量。是一个索引集合(索引集),决定定义计时过程以及生成观察结果时间的集合。假设

  • 随机变量的值是连续的。

  • 时间索引集是离散的和等距的。

在整个过程中,使用了以下符号

  • 随机变量(随机变量)它用大写字母表示,也就是说,同时,随机变量的值从分布中取样。此外,可以为无限多个时间点定义随机变量。

  • 观察(观察)使用小写字母也就是说,观测可以看作是随机变量的实现。但通常在实践中,我们的观察点是有限的,所以定义一个观察是非常困难的。

时间序列分析目标

给定一组时间序列数据,通常需要回答一个或多个有关它的问题。时间序列数据的主要问题类型取决于数据的上下文和收集数据的原因。以下给出了一些共同目标:

  • 描述:描述时间序列的主要特征,例如:序列是增加还是减少;是否存在季节性模式(例如夏季较高,冬季较低);第二个解释变量的值如何影响时间序列?

  • 班长:检测时间序列行为何时发生变化,例如销售额突然下降或突然达到峰值。

  • 预测:根据当前值预测时间序列的未来值,并量化这些预测中的不确定性。例如,根据今天的温度预测未来几天的温度。

  • 回归:给定多个时间序列和对应于这些序列的附加值,找出它们之间的关系。

  • 分类:给定多个时间序列,它们根据相似性进行分类。

  • ......

时间序列建模

时间序列数据通常分解为以下三个部分。

  • 趋势(趋势)-这一趋势反映了时间序列数据平均值随时间的长期变化。如果趋势存在,它的形状通常会吸引人们的兴趣,尽管它可能不是线性的。

  • 季节性影响(季节效应)-季节性影响是时间序列中以固定间隔重复的趋势。严格来说,季节效应只是一种每年重复的效应,但在更一般的情况下,这个术语可以更广泛地用于代表任何规律性重复的模式。

  • 无法解释的变化(无法解释的变异)-未解释的变化是指去除任何趋势和季节性变化后时间序列中的剩余变化。这种无法解释的变化可能是独立的,也可能表现出短期的相关性。

因此,时间序列数据的简单模型可以用两种方式表示:

加性模型(Additive):

乘法模型(Multiplicative):

趋势、季节和无法解释的变化在哪里。在本教程中,给出了两个示例。也就是说,当趋势和季节变化独立作用时,加法模型是合适的,如果季节效应的大小取决于趋势的大小,则需要乘法模型。当趋势和季节变化相互独立时,加法模型是合适的。如果季节效应的大小取决于趋势的大小,则需要乘法模型。简单示意图如下:

  • 额外型号的Example

时间序列的特征

(平均值)方差、自协方差作用、自相关函数

给定一个时间序列过程和观测,我们通常使用以下属性来描述其特征。

  • 平均函数

对于所有时间序列过程,平均函数(平均函数)定义为

对于实际数据,我们通常假设平均值是常数,所以我们可以估计平均值是常数

如果数据的平均值不是恒定的,例如,由于趋势或季节变化的存在,应通过其他方法进行估计,这将在后面讨论。

  • 方差函数

总的来说,时间序列过程的方差函数(variance函数)定义为

标准差该函数定义为

对于实际数据,我们通常假设方差也是一个常数,因此我们可以将方差估计为

  • 自相关函数

回想一下,对于任何随机变量和,协方差和相关度量由以下定义给出

协方差:

关联:

相关性是-1和1之间协方差的标度性能,其中1表示强正相关,0表示独立性,-1表示强负相关,但通常相关指线性相关。

对于时间序列过程,随机变量的定义是不同时间点的测量。它们之间的依赖关系由自方差和自相关函数描述,并添加前缀“auto”以表示两个随机变量测量值具有相同的数字。

总的来说,自协方差函数(自动variance功能(acvf))定义为:

在…之间

总的来说,自相关函数(自相关函数(ACF))定义为:

在…之间

上述定义是理想的,即每次都有多个采样数据,因此可以计算or。然而,在真实场景中,这种情况很难实现,因为通常在某个时间点,只能获得一个采样点的数据。

为了计算真实数据的自方差和自相关函数,通常假设数据中的依赖关系结构不会随时间而改变。也就是说,我们假设

换言之,在这种假设下协方差唯一的因素是两个时间序列中随机变量之间的距离,这通常被称为滞后lag

因此,唯一需要计算的是自协方差集:

在这种情况下,自相关函数变为

方差怎么算

上述计算方法的前提是,数据中的依赖结构不随时间变化,协方差不取决于具体位置,而仅取决于滞后。

自相关函数的估计

对于时间序列数据,自方差和自相关函数测量单个时间序列及其滞后lag之间的协方差/相关性。给出了时间自方差和自相关函数的计算过程。

lag=0

滞后0处样本的自协方差函数(lag=0)定义为和之间的协方差。根据上述公式,计算方法为:

因此,滞后0处的样本自协方差函数为样本方差。同样,滞后0处的自相关系数为

lag=1

滞后1(lag=1)的样本自协方差函数是时间序列和协方差。它是序列与其自身移动时间点序列之间的协方差。根据上述公式,确定了协方差和自相关系数的计算方法

在…之间

这是最后的观察结果;

在实际应用中,通常假设前n-1个观测值的均值和方差等于最后n-1个观测值的均值和方差,这可以简化上述表达式。此外,对于协方差公式,使用除数n代替无偏n-2。显然,当n较大时,改变除数对计算几乎没有实际影响。

lag=

时间序列的样本自协方差函数(acvf)定义为:

样本自相关函数(ACF)定义为

可以在以下链接中找到帮助您理解自相关和自相关函数的交互式示例。

https:数学统计。格拉。ac.uk/gnapier/Timeu系列uACF/shinny。数学统计。格拉。ac.uk/gnapier/Timeu系列uACF/

Correlogram图解释义

Correlogram说,以自相关函数的计算结果为纵轴,以滞后为横轴。我们可以直观地看到时间序列中不同lag之间的相关性。Correlogram将告诉时间序列分析师很多关于时间序列的信息,包括趋势的存在、季节变化和短期相关性。下面是一些例子来说明。

Example——纯随机数据

考虑到纯随机过程产生的时间序列,它没有趋势、季节或短期相关性。原始数据和自相关图如下:

  • 当时,因为它是序列和自身之间的相关性,所以该值通常被忽略。

  • 对于没有相关性的纯随机序列,在滞后0处通常等于1,但在其他滞后处没有明显的相关性证据。

Example——短期相关性

下图显示了没有趋势或季节性但具有短期相关性的时间序列数据,在前几个滞后中具有显著的正自相关,然后在较大的滞后中接近于零。

Example——替代数据

下图显示了无趋势或季节性但在大值和小值之间交替的时间序列数据,奇数滞后为负自相关,偶数滞后为正自相关。随着滞后时间的增加,自相关系数越来越接近于零。

Example——有趋势的数据

具有趋势的时间序列数据如下图所示,当滞后过大时,仍然具有正自相关。如果随着时间的推移观察到相同的趋势。

Example——具有季节性影响的数据

具有季节性影响的时间序列数据如下图所示,相关图中有规律的季节性模式。

Example——具有趋势和季节效应的数据

具有趋势和季节影响的时间序列数据如下图所示,相关图中有规律的季节模式。由于趋势的存在,相关图通常具有正值。

平稳性分析

严格稳定

严格地stationarystationary

严格的平稳性是一个非常苛刻的条件。对于给定的时间序列过程,如果联合分布与相同,则序列是严格平稳的。换句话说,移动序列的时间原点对其联合分布没有影响。

当,严格稳定意味着对所有人来说,都是稳定的。这也表明时间序列的均值和方差是恒定的,即

当严格稳定意味着对所有人来说

联合分布仅取决于滞后

这反过来意味着理论协方差和相关函数只取决于滞后,而不是原始位置。

严格的稳定性是非常严格的,而真正的过程很少是一致的。一般来说,只有纯随机过程是严格平稳的,所以它们更弱平稳。

弱平稳

stationary

对于给定的时间序列过程,如果时间序列过程是弱平稳的,则需要满足以下条件:

  1. 平均值是常数和有限的,即

  2. 方差是常数和有限的,即

  3. 自方差和自相关函数仅取决于滞后,即和

严格平稳性和弱平稳性之间的区别在于,后者只假设前两个矩(均值和方差)随时间的变化是常数,而前者假设较高的矩也是常数。

小马

定义一个随机游走过程

其中是一个方差为0的随机过程。的确如此非平稳因为

这表明方差随时间而变化。

作者:Daymoyu

资料来源:https//转兰之湖。com/p/424609116

参考文献:https//bookdownOrg/Marx_uua_uuNapier/time_uuSeries_uuu讲座笔记/第一章。html#时间序列建模

您可以还会对下面的文章感兴趣

最新评论

  1. 火柴人
    火柴人
    发布于:2022-04-27 20:48:04 回复TA
    时间序列,它没有趋势、季节或短期相关性。原始数据和自相关图如下:当时,因为它是序列和自身之间的相关性,所以该值通常被忽略。对于没有相关性的纯随机序列,在滞后0处通常等于1,但在其他滞后处没有明显的相关性证据。Example——短期相关性下图显示了没有趋势或季节性但具有短期相关性的时间序列数据
  1. 问灵十三载
    问灵十三载
    发布于:2022-04-27 16:37:24 回复TA
    间序列数据,自方差和自相关函数测量单个时间序列及其滞后lag之间的协方差/相关性。给出了时间自方差和自相关函数的计算过程。lag=0滞后0处样本的自协方差函数(lag=0)定义为和之间的协方差。根据上述公式,计算方法为:因此,滞后0处的样本自协方差函数为样本方差。同样,滞后0处的
  1. 山野间恋爱
    山野间恋爱
    发布于:2022-04-27 18:03:42 回复TA
    的问题。时间序列数据的主要问题类型取决于数据的上下文和收集数据的原因。以下给出了一些共同目标:描述:描述时间序列的主要特征,例如:序列是增加还是减少;是否存在季节性模式(例如夏季较高,冬季较低);第二个解释变量的值如何
  1. 符雯华军
    符雯华军
    发布于:2022-04-27 09:16:29 回复TA
    蚌下苦轼的时候是不作声的,献出来的最终是明珠。
  1. 戴启飘壮
    戴启飘壮
    发布于:2022-04-27 09:16:29 回复TA
    明明是傻,却说自我是逆向思维。

◎欢迎参与讨论,请在这里发表您的看法、交流您的观点。

使用微信扫描二维码后

点击右上角发送给好友