AIC准则的理解

AIC准则的理解本文介绍AIC准则的产生及应用。

大家好,又见面了,我是你们的朋友全栈君。

AIC = (-2)ln(模型的极大似然函数) + 2(模型的独立参数个数)

一、AIC准则的产生

(1)最终预报误差

对于自回归 A R ( k ) AR(k) AR(k)模型,用前 k k k期观测值的线性组合拟合当期序列取值,通过选择回归系数使得预测误差达到最小,即选择合适的 a i a_i ai,使得
s k 2 = 1 N ∑ ( y n − a 0 − a 1 y n − 1 − ⋯ − a k y n − k ) 2 s_k^2 = \frac1N\sum(y_n-a_0-a_1y_{n-1}-\cdots – a_ky_{n-k})^2 sk2=N1(yna0a1yn1akynk)2达到最小。
用预报误差的平均值来评价模型拟合的优劣,将其称为最终预报误差 F P E = E ( y n − a ^ k 0 − a ^ k 1 y n − 1 − ⋯ − a ^ k k y n − k ) 2 FPE =E(y_n-\hat{a}_{k0}-\hat{a}_{k1}y_{n-1}-\cdots – \hat{a}_{kk}y_{n-k})^2 FPE=E(yna^k0a^k1yn1a^kkynk)2因此模型的阶数 k k k的选择问题就等价为 F P E FPE FPE的极小化问题
赤池弘次已经提出,对于 A R ( k ) AR(k) AR(k)模型, F P E ( k ) = N + k N − k ( γ ( 0 ) − ∑ i = 1 k ϕ ^ i γ i ) FPE(k) = \frac{N+k}{N-k}(\gamma(0) – \sum_{i=1}^k \hat{\phi}_i \gamma _i) FPE(k)=NkN+k(γ(0)i=1kϕ^iγi)

(2)K-L距离(相对熵)

熵的概念来源于信息论,一般用于衡量信源发出的信息中包含的不确定性的大小,计算公式为 H = − ∑ i = 1 N p ( x i ) ⋅ l o g p ( x i ) H=-\sum_{i=1}^Np(x_i)\cdot \mathrm{log}p(x_i) H=i=1Np(xi)logp(xi)根据熵可以计算出用估计的概率分布近似代替原始数据分布时损失的信息。
K-L距离(相对熵)
p p p为实际概率分布, q q q为估计的概率分布,则K-L距离为 D ( P ∣ ∣ Q ) = E ( l o g P ( X ) Q ( X ) ) = ∫ p ( x ) l o g P ( x ) Q ( x ) d x D(P||Q)=E(\mathrm{log}\frac{P(X)}{Q(X)})=\int p(x)\mathrm{log}\frac{P(x)}{Q(x)}dx D(PQ)=E(logQ(X)P(X)=p(x)logQ(x)P(x)dx,当进行拟合时,希望两分布之间的K-L距离越小越好。

(3)AIC的产生

① 极大似然估计的本质

设因变量 Y Y Y具有条件概率密度函数 f ( y ∣ θ ) f(y|\theta) f(yθ),当使用极大似然法进行参数估计时,实际上是选择使得似然函数 L ( θ ) = f ( y 1 ∣ θ ) ⋯ f ( y N ∣ θ ) L(\theta) =f(y_1|\theta)\cdots f(y_N|\theta) L(θ)=f(y1θ)f(yNθ)达到最大的估计值 θ ^ \hat{\theta} θ^作为参数值。
由于 N → ∞ N\to \infty N时, 1 N ∑ l n f ( y i ∣ θ ) → E l n f ( Y ∣ θ ) \frac1N \sum lnf(y_i|\theta)\to Elnf(Y|\theta) N1lnf(yiθ)Elnf(Yθ)。因此 θ ^ \hat{\theta} θ^也是使得 E l n f ( Y ∣ θ ) Elnf(Y|\theta) Elnf(Yθ)达到最大的估计值。
Y Y Y的真实分布为 g ( y ) = f ( y ∣ θ 0 ) g(y)=f(y|\theta_0) g(y)=f(yθ0),则K-L距离: D ( g ( ⋅ ) ∣ ∣ f ( ⋅ ∣ θ ) ) = ∫ g ( y ) l n g ( y ) f ( y ∣ θ ) d y = E l n g ( Y ) − E l n f ( Y ∣ θ ) D(g(\cdot)||f(\cdot|\theta))= \int g(y)\mathrm{ln}\frac{g(y)}{f(y|\theta)}dy=E\mathrm{ln}g(Y)-E\mathrm{ln}f(Y|\theta) D(g()f(θ))=g(y)lnf(yθ)g(y)dy=Elng(Y)Elnf(Yθ)因此 θ ^ \hat{\theta} θ^即等价于使K-L距离达到最小的参数估计,这也是极大似然法的本质。

② 参数估计量的评价准则

类比 F P E FPE FPE准则,用 E [ D ( g ∣ ∣ f ( ∣ θ ^ ) ) ] E[D(g||f(|\hat{\theta}))] E[D(gf(θ^))]衡量参数估计量的好坏。(这里可以复习一下条件期望的知识),由于 E l n g ( Y ) E\mathrm{ln}g(Y) Elng(Y)为常数,因此只考虑 E [ E l n f ( Y ∣ θ ^ ) ] E[E\mathrm{ln}f(Y|\hat{\theta})] E[Elnf(Yθ^)]

③ AIC准则的导出

λ = max ⁡ l ( θ 0 ) max ⁡ l ( θ ^ ) \lambda = \frac{\max l(\theta_0)}{\max l(\hat{\theta})} λ=maxl(θ^)maxl(θ0),则当 N → ∞ N\to \infty N时, − 2 l n λ → χ 2 ( k ) -2\mathrm{ln}\lambda \to \chi^2(k) 2lnλχ2(k) k k k θ \theta θ的维数。
由于 E ( χ 2 ( k ) ) = k E(\chi^2(k))=k E(χ2(k))=k,因此 2 l ( θ ^ ) 2l(\hat{\theta}) 2l(θ^) 2 l ( θ 0 ) 2l(\theta_0) 2l(θ0)平均多 k k k,则可以导出AIC准则。
当模型为高斯过程时, F P E FPE FPE与AIC准则等价。

(4)AIC准则的评价

  • AIC准则的第一部分是极大似然函数的对数,是从样本信息对总体信息的反映程度即模型拟合情况考虑的;第二部分是对模型复杂度的惩罚,达到满足模型有效性和可靠性条件下参数个数最少。它既考虑了模型的拟合情况,又考虑了复杂度的影响,采用在同等拟合优度条件下参数最少的模型作为估计模型。
  • AIC准则突破了以往仅从模型拟合情况的评价标准,其出发点是最小化K-L距离(相对熵),需要同时满足有效性、可靠性和经济性。AIC值越小,估计概率分布越接近真实分布。
  • 大样本条件下,AIC准则中第二部分的惩罚较小,第一项起主导作用,最优模型不收敛于真实情况。

F P E FPE FPE准则到AIC准则的变化实际上是从预测值差异最小到预测分布差异最小的质的变化。

二、AIC准则的应用

  1. 模型定阶和模型选择
  2. 独立性检验
    列联表独立性检验中,对数似然函数为 l = ∑ i ∑ j n ( i , j ) l n p ( i , j ) l = \sum_i \sum_j n(i,j) \mathrm{ln} p(i,j) l=ijn(i,j)lnp(i,j)当对模型没有限制时,取 p ( i , j ) = n ( i , j ) / N p(i,j) = n(i,j)/N p(i,j)=n(i,j)/N可得最大似然函数值,且参数 p ( i , j ) p(i,j) p(i,j)中可自由取值的个数为 r c − 1 rc-1 rc1,此时AIC信息量为 A I C 1 = ( − 2 ) ∑ i ∑ j n ( i , j ) l n n ( i , j ) N + 2 ⋅ ( r c − 1 ) AIC_1=(-2)\sum_i \sum_j n(i,j) \mathrm{ln} \frac{n(i,j)}{N}+2\cdot (rc – 1) AIC1=(2)ijn(i,j)lnNn(i,j)+2(rc1)当对模型有独立性限制时, p ( i , j ) = p ( i , ⋅ ) p ( ⋅ , j ) , ∑ i p ( i , ⋅ ) = 1 , ∑ j p ( ⋅ , j ) = 1 p(i,j) = p(i, \cdot) p(\cdot,j), \sum_{i}p(i,\cdot) = 1,\sum_{j} p(\cdot, j) = 1 p(i,j)=p(i,)p(,j),ip(i,)=1,jp(,j)=1因此可自由取值的参数个数为 ( r − 1 ) ( c − 1 ) (r-1)(c-1) (r1)(c1),且取 p ( i , j ) = N ( i , ⋅ ) N ⋅ N ( ⋅ , j ) N p(i,j) = \frac{N(i,\cdot)}{N}\cdot \frac{N(\cdot,j)}{N} p(i,j)=NN(i,)NN(,j)时似然函数值达到最大,相应地可以计算出 A I C 2 AIC_2 AIC2
    A I C 2 < A I C 1 AIC_2 <AIC_1 AIC2<AIC1则应当采用有独立性约束模型。
    相比 χ 2 \chi^2 χ2独立性检验,AIC准则不需要主观决定显著性水平的值,因此AIC准则可以用于统计分析自动化
  3. 方差分析
    主要考虑方差分析模型中交互效应显著性问题。
    A I C = N l n ( 残 差 平 方 和 ) + 2 ( 自 由 度 ) AIC = N\mathrm{ln} (残差平方和) + 2(自由度) AIC=Nln()+2()
  4. 因子分析模型
    利用AIC准则确定公共因子的个数,使得公共因子既能解释原始变量较多的信息,又不会因为公共因子过多而造成解释信息冗余、增加解释既有因子的复杂度,同时减少了根据贡献率选择公共因子个数时的主观性作用。
    A I C = − 2 l n ( l ( θ ) ) + 2 ( 参 数 个 数 ) AIC = -2 \mathrm{ln} (l(\theta)) + 2(参数个数) AIC=2ln(l(θ))+2()其中, l n ( l ( θ ) ) = − 1 2 N [ l n ∣ Σ k ∣ + t r ( Σ k − 1 S ) ] \mathrm{ln} (l(\theta))= -\frac1 2 N[\mathrm{ln} |\Sigma_k| + tr(\Sigma_k^{-1}S)] ln(l(θ))=21N[lnΣk+tr(Σk1S)] S = 1 N ∑ ( y i − y ˉ ) ( y i − y ˉ ) ′ S = \frac1 N \sum (y_i – \bar {y})(y_i-\bar{y})’ S=N1(yiyˉ)(yiyˉ) Σ k = A K A K ′ + D k \Sigma_k = A_KA_K’ + D_k Σk=AKAK+Dk

参考文献:
[1] 李子奈.计量经济学模型方法论的若干问题[J].经济动态,2007(10):22-30.
[2] 陈晓峰.AIC准则及其在计量经济学中的应用研究[D].天津:天津财经大学,2012.
[3] 刘璋温.赤池信息量准则 AIC 及其意义[J].数学的实践与认识,1980(03):64-72.

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 举报,一经查实,本站将立刻删除。

发布者:全栈程序员-用户IM,转载请注明出处:https://javaforall.cn/142188.html原文链接:https://javaforall.cn

【正版授权,激活自己账号】: Jetbrains全家桶Ide使用,1年售后保障,每天仅需1毛

【官方授权 正版激活】: 官方授权 正版激活 支持Jetbrains家族下所有IDE 使用个人JB账号...

(0)


相关推荐

  • springboot—@Async实现异步调用及异步回调Future「建议收藏」

    springboot—@Async实现异步调用及异步回调Future「建议收藏」异步调用相对的是同步调用。同步方法调用的时候必须是按照顺序执行的,上一行代码执行完,才会执行下一行。而异步方法调用是相当于多个线程执行,不需要等待上一行代码的执行结果。首先测试方法同步的情况:controller:packagespringboot_async.async_test;importorg.springframework.beans.factory.annot…

  • AES加密算法的详细介绍与实现

    AES加密算法的详细介绍与实现AES简介高级加密标准(AES,AdvancedEncryptionStandard)为最常见的对称加密算法(微信小程序加密传输就是用这个加密算法的)。对称加密算法也就是加密和解密用相同的密钥,具体的加密流程如下图:下面简单介绍下各个部分的作用与意义:明文P没有经过加密的数据。密钥K用来加密明文的密码,在对称加密算法中,加密与解密的密钥是相同的。密钥为接收方与发送方协商产生

  • Python机器学习的步骤

    Python机器学习的步骤原文出处:kdnuggets译文出处:数据工匠开始。这是最容易令人丧失斗志的两个字。迈出第一步通常最艰难。当可以选择的方向太多时,就更让人两腿发软了。从…

  • 开放6379端口

    开放6379端口开放6379端口/sbin/iptables-IINPUT-ptcp–dport6379-jACCEPT保存配置/etc/rc.d/init.d/iptablessave转载于:https://www.cnblogs.com/itniwota/p/9138347.html

  • RowBounds实现分页[通俗易懂]

    RowBounds实现分页[通俗易懂]但使用RowBounds后,会将id>0的所有数据都加载到内存中,然后跳过offset=3条数据,截取10条数据出来,若id>0的数据有100万,则100w数据都会被加载到内存中,从而。

  • redhat安装yum源_redhat yum源

    redhat安装yum源_redhat yum源Yum是RedHat和基于RedHat的Linux发行版中的包管理器,它允许您管理RedHat系统上软件的各个方面。你不会在这里详细学习Yum命令,相反,这个Yum备忘单为您提供了所有主要Yum包管理器命令及其各自功能的快速简单的概述。安装、卸载和升级包以下是用于安装、删除和更新软件包的Yum命令。install:从yum存储库安装软件包sudoyuminstallnginxremove:删除已安装的软件包及其依赖项sudoyumre

    2022年10月29日

发表回复

您的电子邮箱地址不会被公开。

关注全栈程序员社区公众号