Copula(3)
Copula函数中的参数估计
通过前面的分析,我们发现,如果要计算相依性,那么首先要估计copula函数中的未知参数。常用的估计参数的方法有,极大似然估计、两步极大似然估计以及半参数估计。
极大似然估计
假定变量X,Y的边际分布分别为F,G,对应的未知参数用 θ x , θ y \theta_x,\theta_y θx,θy表示。copula函数中未知参数用 θ z \theta_z θz表示,则 θ = ( θ x , θ y , θ z ) \theta=(\theta_x,\theta_y,\theta_z) θ=(θx,θy,θz)。在copula模型下,条件对数似然函数可以表示为:
L ( θ ) = ∏ i = 1 n c ( u i 1 , . . . , u i n ; θ ) L(\theta)=\prod_{i=1}^nc(u_{i1},...,u_{in};\theta) L(θ)=i=1∏nc(ui1,...,uin;θ)
l n ( L T ( θ ) ) = ∑ t = 1 T l n ( c θ z ( F ( x t , θ x ) , G ( y t , θ y ) ) ) + ∑ t = 1 T ( l n [ f ( x t , θ x ) ] + l n [ g ( y t , θ y ) ] ) ln(L_T(\theta))=\sum_{t=1}^Tln(c_{\theta_z}(F(x_t,\theta_x),G(y_t,\theta_y)))+ \sum_{t=1}^T(ln[f(x_t,\theta_x)]+ln[g(y_t,\theta_y)]) ln(LT(θ))=t=1∑Tln(cθz(F(xt,θx),G(yt,θy)))+t=1∑T(ln[f(xt,θx)]+ln[g(yt,θy)])
若上式取得最大值,则需要满足关于参数 θ \theta θ的偏导数为0,即
∂ l n ( L T ( θ ) ) ∂ θ = 0 \frac{\partial ln(L_T(\theta))}{\partial \theta}=0 ∂θ∂ln(LT(θ))=0
极大似然估计在变量个数比较少的时候容易实施,但当变量个数较多时,该估计方法就变得比较困难了。此外,copula函数里面的未知参数有可能与边际分布中的未知参数存在复杂的关系表达式,这将导致似然函数关于未知参数梯度的解析解不存在。
两步极大似然估计
copula模型的似然函数可以分成两部分,一部分是与copula函数中的未知参数有关,另一部分是与边际密度函数中的未知参数有关。
两步极大似然估计的思想为:首先利用极大似然估计单独估计边际密度中的未知参数,因为在估计边际密度中的未知参数时,并不会用到copula函数中未知参数的信息。在估计出边际分布中的未知参数后,将其带入似然函数中,再进行一次极大似然估计,从而得到copula函数中的未知参数。
具体过程:
情形一:两个边际密度的未知参数可以单独估计出:
1.估计边际密度中的未知参数:
θ ^ x ∈ arg max θ x ∈ Θ x ∑ t = 1 T l o g [ f ( x t , θ x ) ] θ ^ y ∈ arg max θ y ∈ Θ y ∑ t = 1 T l o g [ g ( y t , θ y ) ] \hat\theta_x\in \argmax_{\theta_x\in\Theta_x} \sum_{t=1}^Tlog[f(x_t,\theta_x)] \\ \hat\theta_y\in \argmax_{\theta_y\in\Theta_y} \sum_{t=1}^Tlog[g(y_t,\theta_y)] θ^x∈θx∈Θxargmaxt=1∑Tlog[f(xt,θx)]θ^y∈θy∈Θyargmaxt=1∑Tlog[g(yt,θy)]
2.将估计出的边际密度中的未知参数带入似然函数中,然后估计copula函数中的未知参数:
θ ^ z ∈ arg max θ z ∈ Θ z ∑ t = 1 T l o g [ c θ z ( F ( x t , θ ^ x ) , G ( y t , θ ^ y ) ) ] \hat\theta_z\in \argmax_{\theta_z\in\Theta_z} \sum_{t=1}^Tlog[c_{\theta_z}(F(x_t,\hat\theta_x),G(y_t,\hat\theta_y))] θ^z∈θz∈Θzargmaxt=1∑Tlog[cθz(F(xt,θ^x),G(yt,θ^y))]
情形二:两个边际密度的未知参数不能单独分别估计(参考多元GARCH模型)
1.估计边际密度中的未知参数:
( θ ^ x , θ ^ y ) ∈ arg max θ x ∈ Θ x , θ y ∈ Θ y ∑ t = 1 T l o g [ f ( x t , θ x ) ] + ∑ t = 1 T l o g [ g ( y t , θ y ) ] (\hat\theta_x,\hat\theta_y)\in \argmax_{\theta_x\in\Theta_x,\theta_y\in\Theta_y} \sum_{t=1}^Tlog[f(x_t,\theta_x)]+\sum_{t=1}^Tlog[g(y_t,\theta_y)] (θ^x,θ^y)∈θx∈Θx,θy∈Θyargmaxt=1∑Tlog[f(xt,θx)]+t=1∑Tlog[g(yt,θy)]
2.将估计出的边际密度中的未知参数带入似然函数中,然后估计copula函数中的未知参数:
θ ^ z ∈ arg max θ z ∈ Θ z ∑ t = 1 T l o g [ c θ z ( F ( x t , θ ^ x ) , G ( y t , θ ^ y ) ) ] \hat\theta_z\in \argmax_{\theta_z\in\Theta_z} \sum_{t=1}^Tlog[c_{\theta_z}(F(x_t,\hat\theta_x),G(y_t,\hat\theta_y))] θ^z∈θz∈Θzargmaxt=1∑Tlog[cθz(F(xt,θ^x),G(yt,θ^y))]
在一些条件下,上面的参数估计是一致的并且分布是渐进正态的
Copula函数的拟合度检验
目的:检验copula函数能否准确的表示变量间的相关性关系。
常用的方法为非参数Kolmogorov Smimov检验方法
D = max 1 ≤ i ≤ n { ∣ C k − m k n ∣ , ∣ C k − m k − 1 n ∣ } D=\max_{1 \le i \le n}\{|C_k-\frac{m_k}{n}|,|C_k-\frac{m_k-1}{n}|\} D=1≤i≤nmax{∣Ck−nmk∣,∣Ck−nmk−1∣}
C k C_k Ck表示联合观测样本的copula函数值, m k m_k mk为联合观测样本中满足条件的联合观测样本值的个数
Copula函数的拟合优度评价
利用多种Copula函数对多变量联合分布进行拟合后,需采用拟合优度检验指标进行优选,确定最优拟合Copula函数。
1.RMSE准则
R M S E = 1 n ∑ i = 1 n ( y i − y ^ i ) 2 RMSE=\sqrt{\frac{1}{n}\sum_{i=1}^n(y_i-\hat y_i)^2} RMSE=n1i=1∑n(yi−y^i)2
y i y_i yi为经验概率, y ^ i \hat y_i y^i为理论概率。
RMSE值越小,拟合效果越好
2.AIC信息准则
AIC包括,copula函数拟合的偏差与copula函数参数个数导致的不稳定性
A I C = n ln ( M S E ) + 2 m M S E = 1 n ∑ i = 1 n ( y i − y ^ i ) 2 AIC=n\ln(MSE)+2m \\ MSE=\frac{1}{n}\sum_{i=1}^n(y_i-\hat y_i)^2 AIC=nln(MSE)+2mMSE=n1i=1∑n(yi−y^i)2
m为参数个数,AIC越小,拟合效果越好
3.BIC信息准则
B I C = n ln ( M S E ) + m ln n BIC=n\ln(MSE)+m\ln n BIC=nln(MSE)+mlnn
BIC越小,拟合效果越好
Copula函数优选
步骤:
1.选用相应随机变量概率分布函数模拟边缘分布函数,运用非参数Kolmogorov Smimov检验方法对两变量边缘分布函数进行拟合检验
2.选取相关性度量指标(如Kendall秩相关系数,Spearman秩相关系数,Pearson线性相关系数)分析相关性
3.采用相关指标法估计copula函数的未知参数,用非参数Kolmogorov Smimov检验方法对每个联合概率分布函数进行拟合检验
4.运用RMSE准则,AIC,BIC对copula函数进行拟合优度评价,评选出拟合效果最好的copula函数模型作为我们需要的模型