尖度

尖度(せんど、: kurtosis)は、確率変数確率密度関数や頻度分布の鋭さを表す指標である。正規分布と比べて、尖度が大きければ鋭いピークと長く太い裾をもった分布であり、尖度が小さければより丸みがかったピークと短く細い尾をもつ分布である。日本産業規格では、とがり (kurtosis) として平均値まわりの 4 次のモーメント μ4 の標準偏差 σ の 4 乗に対する比 μ4/σ4 と定義している[1][2]

2種類の定義

尖度には、4次の標準化モーメントとも呼ばれるμ4/σ4から3を引いて正規分布の尖度を 0 とする定義と、4次の標準化モーメントをそのまま用いて正規分布の尖度を 3 とする定義があることに注意。これら2種類の定義の違いは、尖度が正規分布との乖離をみるために使われることに起因している。一般には 正規分布の尖度を 0 とすることが多い。Excelの分析ツール等は正規分布の尖度を 0 としている[注釈 1]。東京大学出版会の「統計学入門」(ISBN 4130420658)やNumerical Recipesなども正規分布の尖度が 0 となるように、尖度を定めている。

モーメントによる定義

確率変数 X {\displaystyle X} の分布関数を F ( X ) {\displaystyle F(X)}

μ = E [ X ] = X d F ( x ) {\displaystyle \mu =E[X]=\int XdF(x)}
μ r = E [ ( X μ ) r ] = ( X μ ) r d F ( x ) {\displaystyle \mu _{r}=E[(X-\mu )^{r}]=\int (X-\mu )^{r}dF(x)} r {\displaystyle r} は正整数)

とする。このとき、分布関数 F ( X ) {\displaystyle F(X)} の尖度 β 2 {\displaystyle \beta _{2}} は次式である(各積分値が存在すると仮定している)。

  • 正規分布の尖度を 0 とする定義では、
    β 2 = μ 4 μ 2 2 3 {\displaystyle \beta _{2}={\frac {\mu _{4}}{{\mu _{2}}^{2}}}-3}
  • 正規分布の尖度を 3 とする定義では、
    β 2 = μ 4 μ 2 2 {\displaystyle \beta _{2}={\frac {\mu _{4}}{{\mu _{2}}^{2}}}}

キュムラントによる定義

確率変数 X {\displaystyle X} r {\displaystyle r} 次のキュムラント[注釈 2] κ r {\displaystyle \kappa _{r}} とすると、尖度 β 2 {\displaystyle \beta _{2}} は次式で定義される。

  • 正規分布の尖度を 0 とする定義では、
    β 2 = κ 4 κ 2 2 {\displaystyle \beta _{2}={\frac {\kappa _{4}}{{\kappa _{2}}^{2}}}}
  • 正規分布の尖度を 3 とする定義では、
    β 2 = κ 4 κ 2 2 + 3 {\displaystyle \beta _{2}={\frac {\kappa _{4}}{{\kappa _{2}}^{2}}}+3}

計算例

正規分布の尖度。モーメント母関数 MX(t) のキュムラント母関数は

log ( M X ( t ) ) = μ t + σ 2 t 2 / 2 {\displaystyle \log(M_{X}(t))=\mu t+\sigma ^{2}t^{2}/2}

から κ 1 = μ {\displaystyle \kappa _{1}=\mu } κ 2 = σ {\displaystyle \kappa _{2}=\sigma } κ r = 0   ( r 3 ) {\displaystyle \kappa _{r}=0\ (r\geq 3)} となり、3 次以上のキュムラントはすべて 0 であることがわかる。したがって、正規分布の尖度は β 2 = 0 {\displaystyle \beta _{2}=0} (または 3)となる。

尖度の意味

正規分布と、それより尖度が大きく等しい平均値標準偏差をもつ確率密度関数を示す。

模式的であるが、平均値の周りでは尖りが大きく裾を引いた分布であることがわかる。 「尖度」(尖=とがり)と表現するのは誤解しやすく、裾の重さというほうが実態を表している(詳細は参考文献を参照)。

特殊な分布

p ( x ) = 1 α B ( m 1 2 , 1 2 ) [ 1 + ( x λ α ) 2 ] m {\displaystyle p(x)={\frac {1}{\alpha \,\mathrm {\mathrm {B} } \!\left(m-{\frac {1}{2}},{\frac {1}{2}}\right)}}\left[1+\left({\frac {x-\lambda }{\alpha }}\right)^{\!2\,}\right]^{-m}\!}

では両者(裾の重さと平均値の周りでは尖り)の概念は一致するが、一般の分布では一致しないのは明らかである。

標本モーメントによる母集団の尖度推定

ここでは、標本の大きさ n {\displaystyle n} の標本に基づく母集団の尖度の推定を考える [注釈 3]

一般には、尖度の定義の分母分子の不偏推定量をもって母集団の尖度の推定量とする方法がもっとも多く使用される。具体的には、母集団のキュムラントの不偏推定量である k統計量 (k-statistics)[注釈 4]を使った計算方法である。 r {\displaystyle r} 次の k統計量を k r {\displaystyle k_{r}} 、平均周りの r {\displaystyle r} 次のモーメントを m r = 1 n i = 1 n ( x i x ¯ ) r {\displaystyle m_{r}={\frac {1}{n}}\sum _{i=1}^{n}(x_{i}-{\overline {x}})^{r}} とすると、

k 2 = n n 1 m 2 {\displaystyle k_{2}={\frac {n}{n-1}}m_{2}}
k 4 = n 2 ( n 1 ) ( n 2 ) ( n 3 ) { ( n + 1 ) m 4 3 ( n 1 ) m 2 2 } {\displaystyle k_{4}={\frac {n^{2}}{(n-1)(n-2)(n-3)}}\left\{(n+1)m_{4}-3(n-1){m_{2}}^{2}\right\}}

なので、上の 2 式をキュムラントによる定義に代入して推定量とする方法である。

最終的には β 2 {\displaystyle \beta _{2}} の推定量 b 2 {\displaystyle b_{2}} について次を得る。

b 2 = n ( n + 1 ) ( n 1 ) ( n 2 ) ( n 3 ) i ( x i x ¯ s ) 4 3 ( 3 n 5 ) ( n 2 ) ( n 3 ) {\displaystyle b_{2}={\frac {n(n+1)}{(n-1)(n-2)(n-3)}}\sum _{i}\left({\frac {x_{i}-{\overline {x}}}{s}}\right)^{4}-{\frac {3(3n-5)}{(n-2)(n-3)}}}
ここで、 s = n n 1 m 2 {\displaystyle s={\sqrt {{\frac {n}{n-1}}\,m_{2}}}} (不偏標準偏差)

3 を引いた定義では、次式になる。

n ( n + 1 ) ( n 1 ) ( n 2 ) ( n 3 ) i ( x i x ¯ s ) 4 3 ( n 1 ) 2 ( n 2 ) ( n 3 ) {\displaystyle {\frac {n(n+1)}{(n-1)(n-2)(n-3)}}\sum _{i}\left({\frac {x_{i}-{\overline {x}}}{s}}\right)^{4}-3{\frac {(n-1)^{2}}{(n-2)(n-3)}}}

分布と尖度

分布 尖度
ラプラス分布 3
双曲線正割分布 2
ロジスティック分布 6/5
正規分布 0
二乗余弦分布 −0.593762…
ウィグナー半円分布 −1
一様分布 −6/5

上記の分布の歪度は、全て 0 である。

注釈

  1. ^ 歪度 β 1 = E ( X μ ) 3 / [ E ( X μ ) 2 ] ( 3 / 2 ) {\displaystyle \beta _{1}=E{(X-\mu )^{3}}/[E{(X-\mu )^{2}}]^{(3/2)}} 、分散 σ = E ( X μ ) 2 {\displaystyle \sigma =E{(X-\mu )^{2}}} は不等式による制限があるので、注意する必要がある。当然ながら、標本における歪度と尖度は互いに独立ではない。 コーシー・シュワルツの不等式を考えれば、尖度 β 2 {\displaystyle \beta _{2}} は 1 より大きく、3 を引いた尖度は −2 以上の値をとることは明らかであろう。
  2. ^ 簡単に言えば、モーメント母関数 M X ( t ) {\displaystyle M_{X}(t)} の対数をとった関数を t = 0 {\displaystyle t=0} の周りで形式的に展開し、 t {\displaystyle t} について整理したときの、 r {\displaystyle r} 次の係数が κ r {\displaystyle \kappa _{r}} である。
  3. ^ 厳密な意味での標本における尖度についての不偏推定量の研究は、省略する。
  4. ^ 具体的には E { k r } = κ r {\displaystyle E\{k_{r}\}=\kappa _{r}} となる性質がある。

出典

  1. ^ JIS Z 8101-1 : 1999, 1.20 とがり kurtosis.
  2. ^ JIS Z 8101-1 : 2015, 1.21 とがり.

参考文献

  • A Dictionary of Statistical Terms, 4th edition(Kendall, Maurice G.;Buckland, William R.)
    • ケンドール 統計学用語辞典 (訳 千葉大学統計グループ) (丸善) ISBN 4621032038
  • 西岡康夫『数学チュートリアル やさしく語る 確率統計』オーム社、2013年。ISBN 9784274214073。 
  • 日本数学会『数学辞典』岩波書店、2007年。ISBN 9784000803090。 
  • JIS Z 8101-1:1999 統計 − 用語と記号 − 第1部:確率及び一般統計用語, 日本規格協会, (1999), http://kikakurui.com/z8/Z8101-1-1999-01.html 
  • JIS Z 8101-1:2015 統計 − 用語と記号 − 第1部:確率及び一般統計用語, 日本規格協会, (2015) 
  • 伏見康治『確率論及統計論』河出書房、1942年。ISBN 9784874720127。http://ebsa.ism.ac.jp/ebooks/ebook/204 

関連項目