中心極限定理(ちゅうしんきょくげんていり、英: central limit theorem, CLT)は、確率論・統計学における極限定理の一つ。
大数の法則によると、ある母集団から無作為抽出した標本の算術平均は、標本の大きさを大きくすると母集団の母平均に近づく。これに対して中心極限定理は、標本の算術平均と母平均との誤差の確率分布が、定理の条件が満たされれば、標本の大きさを大きくすると近似的に期待値ゼロの「正規分布」になることをいう。
なお、母集団の分散が存在しないあるいは有限の実数にならないときには、標本平均と母平均の誤差の分布の極限が正規分布と異なる場合もある。
中心極限定理は、統計学における基本定理であり、例えば世論調査における必要サンプルのサイズの算出等に用いられる。
期待値 μ と分散 σ2 を持つ独立同分布に従うn個の確率変数 X1, X2, …… , Xn に対して とおくと、
- [要出典]
という等式が成り立ち、右辺は期待値 nμ, 分散 nσ2 の正規分布 N(nµ, nσ2) の特性関数となる。これを中心極限定理という。
ただし、 は確率変数 の特性関数、i は虚数単位、t ∈ R は特性関数の引数である。
中心極限定理は、確率変数 X1, X2, …… , Xn がどのような確率分布に従っていたとしても常に成立する、非常に強力な定理である。そのため、いろいろな確率分布のなかでも、正規分布は特に重要視されることが多い。
なお上記の定理により、標本平均 が期待値 μ, 分散 σ2/n の正規分布 N(μ, σ2/n) に収束することや、正規分布 N(μ, σ2) の確率密度関数 が で与えられることなども、ただちに導かれる。
中心極限定理は、特性関数(とレヴィの連続性定理)を用いることにより証明できる。
{X1, …, Xn} を独立同分布に従う確率変数とする。分布の平均を µ、分散を σ2 とする。ここで部分和 Sn = X1 + … + Xn を考えると、その平均と分散はそれぞれ nµ, nσ2 となる。 を標準化した確率変数を とおくと、
-
を得る。最後の式では新たに、 を標準化した確率変数 Yj を導入した。ここで、Zn の特性関数は、独立性より積の期待値は期待値の積になるため、
-
最後の等式は全ての Yj は同一分布に従うため同じ特性関数を持つことから導いた。ここで、 をマクローリン展開する。
-
より
-
となる。ここで、O はランダウの記号である。この式と指数関数の定義
-
を用いると、 の における極限が以下のように求められる。
-
最後の関数は標準正規分布 N(0, 1) の特性関数である。特性関数と確率分布の対応は一対一なので、この結果は、Zn の確率分布が の極限で標準正規分布 N(0, 1) に収束することを意味する[注釈 1]。
以上により、部分和 Sn = X1 + … + Xn は正規分布 N(nµ, nσ2) に収束し、標本平均 は正規分布 N(µ, σ2/n) に収束することが証明された。
より一般化された確率理論(確率の公理)では、中心極限定理は弱収束理論 (weak-convergence theories) の一部となる。それによると、独立同分布 (i.i.d.) に従う確率変数の分散(2次のモーメント)が有限な場合は「確率変数の和の確率分布」は変数の数が多くなるに従い正規分布に収束する[注釈 2]が、確率変数が従う分布の裾が |x|−α−1(ただし 0 < α < 2)のべき乗で減衰する場合(分布の裾が厚くなり分散は無限大に発散して)(正規分布には収束せず)特性指数 α の安定分布に収束する[1]。
※なお安定分布は特性指数が 0 < α < 2 のとき分散は無限大となり、分布の裾が冪乗則に従うファットテールを有する。
- ^ Voit, Johannes (2003). The Statistical Mechanics of Financial Markets. Springer-Verlag. p. 124. ISBN 3-540-00978-7
- Feller, William (1968). An introduction to probability theory and its applications. I (Third ed.). John Wiley & Sons, Inc.. ISBN 0-471-25711-7
ウィキメディア・コモンズには、
中心極限定理に関連するカテゴリがあります。