統計学 定義まとめ

2018/09/08

範囲

階級値

各階級の最小の値と未満の値を足して2で割ったもの

算術平均

以下の性質が成り立つ

中央値

観測値を大きさの順に並べたとき中央に位置するもの。観測値が偶数の場合は中央2つの値を足して2で割る

最頻値

出現頻度が最も高い観測値

偏差

偏差平方和

分散

偏差平方和の$n$に応じて値が大きくなる性質を考慮し$\frac{1}{n - 1}$で割っている。単位は元の観測値の2乗になる

標準偏差

分散$s^2$で2乗になった単位を元の観測値と同じにする

第1, 2, 3四分位数

観測値を4等分する1

元の観測値の数が奇数

元の観測値の数が偶数

四分位範囲

変動係数

ばらつきの尺度として$s$を用いる場合、平均値と相対的な値にするため$|\overline{x}|$で割る

四分位分散係数

四分位範囲をIQR、中央値をmedとする

変動係数同様ばらつきの尺度として用いられる

標準化

平均値は0, 標準偏差は1となる

偏差値

平均値は50, 標準偏差は10となる。
ある2種類の観測値が正規分布に従う場合、平均値や標準偏差の差異に関わらず結果を比較することができる

移動平均

季節変動と不規則変動を除去し、傾向変動(トレンド)を見出すための技法
変動の周期をNとする時、N項移動平均と呼ばれる

Nが奇数の場合

$N = 2k + 1$とする時

Nが偶数の場合

$N = 2k$とする時

幾何平均

平均を取る値の間に大きな差がない場合、幾何平均を算術平均で代用してもよい

オッズ

ある事象Aの発生確率をpとする

オッズ比

ある事象Aの発生確率をp, 事象Bの発生確率をqとする

この値が1に近いほどaとbは独立になり、0に近いまたは正の大きな値になるほど関係性が強くなる

連関係数

$[0, \infty)$の値をとるオッズ比を$[-1, 1]$の値をとるように変換したもの。1もしくは-1に近づくほど関係性が強くなり、0の場合に独立となる

共分散

観測値xとyについて、

xとyに正の相関があるほど正の大きな値をとり、負の相関があるほど負の大きな値を取り、0にに近いほど関係性が弱くなる

相関係数

xとyをそれぞれ標準化した値の共分散を計算したもの。共分散は範囲が$(\infty, -\infty)$でありxとyの単位のとり方が値の大きさに影響するため、これを$[-1, 1]$とし単位に無関係な値にしている。

確率

基本事象$\Omega$があるとき、任意の事象Aについて以下の規則を全て満足するときにP(A)をAの確率とよぶ

条件付き確率

事象Aが起こったという条件の下で事象Bが起こる確率

確率の乗法定理

条件付き確率の式より

事象の独立性

事象A, Bについて以下が成り立つとき、AとBは独立であるという

また$P(A) > 0かつP(\overline{A}) > 0$のとき、以下が成り立つ

ベイズの定理

であり

が与えられたとき、$P(A_i|B_j)$を求める以下の式をベイズの定理とよぶ

順列

n個の異なるものからr個を取り出すとする

組み合わせ

n個の異なるものからr個を取り出すとする

離散型確率分布

期待値 (平均値)

また、確率変数xに基づく関数g(x)の期待値は以下の通り

分散

また、確率変数xに基づく関数g(x)の分散は$\sigma^2 = \sum_{i=1}^{m}a_i^2p_i - \mu^2$より以下の通り

標準偏差

連続型確率分布

期待値 (平均値)

また、確率変数xに基づく関数g(x)の期待値は以下の通り

分散

また、確率変数xに基づく関数g(x)の分散は以下の通り

標準偏差

確率分布の1次変換

確率分布の標準化

確率変数xに以下の処理を行うと、平均値0, 標準偏差1のデータとなる

期待値の線形性

以下の2つの性質を期待値の線形性を呼ぶ


  1. 中央値と四分位数の求め方。四分位範囲・四分位偏差とは何か? | アタリマエ! ↩︎