統計学

分散 (variance)

データの散らばりの度合いを表します。

  • 平均 (mean) … データの総計を、データの総数で割った値
  • 分散 (variance) … データの各値と平均との差の2乗を求め、それをデータの総数で割った平均値
  • 標準偏差 (standard deviation) … 分散の正の平方根

ツール

二変量解析

回帰分析 (Regression analysis)

最小二乗法 (Least squares)

最小二乗法とはデータの間に成り立つ関係式を求める方法で、平方和を最小にするような解を最適合の解とします。

共分散 (Covariance)

共分散とは、2つの対応するデータ間での、標準偏差の積の平均値です。

多変量解析 (Multivariate statistics)

クラスタ分析 (Cluster analysis) / クラスタリング (Clustering)

  • 階層的方法 / クラスタリング法 / 凝集型階層手法
    • 最短距離法 (nearest neighbor method / 最近隣法 / 単連結法 (single linkage)) … 最も近い距離
    • 最長距離法 (furthest neighbor method / 最遠隣法 / 完全連結法 (complete linkage)) … 最も遠い距離
    • 群平均法 (group average method) … 平均の距離
    • 重心法 (centroid method) … データ数を重みとした、重心間の距離
    • メジアン法 (median method / メディアン法) … データ数を考慮しない、重心間の距離
    • ウォード法 (Ward's method / 最小分散法 (minimum variance method)) … データ間の分散の比を最大化
  • 非階層的方法 … 分類数を事前に決める
    • k平均法 (k-means clustering / K-Means法)
      • Lloyd法
      • Forgy法
      • MacQueen法
      • Hartigan-Wong法
    • 自己組織化マップ (Kohonenネットワーク)

階層的方法

非階層的方法

k平均法 (K-Means法 / k-means clustering)
混合ガウスモデル (Gaussian Mixture Model : GMM) / 混合ガウス分布モデル

複数のガウス分布の線形結合で表されるモデル

仮説検定 (hypothesis testing) / Statistical hypothesis testing

仮説のもとで起こる確率が一定の基準 (有意水準) より小さいとき、その仮説を誤りとして判定する方法。

t検定

t分布による検定です。

ノンパラメトリック検定 (nonparametric test)

分布を仮定しない検定です。