統計学
データの散らばりの度合いを表します。
ツール
二変量解析
回帰分析 (Regression analysis)
最小二乗法 (Least squares)
最小二乗法とはデータの間に成り立つ関係式を求める方法で、平方和を最小にするような解を最適合の解とします。
共分散 (Covariance)
共分散とは、2つの対応するデータ間での、標準偏差の積の平均値です。
多変量解析 (Multivariate statistics)
- 階層的方法 / クラスタリング法 / 凝集型階層手法
- 最短距離法 (nearest neighbor method / 最近隣法 / 単連結法 (single linkage)) … 最も近い距離
- 最長距離法 (furthest neighbor method / 最遠隣法 / 完全連結法 (complete linkage)) … 最も遠い距離
- 群平均法 (group average method) … 平均の距離
- 重心法 (centroid method) … データ数を重みとした、重心間の距離
- メジアン法 (median method / メディアン法) … データ数を考慮しない、重心間の距離
- ウォード法 (Ward's method / 最小分散法 (minimum variance method)) … データ間の分散の比を最大化
- 非階層的方法 … 分類数を事前に決める
- k平均法 (k-means clustering / K-Means法)
- Lloyd法
- Forgy法
- MacQueen法
- Hartigan-Wong法
- 自己組織化マップ (Kohonenネットワーク)
階層的方法
非階層的方法
k平均法 (K-Means法 / k-means clustering)
複数のガウス分布の線形結合で表されるモデル
仮説検定 (hypothesis testing) / Statistical hypothesis testing
仮説のもとで起こる確率が一定の基準 (有意水準) より小さいとき、その仮説を誤りとして判定する方法。
t検定
t分布による検定です。
ノンパラメトリック検定 (nonparametric test)
分布を仮定しない検定です。