特定テーマに限定したWikiを立ち上げる必要もなく、ブログの様に私見をまとめる必要もない、
- 講義の予習ノート
- 読書ノート
- メモ
などの雑記帳Wikiから移行した投稿。
YouTubeでの距離法、再節約法、最尤法講義に関するメモ。
リサンプリング統計手法
- 母集団からサンプリングされた標本を仮の母集団とする。
- 仮の母集団からデータをサンプリングし、標本とする。
- 問題点
- 標本は、母集団にはないバイアスを持つ可能性がある。→結果に影響する。
- バイアスを小さくするには、標本データ数を多くしなければならない。
ブーツストラップ | 無作為同数サンプリング(重複有) |
ジャックナイフ | 無作為同数サンプリング(重複無) |
モンテカルロ | パラメータ推定値に基づくデータ生成 |
ブーツストラップ(ノンパラメトリック・ブーツストラップ)
母集団のデータを無作為に選択し、標本とする。
単一標本中に、複数の同一データが含まれることがある。→重複
オリジナル・ツリー | 元データから計算された近隣結合樹 |
コンセンサス・ツリー | リサンプリング・データの系統樹を集計したもの→元データとは無関係 |
ジャックナイフ
母集団のデータを無作為に消去し、標本とする。
単一標本中に、複数の同一データが含まれない。
消去するデータ数が少ない。→標本ごとのばらつきが少ない。
系統推定法
~ | 速度 | 間違い | ||
距離法 | 高速 | 単一解 | 情報損失 | 距離尺度が重要 |
再節約法 | 速い | 複数解 | Felsenstein zone | |
最尤法 | 最も遅い | Farris zone | ||
ベイズ法 | 遅い~~最尤法より高速 | 事前確率 | 収束判断に苦しむ |