Technically Impossible

Lets look at the weak link in your statement. Anything "Technically Impossible" basically means we haven't figured out how yet.

20191103 7.距離法・最節約法・最尤法の演習

特定テーマに限定したWikiを立ち上げる必要もなく、ブログの様に私見をまとめる必要もない、

  • 講義の予習ノート
  • 読書ノート
  • メモ

などの雑記帳Wikiから移行した投稿。

YouTubeでの距離法、再節約法、最尤法講義に関するメモ。



リサンプリング統計手法

  • 母集団からサンプリングされた標本を仮の母集団とする。
  • 仮の母集団からデータをサンプリングし、標本とする。
  • 問題点
    • 標本は、母集団にはないバイアスを持つ可能性がある。→結果に影響する。
    • バイアスを小さくするには、標本データ数を多くしなければならない。
ブーツストラップ 無作為同数サンプリング(重複有)
ジャックナイフ 無作為同数サンプリング(重複無)
モンテカルロ パラメータ推定値に基づくデータ生成

ブーツストラップ(ノンパラメトリック・ブーツストラップ)

母集団のデータを無作為に選択し、標本とする。
単一標本中に、複数の同一データが含まれることがある。→重複

オリジナル・ツリー 元データから計算された近隣結合樹
コンセンサス・ツリー リサンプリング・データの系統樹を集計したもの→元データとは無関係

ジャックナイフ

母集団のデータを無作為に消去し、標本とする。
単一標本中に、複数の同一データが含まれない。
消去するデータ数が少ない。→標本ごとのばらつきが少ない。

モンテカルロパラメトリック・ブーツストラップ)

母集団が従う統計モデルを仮定する。
リサンプリング・データの統計量=パラメータ推定値
統計モデルとパラメータ推定値に基づいて、疑似データを生成する。

系統推定法

~ 速度 間違い
距離法 高速 単一解 情報損失 距離尺度が重要
再節約法 速い 複数解 Felsenstein zone
最尤法 最も遅い Farris zone
ベイズ 遅い~~最尤法より高速 事前確率 収束判断に苦しむ