16  演習問題

このコースでは,確率的に生じるデータを意識しながら,そのメカニズムから生成されるデータを乱数によって具体化し,そうしたサンプルデータに基づいて検定と分析のロジックを学んできました。 検定には,サンプルサイズ,有意水準,検出力,効果量が相互に関わっており,確率的判断がこれらの関数としてどのように現れるかを確認しました。 また仮想データをつくれるところから,QRPsのシミュレーションを行ったり,例数設計が行えることも見てきました。 線形モデルやそのほか発展的なモデルについても,データ生成メカニズムの観点からアプローチできます。

より発展的な内容になりますが,確率的プログラミング言語を用いれば,データ生成メカニズムを記述することでモデルパラメータの推定が可能になります。 確率的プログラミング言語を利用するには,プログラミングの技術,ベイズ統計の理論,MCMCによる近似の理論と方法についての知識が必要です。 これらは,このコースで扱ってきたR言語による非ベイズ統計的モデルへの乱数近似アプローチのちょっと先にあるものです。

本コースの内容を十分に身につけていれば,すぐにでも対応できるでしょう!

16.1 最終課題

  • 無相関検定において,真の状態が母相関\(\rho=0.4\)であったときに,サンプルサイズ\(n=20\)のデータをとって検定を行うとします。この時の帰無仮説の分布と,真の状態の分布を重ねて図示し,\(\alpha=0.05\)の臨界値,検出力を可視化する図を描くコードを書いてください。(参考;南風原 (2002) ,Pp.144)

  • 2要因Betweenデザインの分散分析において,交互作用のみ有意になるようなサンプルデータを作るコードを書いてください。また,サンプルデータが正しくできているかどうかを確認するために,anovakunでの分析結果も出力させてください。

  • 2つの変数X,Yをもつ3つの群があり,群ごとX,Yの相関を見るとすべて\(r = -0.3\)程度の負の相関を持っているが,3つの群をあわせてX,Yの相関を見ると正の相関を示すようなデータセットを作流コードを書いてください。なお,出来上がったデータは群ごとに色分けした散布図で図示するようにしてください。

    • ヒント:群ごとに回帰分析のサンプルデータを作ることを考え,傾きは一貫して\(\beta_1=-0.3\)であるのに対し,群ごとの切片\(\beta_0\)を適当に調整すると良いでしょう。
    • ねらい:このようなデータは,相関を見るときに可視化することの重要性を伝えるとともに,階層線形モデルの必要性を理解することに役立ちます。