外れ値の処理
はずれ値(アウトライヤー)を検出するためによく用いられている方法として、平均値±c×標準偏差の範囲を越えるデータをはずれ値と見なす、というものがある。
このとき用いられるcの値は、2だったり3だったりと様々だ。
おそらく多くの場合、なんとなく適当に(分析がうまくいくように)cの値を設定しているのではないだろうか。
SelstとJolicoeurの論文を見ると、cの値はサンプル数に応じて変えるべきだという。彼らが推奨する数値が載っていたので、cの値を表示するFlashを作ってみた。
サンプル数を入力して計算ボタンを押すとcの値(除外基準)が表示される。
論文の表に載っていなかった部分は、線形補間せよとあったので、そのようにして求めている。
なお、これは、はずれ値と思われるデータもひっくるめて、全部のデータで標準偏差を求める場合(非再帰的方法)の値だ。
一番大きい値を除外してから標準偏差を求める方法(再帰的方法)では値が異なっている。
なお、このフラッシュで表示される値を元にはずれ値を処理される方は、自己責任で行ってください。
Selst, M. V., & Jolicoeur, P. (1994). A solution to the effect of sample size on outlier elimination. Quarterly Journal of Experimental Psychology A, 47, 631-650.
[おねがい]
心理学の実験に参加したことがありますか?
数分で終わる簡単なゲームのようなことをしていただいています。
「急募!」アイコンをクリックすると、大至急データが必要な実験のページが開きます。まずは実験一覧を見たいという方は、「被験者募集中!」アイコンをクリックしてください。

[ランキング]よろしかったら押してください

このとき用いられるcの値は、2だったり3だったりと様々だ。
おそらく多くの場合、なんとなく適当に(分析がうまくいくように)cの値を設定しているのではないだろうか。
SelstとJolicoeurの論文を見ると、cの値はサンプル数に応じて変えるべきだという。彼らが推奨する数値が載っていたので、cの値を表示するFlashを作ってみた。
サンプル数を入力して計算ボタンを押すとcの値(除外基準)が表示される。
論文の表に載っていなかった部分は、線形補間せよとあったので、そのようにして求めている。
なお、これは、はずれ値と思われるデータもひっくるめて、全部のデータで標準偏差を求める場合(非再帰的方法)の値だ。
一番大きい値を除外してから標準偏差を求める方法(再帰的方法)では値が異なっている。
なお、このフラッシュで表示される値を元にはずれ値を処理される方は、自己責任で行ってください。
Selst, M. V., & Jolicoeur, P. (1994). A solution to the effect of sample size on outlier elimination. Quarterly Journal of Experimental Psychology A, 47, 631-650.
[おねがい]
心理学の実験に参加したことがありますか?
数分で終わる簡単なゲームのようなことをしていただいています。
「急募!」アイコンをクリックすると、大至急データが必要な実験のページが開きます。まずは実験一覧を見たいという方は、「被験者募集中!」アイコンをクリックしてください。

[ランキング]よろしかったら押してください

Comment
コメントの投稿
Track Back
Copyright © 被験者募集中(心理実験編). all rights reserved.
Template by はじめてのブログデザイン
ホームページ
アフィリエイト レンタルサーバーFC2ブログ 専門学校 はじめてのブログ選び


