2007/11/20

外れ値の処理

はずれ値(アウトライヤー)を検出するためによく用いられている方法として、平均値±c×標準偏差の範囲を越えるデータをはずれ値と見なす、というものがある。
このとき用いられるcの値は、2だったり3だったりと様々だ。
おそらく多くの場合、なんとなく適当に(分析がうまくいくように)cの値を設定しているのではないだろうか。

SelstとJolicoeurの論文を見ると、cの値はサンプル数に応じて変えるべきだという。彼らが推奨する数値が載っていたので、cの値を表示するFlashを作ってみた。







サンプル数を入力して計算ボタンを押すとcの値(除外基準)が表示される。
論文の表に載っていなかった部分は、線形補間せよとあったので、そのようにして求めている。

なお、これは、はずれ値と思われるデータもひっくるめて、全部のデータで標準偏差を求める場合(非再帰的方法)の値だ。
一番大きい値を除外してから標準偏差を求める方法(再帰的方法)では値が異なっている。

なお、このフラッシュで表示される値を元にはずれ値を処理される方は、自己責任で行ってください。

Selst, M. V., & Jolicoeur, P. (1994). A solution to the effect of sample size on outlier elimination. Quarterly Journal of Experimental Psychology A, 47, 631-650.

[おねがい]
心理学の実験に参加したことがありますか?
数分で終わる簡単なゲームのようなことをしていただいています。
「急募!」アイコンをクリックすると、大至急データが必要な実験のページが開きます。まずは実験一覧を見たいという方は、「被験者募集中!」アイコンをクリックしてください。
急募! 被験者募集中!


[ランキング]よろしかったら押してください
banner2にほんブログ村 哲学ブログ 心理学へ

≪ この位置には乗車口がありませんホーム私が娘のことを好きな理由 (25) ≫

Comment

コメントの投稿

 
管理人にのみ表示する
 

Track Back

TB URL

Home

 

カテゴリー

プロフィール

瀬山淳一郎

Author:瀬山淳一郎
とある大学の心理学研究室のすみっこで実験心理学の研究をしている一児の父です。インターネット上で、あまり心理学っぽくない心理実験をやっています。ちょっとした空き時間(数分程度)のあるときに実験に参加していただけると助かります。下のアイコンをクリックすると、実験のページが開きます。

最近の記事

最近のコメント

最近のトラックバック

月別アーカイブ

FC2カウンター

FC2オンラインカウンター

現在の閲覧者数:
無料カウンター

バロメーター

FC2ブログランキング

FC2ブログランキング

リンク

このブログをリンクに追加する

ブロとも申請フォーム

この人とブロともになる

ブログ内検索

RSSフィード

Powered By FC2ブログ

Powered By FC2ブログ
ブログやるならFC2ブログ