Aug 01, 2008
シンプソンのパラドックス
シンプソンのパラドックスとは、クロス集計で起こりうる現象である。表頭・表側のキー(軸)を細分化してゆくと、全体もしくは細分化する前と逆の現象をデータが表してしまうことを言う。
例を挙げていうと、100人のアンケート調査で商品Aと商品Bの好感度調査をしたとする。また商品Aの方が好感をもてると言うデータが出たとする。
そこで100人を男女別に採ってもう一度集計すると男は商品Aに好感を持ち、女は商品Bに好感を持つと言う結果を得ることもあり、最初の集計で商品Aが好感をもてると言う仮定が覆されてしまう。全体の傾向と逆の傾向を示すことになる。
統計データは、こういったパラドックスが度々現れるので、注意が必要である。
社内旅行をA案とB案のどちらに行きたいか多数決で決めていないだろうか?
この企業は、相当不満を持っている社員が多いであろう。