アンケート調査設計と調査分析に役立つ検定方法を紹介致します。

商品企画七つ道具ではアンケート調査において、
商品仮説の検証を行います。

アンケート調査の分析結果から
その結果が性別や年代などで差があるかないか検証することが求められます。

アンケート質問例
以下のような自動車の安全装置があるとき、
どの機能が重要かを検証する場合を例にお伝えします。

1.SRSエアバッグ
2.3点シートベルト
3.ABS(アンチブロック・ブレーキシステム)
4.ESC(横滑り防止装置)
5.ACC(オートクルーズ機能)
6.CMBS(衝突被害軽減ブレーキ)
7.誤発進抑制機能

1.フリードマン検定

フリードマン検定は、
3項目以上の中央値が当てはまるかどうかを検定する
ノンパラメトリックな検定方法です。

t検定のノンパラメトリック検定に相当するマン=ホイットニーのU検定では、
データを順位に変えて検定を行います。
マン=ホイットニーのU検定はフリードマン検定と同一です。

各回答者の順位から、それぞれの回答者における順位合計の平均を計算します。
評価項目の順位の平均値に差があるかどうかを検定するものです。
この時、検定統計量として、フリードマン検定統計量を計算します。

アンケート質問例

問1:あなたが重要な機能を1位から5位まで順位を付けて下さい。

1.SRSエアバッグ
2.3点シートベルト
3.ABS(アンチブロック・ブレーキシステム)
4.ESC(横滑り防止装置)
5.ACC(オートクルーズ機能)
6.CMBS(衝突被害軽減ブレーキ)
7.誤発進抑制機能

回答
1位( )→2位( )→3位( )→4位( )→5位( )

・ノンパラメトリック検定とは
母集団分布に正規分布のような特定の分布を仮定せず、
分布の形にこだわらずに行う検定を行います。

分布を特定しているパラメーター(母数、正規分布であれば平均や標準偏差のこと)についての検定では
「ない」ことからノンパラメトリック検定といいます。

・t検定とは
t検定は、2つの標本の平均値が当てはまるかどうかを検定する
統計的な検定方法の一つです。
標本が対応ありと対応なしの2つの検定があります。
標本とはアンケート調査では5段階評価で回答された重要度評価、
総合満足度などの回答を示します。

対応のある標本のt検定は、同じ回答者から得られた
回答の2つの標本に対して用いられます。

例えば、同じ回答者である昨年の重要度評価の平均値と
本年の重要度評価の平均値を比較します。

対応のない標本のt検定は、2つの独立した標本に対して用いられます。
例えば、性別、年代別の重要度の5段階評価の回答の平均値を比較する場合に使用されます。
性別や年代はそれぞれ独立しており、別々回答者から回答されます。

t検定では、まず2つの標本の平均値の差を計算し、
その差を標準偏差で割ったt値を求めます。
その後、t分布表を用いて、基準における数値と比較して、
帰無仮説を棄却するかどうかを判断します。

   SRSエアバッグ重要度の平均値
男性    3.45
女性    3.66
回答人数15人ずつ30人
この場合のt値0.365
平均値の差は0.21なのでこの例の場合は有意差はなしと判断します。

2.MaxDiff法

MaxDiff法は、機能評価などの選択において最も評価が良い評価と
最も評価が悪い評価において
調査手法の一つです。

この手法では、複数の選択肢を用意し、
それらにその中から最も好ましい選択肢と最も好ましくない選択肢を
選んでもらいます。
最も好ましくない選択肢を選んだ度数や比率を求めます。

MaxDiff法は、選択肢の中から最高と最低の2項目を選ぶだけなので
回答者には負担をかけずに選択することができます。

商品評価、製品やサービスの開発などに利用できます。

アンケート質問例

問2:あなたが最も重要な機能と最も重要としない機能は何ですか?

1.SRSエアバッグ
2.3点シートベルト
3.ABS(アンチブロック・ブレーキシステム)
4.ESC(横滑り防止装置)
5.ACC(オートクルーズ機能)
6.CMBS(衝突被害軽減ブレーキ)
7.誤発進抑制機能

回答:最も重要な機能( )、最も重要としない機能( )

3.分割表の検定

アンケート調査において、クロス集計した時に、
その比率の値が差があるかどうかを確認するときに使います。

以下のような機能重要度のアンケート集計結果がある時に、

SRSエアバッグ重要度の回答者数
    重要 どちらともいえない 重要ではない
男性  45     40       15
女性  15     30       55

この集計から、重要度と性別の回答や比率に差があるかないかを確認します。

分割表の検定はカイ二乗検定ともいわれ、
カイ二乗検定は、2つ以上の集計や比率が独立かどうかを調べるために使われる統計検定の一種です。
例えば、ある商品の購入者の属性(男性・女性、年代など)と
その製品の重要度(重要・中立・重要ではない)の間に
関連性があるかどうかを検定することができます。

カイ二乗検定は、以下の手順で行われます。

帰無仮説と対立仮説を立てます。
帰無仮説は、「2つの変数は独立である」というもので、対立仮説は、「2つの変数は独立でない」というものです。

観測値と期待値を求めます。
観測値は、実際に観測されたデータの値で、期待値は、帰無仮説が正しい場合に期待される値です。

カイ二乗値を計算します。
カイ二乗値は、(観測値-期待値)^2/期待値 の和で求めることができます。
自由度と有意水準を設定し、カイ二乗分布表から棄却域を求めます。
求めたカイ二乗値が棄却域に含まれるかどうかを計算します。
含まれる場合は、帰無仮説を棄却し、対立仮説を採択します。
含まれない場合は、帰無仮説を採択します。

カイ二乗検定は、数値変数を扱うため、
例えば商品の評価やユーザー属性などを分析する際に利用されます。
また、カイ二乗検定は、単純な検定であるため、エクセルや多くの統計ソフトウェアに実装されており、
比較的簡単に実施することができます。

ウィルコクソンの検定
ウィルコクソンの検定は、2つの標本が同じ母集団から得られたものであるかどうかを調べるための統計検定の一種です。
つまり、2つの標本の中央値に差があるかどうかを検定するために用いられます。

ウィルコクソンの検定には、2つの方法があります。
1つは、2つの標本の大きさが等しい場合に用いる「対応のある標本に対するウィルコクソンの符号順位検定」で、
もう1つは、2つの標本の大きさが異なる場合に用いる「対応のない標本に対するウィルコクソンの符号順位検定」です。

ウィルコクソンの符号順位検定では、以下の手順で検定を行います。

帰無仮説と対立仮説を立てます。
帰無仮説は、「2つの標本の中央値に差はない」というもので、
対立仮説は、「2つの標本の中央値に差がある」というものです。

2つの標本を1つのデータセットとして結合します。

結合したデータセットを昇順に並べ、順位をつけます。
同じ値の場合は、平均順位を割り当てます。

それぞれの標本から、順位の和を計算します。

順位の和の差を計算し、
その差が帰無仮説の基準値と比較します。

差が棄却域に含まれるかどうかを調べます。
含まれる場合は、帰無仮説を棄却し、対立仮説を採択します。
含まれない場合は、帰無仮説を採択します。

ウィルコクソンの符号順位検定は、中央値に差があるかどうかを検定するため、
データが正規分布に従わない場合にも適用することができます。
また、対応のある標本に対する検定は、2つの標本の関係性を考慮することができるため、
例えば前後の測定値の比較などに適用することです。

3.コクランのQ検定

コクランのQ検定とはノンパラメトリック検定の一つ。
0か1の2値型で対応のあるデータがあるとき、
回答項目の比率の差を検定します。
対応のある2群の比率の差の検定です。

アンケート調査項目では選択肢が
「はい」、「いいえ」などの2項目で回答された質問の検定を示します。

コクランのQ検定の手順は以下の通りです。

まず、アンケートから得られた調査項目の回答比率を計算します。
それぞれの回答項目を大小順に並べ替えます。

最も低い回答率を基準とし、その回答率と次に回答率が低い項目の比率の差を計算します。
その差を、その次に回答率が項目の回答率と比較し、差が大きいものを採用します。
上記の手順を続けて、全ての項目にて比率を比較し、判定します。
判定項目は改善が必要であることが示唆されます。

コクランのQ検定は、データが二値変数であることが条件であるため、
他の統計検定法と比較して簡便な手法でです。
しかし、データが二値変数以外の場合には適用できないため、注意が必要です。

アンケート質問例

問3:あなたが重要と思う機能を「はい」「いいえ」をつけて下さい。

1.SRSエアバッグ はい いいえ
2.3点シートベルト はい いいえ
3.ABS(アンチブロック・ブレーキシステム) はい いいえ
4.ESC(横滑り防止装置) はい いいえ
5.ACC(オートクルーズ機能) はい いいえ
6.CMBS(衝突被害軽減ブレーキ) はい いいえ
7.誤発進抑制機能 はい いいえ

アンケート調査における検定方法はその質問の仕方によって
いくつか方法があります。

アンケート調査の目的に応じて使い分けするとよいでしょう。