統計関係用語集
量的変数 ・・・ 量が人によって変わるもの
質的変数 ・・・ 分類を意味する変数(男女など)
連続変数 ・・・ 値が連続している変数 (身長)
離散変数 ・・・ 値が飛び飛びの変数(テストの点)
データを整理する
度数分布表
棒グラフ ・・・ 質的変数、離散変数向け
ヒストグラム ・・・ 量的変数、連続変数向け
散布図(相関図) ・・・2変数を対応させてグラフ上にプロット
代表値
平均 ・・・ データの中心
最頻値(モード) ・・・ 最も度数が大きい値
中央値(メディアン)・・・ 順に並べた場合の真ん中の値
外れ値 ・・・ 例外的な値。
抵抗性 ・・・ 外れ値に引きずれれにくさ。平均は抵抗性が低い代表値といえる
散布度
散らばり具合。
偏差 ・・・ 平均との差
分散 ・・・ 偏差の2乗の平均
標準偏差 ・・・ 分散の平方値
平均偏差 ・・・ 偏差の絶対値の平均
範囲 ・・・ 最大値と最小値の差。抵抗性は低い
Z得点 ・・・ (得点ー平均)÷ 標準偏差
偏差値 ・・・ 平均50、標準偏差が10となる標準値
検定
背理法 ・・・ 証明したいことと反対の仮定をとり、その仮定の矛盾を証明して、証明したかったことを証明する。
帰無仮説 ・・・検定の際に利用する仮説。
対立仮説 ・・・ 帰無仮説と逆の仮説。つまり本来検定したい仮説。
有意 ・・・ 「帰無仮説を棄却する」ことで、対立仮説が採択されること。「統計的に有意である」→ 「帰無仮説を棄却された」
有意水準 ・・・ 有意であるかの境界。一般的には5%(1%の場合もある)。p値が5%を下回れば「有意である」と述べて良い。5〜10%であれば「有意傾向であった」(「もう少しで有意である」の意)と述べて良い。
F検定 ・・・ 2群の分散の大きさに差があるかどうかを調べる
p値 ・・・ 有意確率。限界水準。
事後検定
関係を見る
クロス集計 ・・・ 2つ以上の異なる項目(質的変数)に対する回答を,関連づけて示したもの
観測度数 ・・・ クロス表内の値
連関 ・・・ 関連のこと
相関係数 ・・・ 2つの量的変数の関連性を示す値。一般にはピアソンの積率相関係数。共分散を標準偏差の積で割ったもの
尺度
名義尺度
順序尺度
間隔尺度
比率尺度
天井効果・床効果 ・・・ 選択肢の回答が、両極端に偏ってしまい、個人差を見つけることができない
回帰分析
回帰モデル ・・・ ある変数の変動が他の変数に影響を受けているか?方向性がある。(相関には方向性はない)
説明変数 ・・・影響を与える変数
被説明変数 ・・・ 影響を受ける変数
因子分析
各項目に対する反応から,その背後にある因子を推定する分析法
因子 ・・・ 各項目に影響を与えていると仮定される要素
固有値 ・・・ いくつの因子を抽出するかを決定する基準
因子負荷量 ・・・ それぞれの項目が,ある因子を反映している程度(絶対値:0~1)と向き(正負)を示す数値
探索的因子分析 ・・・ある概念に従い,それを測定しうるだろうと考えられる項目を集め,データを収集し,そこにどのような因子が見られるかを探索的に検討する。新たに尺度を作る場合に利用。
確認的因子分析 ・・・確固たる因子の仮定があって,それにしたがって分析を行う
初期解 ・・・ 回転前の推定値
寄与 ・・・ 自乗和を項目数で割ったもの
寄与率 ・・・ 寄与の%表示。分散の大きさ。
スクリー基準 ・・・ 固有値に急激な落ち込みが見られるところを基準
ガットマン・カイザーの基準 ・・・ 1を基準とし,1以上の固有値がいくつあるかで因子数を決定する
χ2乗検定
クロス集計されるデータの関連性を検定する。質的変数が対象。
観測度 ・・・ 実際のデータ
期待度 ・・・ 割合に差がないと仮定した場合の値
t検定
2群の平均値の差が有意なものかどうかについての検定。等分散であることが前提。3群以上には使えない。
ウェルチのt検定 ・・・ 等分散でない場合のt検定
対応のあるデータ ・・・事前と事後のように比較する2群が同じである
対応のないデータ ・・・比較する2群が異なる信頼区間 ・・・ 母平均が含まれる範囲(95%区間、99%区間)
t分布表 ・・・自由度(df)に対応する各有意水準でのt値の臨界値を示す表
t値
自由度(df)
有意水準(危険率:p) ・・・ 起こりうる確率。5%や1%が目安→「差がある」。5~10%→「有意傾向にある差がある(認められる)」と記述する。
帰無仮説 ・・・ 「2群の平均値に差が無い」ことが成り立つ確率。→ めったに無いような確率の現象→ 「差が無いとはいえない」→ つまり差がある
事後検定
分散分析(ANOVA)
平均値に関する検定
3つの平均の比較
統計的検定の留意点
サンプルサイズが大きければ大きいほど有意になりやすい
検定力(有意な相関係数を得る確率)をもとにサンプルサイズを決める
5%、1%の有意水準は慣習であり、理論的根拠はない