統計関係用語集

教育工学で利用する統計関係の用語集です。

参考資料

    • 量的変数 ・・・ 量が人によって変わるもの
    • 質的変数 ・・・ 分類を意味する変数(男女など)
    • 連続変数 ・・・ 値が連続している変数 (身長)
    • 離散変数 ・・・ 値が飛び飛びの変数(テストの点)

データを整理する

    • 度数分布表
    • 棒グラフ ・・・ 質的変数、離散変数向け
    • ヒストグラム ・・・ 量的変数、連続変数向け
    • 散布図(相関図) ・・・2変数を対応させてグラフ上にプロット

代表値

    • 平均 ・・・ データの中心
    • 最頻値(モード) ・・・ 最も度数が大きい値
    • 中央値(メディアン)・・・ 順に並べた場合の真ん中の値
    • 外れ値 ・・・ 例外的な値。
    • 抵抗性 ・・・ 外れ値に引きずれれにくさ。平均は抵抗性が低い代表値といえる

散布度

散らばり具合。

    • 偏差 ・・・ 平均との差
    • 分散 ・・・ 偏差の2乗の平均
    • 標準偏差 ・・・ 分散の平方値
    • 平均偏差 ・・・ 偏差の絶対値の平均
    • 範囲 ・・・ 最大値と最小値の差。抵抗性は低い
    • Z得点 ・・・ (得点ー平均)÷ 標準偏差
    • 偏差値 ・・・ 平均50、標準偏差が10となる標準値

検定

    • 背理法 ・・・ 証明したいことと反対の仮定をとり、その仮定の矛盾を証明して、証明したかったことを証明する。
    • 帰無仮説 ・・・検定の際に利用する仮説。
    • 対立仮説 ・・・ 帰無仮説と逆の仮説。つまり本来検定したい仮説。
    • 有意 ・・・ 「帰無仮説を棄却する」ことで、対立仮説が採択されること。「統計的に有意である」→ 「帰無仮説を棄却された」
    • F検定 ・・・ 2群の分散の大きさに差があるかどうかを調べる
    • p値 ・・・ 有意確率。限界水準。
    • 有意水準 ・・・ 有意であるかの境界。一般的には5%(1%の場合もある)。p値が5%を下回れば「有意である」と述べて良い。5〜10%であれば「有意傾向であった」(「もう少しで有意である」の意)と述べて良い。
    • t検定 ・・・ 2群の平均値の差の検定。2群の分散が等しいことが前提。
    • 対応のあるデータ ・・・事前と事後のように比較する2群が同じである
    • 対応のないデータ ・・・比較する2群が異なる

関係を見る

    • クロス集計 ・・・ 2つ以上の異なる項目(質的変数)に対する回答を,関連づけて示したもの
    • 観測度数 ・・・ クロス表内の値
    • 連関 ・・・ 関連のこと
    • 相関係数 ・・・ 2つの量的変数の関連性を示す値。一般にはピアソンの積率相関係数。共分散を標準偏差の積で割ったもの

尺度

    • 名義尺度
    • 順序尺度
    • 間隔尺度
    • 比率尺度
    • 天井効果・床効果 ・・・ 選択肢の回答が、両極端に偏ってしまい、個人差を見つけることができない

回帰分析

    • 回帰モデル ・・・ ある変数の変動が他の変数に影響を受けているか?方向性がある。(相関には方向性はない)
    • 説明変数 ・・・影響を与える変数
    • 被説明変数 ・・・ 影響を受ける変数

因子分析

各項目に対する反応から,その背後にある因子を推定する分析法

    • 因子 ・・・ 各項目に影響を与えていると仮定される要素
    • 固有値 ・・・ いくつの因子を抽出するかを決定する基準
    • 因子負荷量 ・・・ それぞれの項目が,ある因子を反映している程度(絶対値:0~1)と向き(正負)を示す数値
    • 探索的因子分析 ・・・ある概念に従い,それを測定しうるだろうと考えられる項目を集め,データを収集し,そこにどのような因子が見られるかを探索的に検討する。新たに尺度を作る場合に利用。
    • 確認的因子分析 ・・・確固たる因子の仮定があって,それにしたがって分析を行う
    • 初期解 ・・・ 回転前の推定値
    • 寄与 ・・・ 自乗和を項目数で割ったもの
    • 寄与率 ・・・ 寄与の%表示。分散の大きさ。
    • スクリー基準 ・・・ 固有値に急激な落ち込みが見られるところを基準
    • ガットマン・カイザーの基準 ・・・ 1を基準とし,1以上の固有値がいくつあるかで因子数を決定する

χ2乗検定

クロス集計されるデータの関連性を検定する。質的変数が対象。

    • 観測度 ・・・ 実際のデータ
    • 期待度 ・・・ 割合に差がないと仮定した場合の値

t検定

2群の平均値の差が有意なものかどうかについての検定。等分散であることが前提。3群以上には使えない。

    • ウェルチのt検定 ・・・ 等分散でない場合のt検定
    • 対応がある・なし ・・・ 2群が同じであるかそうでないか
    • 信頼区間 ・・・ 母平均が含まれる範囲(95%区間、99%区間)
    • t分布表 ・・・自由度(df)に対応する各有意水準でのt値の臨界値を示す表
    • t値
    • 自由度(df)
    • 有意水準(危険率:p) ・・・ 起こりうる確率。5%や1%が目安→「差がある」。5~10%→「有意傾向にある差がある(認められる)」と記述する。
    • 帰無仮説 ・・・ 「2群の平均値に差が無い」ことが成り立つ確率。→ めったに無いような確率の現象→ 「差が無いとはいえない」→ つまり差がある

分散分析

3つの平均の比較

統計的検定の留意点

    • サンプルサイズが大きければ大きいほど有意になりやすい
    • 検定力(有意な相関係数を得る確率)をもとにサンプルサイズを決める
    • 5%、1%の有意水準は慣習であり、理論的根拠はない