ラボ講座‎ > ‎統計処理講座‎ > ‎

統計関係用語集


教育工学で利用する統計関係の用語集です。

参考資料

  • 量的変数 ・・・ 量が人によって変わるもの
  • 質的変数 ・・・ 分類を意味する変数(男女など)
  • 連続変数 ・・・ 値が連続している変数 (身長)
  • 離散変数 ・・・ 値が飛び飛びの変数(テストの点)
データを整理する
  • 度数分布表
  • 棒グラフ ・・・ 質的変数、離散変数向け
  • ヒストグラム ・・・ 量的変数、連続変数向け
  • 散布図(相関図) ・・・2変数を対応させてグラフ上にプロット


代表値
  • 平均 ・・・ データの中心
  • 最頻値(モード) ・・・ 最も度数が大きい値
  • 中央値(メディアン)・・・ 順に並べた場合の真ん中の値
  • 外れ値 ・・・ 例外的な値。
  • 抵抗性 ・・・ 外れ値に引きずれれにくさ。平均は抵抗性が低い代表値といえる
散布度
散らばり具合。
  • 偏差 ・・・ 平均との差
  • 分散 ・・・ 偏差の2乗の平均
  • 標準偏差 ・・・ 分散の平方値
  • 平均偏差 ・・・ 偏差の絶対値の平均
  • 範囲 ・・・ 最大値と最小値の差。抵抗性は低い
  • Z得点 ・・・ (得点ー平均)÷ 標準偏差
  • 偏差値 ・・・ 平均50、標準偏差が10となる標準値
検定
  • 背理法 ・・・ 証明したいことと反対の仮定をとり、その仮定の矛盾を証明して、証明したかったことを証明する。
  • 帰無仮説 ・・・検定の際に利用する仮説。
  • 対立仮説 ・・・ 帰無仮説と逆の仮説。つまり本来検定したい仮説。
  • 有意 ・・・ 「帰無仮説を棄却する」ことで、対立仮説が採択されること。「統計的に有意である」→ 「帰無仮説を棄却された」
  • F検定 ・・・ 2群の分散の大きさに差があるかどうかを調べる
  • p値 ・・・ 有意確率。限界水準。
  • 有意水準 ・・・ 有意であるかの境界。一般的には5%(1%の場合もある)。p値が5%を下回れば「有意である」と述べて良い。5〜10%であれば「有意傾向であった」(「もう少しで有意である」の意)と述べて良い。
  • t検定 ・・・ 2群の平均値の差の検定。2群の分散が等しいことが前提。
  • 対応のあるデータ ・・・事前と事後のように比較する2群が同じである
  • 対応のないデータ ・・・比較する2群が異なる


関係を見る
  • クロス集計 ・・・ 2つ以上の異なる項目(質的変数)に対する回答を,関連づけて示したもの
  • 観測度数 ・・・ クロス表内の値
  • 連関 ・・・ 関連のこと

  • 相関係数 ・・・ 2つの量的変数の関連性を示す値。一般にはピアソンの積率相関係数。共分散を標準偏差の積で割ったもの


尺度
  • 名義尺度
  • 順序尺度
  • 間隔尺度 

  • 比率尺度
  • 天井効果・床効果 ・・・ 選択肢の回答が、両極端に偏ってしまい、個人差を見つけることができない
回帰分析
  • 回帰モデル ・・・ ある変数の変動が他の変数に影響を受けているか?方向性がある。(相関には方向性はない)
  • 説明変数 ・・・影響を与える変数
  • 被説明変数 ・・・ 影響を受ける変数


因子分析
各項目に対する反応から,その背後にある因子を推定する分析法
  • 因子 ・・・ 各項目に影響を与えていると仮定される要素
  • 固有値 ・・・ いくつの因子を抽出するかを決定する基準
  • 因子負荷量 ・・・ それぞれの項目が,ある因子を反映している程度(絶対値:0~1)と向き(正負)を示す数値
  • 探索的因子分析 ・・・ある概念に従い,それを測定しうるだろうと考えられる項目を集め,データを収集し,そこにどのような因子が見られるかを探索的に検討する。新たに尺度を作る場合に利用。
  • 確認的因子分析 ・・・確固たる因子の仮定があって,それにしたがって分析を行う
  • 初期解 ・・・ 回転前の推定値
  • 寄与 ・・・ 自乗和を項目数で割ったもの
  • 寄与率 ・・・ 寄与の%表示。分散の大きさ。
  • スクリー基準 ・・・ 固有値に急激な落ち込みが見られるところを基準
  • ガットマン・カイザーの基準 ・・・ 1を基準とし,1以上の固有値がいくつあるかで因子数を決定する

χ2乗検定
クロス集計されるデータの関連性を検定する。質的変数が対象。
  • 観測度 ・・・ 実際のデータ
  • 期待度 ・・・ 割合に差がないと仮定した場合の値

t検定
2群の平均値の差が有意なものかどうかについての検定。等分散であることが前提。3群以上には使えない。
  • ウェルチのt検定 ・・・ 等分散でない場合のt検定
  • 対応がある・なし ・・・ 2群が同じであるかそうでないか
  • 信頼区間 ・・・ 母平均が含まれる範囲(95%区間、99%区間)
  • t分布表 ・・・自由度(df)に対応する各有意水準でのt値の臨界値を示す表
  • t値
  • 自由度(df)
  • 有意水準(危険率:p) ・・・ 起こりうる確率。5%や1%が目安→「差がある」。5~10%→「有意傾向にある差がある(認められる)」と記述する。
  • 帰無仮説 ・・・ 「2群の平均値に差が無い」ことが成り立つ確率。→ めったに無いような確率の現象→ 「差が無いとはいえない」→ つまり差がある

分散分析
3つの平均の比較

統計的検定の留意点
  • サンプルサイズが大きければ大きいほど有意になりやすい
  • 検定力(有意な相関係数を得る確率)をもとにサンプルサイズを決める
  • 5%、1%の有意水準は慣習であり、理論的根拠はない



 

Comments