【心理統計】基本的な用語や統計の種類・選び方を分かりやすく解説

統計手法の種類や選び方を解説する前におさえておきたい基本的な用語をご紹介します。

独立変数・従属変数・剰余変数

独立変数

独立変数とは、ある効果に関して検討するために人為的に操作する変数のことです。

従属変数

従属変数とは、実験の結果得られるデータ（心理学では、被験者の反応や回答など）のことです。

剰余変数

剰余変数とは、ある研究において検討の対象になっている要因である独立変数以外の変数で、従属変数に影響を及ぼしている（影響を及ぼす可能性のある）変数のことです。

例えば、「騒音の大きさが作業の能率に及ぼす影響」を調べる実験をしたとします。

この実験では、「騒音の大きさ」を操作して作業の能率に対する影響を調べるので、騒音の大きさが独立変数、それぞれの騒音の大きさの条件で得られた結果が従属変数です。

そして、騒音の大きさ以外で作業の能率に影響を与える可能性のある、室内の温度や湿度、明るさ、清潔さなどが剰余変数です。

信頼性・妥当性

信頼性

信頼性とは、測定結果がどの程度安定しているのか、を表す概念です。

妥当性

妥当性とは、測定結果がどの程度測りたい特性に焦点を当てて、それを的確にとらえているのか、を表す概念です。

例えば、ある大学生の誠実性を調べるために、4月と9月に質問紙による調査を行いました。

4月と9月で結果が大きくずれていたら、測定の結果が安定していないため、信頼性は低くなります。

また、そもそも質問紙の項目が「誠実性」を測れる適切な内容なのか、などが測定の妥当性になります。

代表値（平均値・中央値・最頻値）

代表値とは、ざっくり言うとデータの中で最も一般的・典型的な値はいくつか、といったデータの特徴を端的に表す値です。

代表値には、平均値・中央値・最頻値などがあります。

平均値

平均値とは、データの値の総和÷データの数（度数）で表される値です。

中央値

中央値とは、データを小さいほうから順に並べた際、度数を二等分する値です。

最頻値

最頻値とは、データの中で最も多い値です。

例えば、１，２，２，２，４，６，１０，１２，１４，２０という数字があった時、

平均値は（１+２+２+２+４+６+１０+１２+１４+２０）÷１０＝７．３

中央値はデータを二等分する数が４と６なので、平均の５が中央値。

最頻値は２。

散布度（標準偏差・四分位偏差）

散布度とは、データの値の散らばり具体を表す値です。

標準偏差

標準偏差とは、代表値の指標として平均値を使う場合に用いられる散布度です。

四分位偏差

四分位偏差とは、代表値の指標として中央値を使う場合に用いられる散布度です。

相関関係・因果関係

相関関係

相関関係とは、AとBの事柄には何らかの関連性がある、ということを表します。

因果関係

因果関係とは、Aという事象が起こった結果Bが生じる（原因→結果）、ということを表します。

例えば、一日のメール利用回数と他者への依存度に関連性があるか調査し、メール利用回数が多ければ多いほど、他者への依存度が高いという結果が得られました。

この場合、「メールの利用回数」と「他者への依存度」には相関があると言えますが、メールの利用回数が多いから他者への依存度が高いのか、はたまた他者への依存度が高いからメールの利用回数が高いのか、の方向性が分からないため、因果関係は分かりません。

まとめると、「相関関係」の中でも、原因と結果を表しているものだけが「因果関係」として表記されます。

つまり、因果関係のある関係は相関関係があると言えますが、相関関係は必ずしも因果関係とはならないということです。

有意差

有意差とは、仮説と実際の観察によって導き出された結果の差が誤差では済まされないような、統計的に意味がある差のことです。

【ケース別】統計の選び方

どんな時にどんな統計手法を選べばいいのか、複雑ですよね。

そこで以下に代表的なものを整理したので、参考にしてみてください。

データの信頼性を測定したい

例えば、「誠実性」を測定する新たな質問紙を作成したので、その信頼性を検討したい場合などは、クロンバックのα（アルファ）係数を用います。

クロンバックのα係数は、内的整合性による信頼性の指標です。

０～１で表され、目安として０．７以上が求められます。

ちなみに内的整合性とは、テストに含まれる項目全体が同じ心理的特性を測れているのかを表す概念です。

全数調査が困難な対象を調査したい

例えば、大学生の飲酒頻度について調査したい場合、すべての大学生を対象とした調査を実施することは困難なので、無作為抽出・推測統計法を用います。

２群の平均値の差が有意差か検定したい

例えば、自尊心が高い群と低い群の各５０名ずつの２群で、それぞれ英語の平均点を算出し、得点差が有意差かを調べたい場合、t検定を用います。

３群以上の平均値の差を検定したい

例えば、文系A組の自尊心が高い群・低い群、理系B組の自尊心が高い群・低い群で、それぞれ英語テストの平均点を算出し、得点差を調べたい場合、分散分析と多重比較を用います。

分散分析だけでは、有意差があるかどうかしか分からないため、有意差の数とどの群との間に有意差があるのかを調べるためには、多重比較が必要になります。

２つの変数の関連の強さを調べたい

例えば、インターネットの利用頻度と他人を見下す傾向の関連性を調べたい場合、相関係数を用います。

相関はー１～ +１の間で表され、±１に近いほど関連が強い（ー１に近ければ負の相関、+１に近ければ正の相関）ことを表します。

そして、０に近いと関連が低いことを意味します。

人数分布に偏りがあるかどうか知りたい

例えば、小学生と高校生でシャープペンを利用している人数の割合に差があるのかを調べたい場合、X²検定（カイ二乗）検定を用います。

複数の項目を整理・分類したい

例えば、性格を表す形容詞がたくさんある中で、同じような意味合いを持つ形容詞を集めて、分類・整理したい場合は、因子分析を用います。

キャッテルは数多くの性格を表す言葉を因子分析によって１６特性にまとめましたが、それ以降、パーソナリティ心理学において、因子分析が重要視されることになりました。

複数の独立変数の影響力を比較したい

例えば、ビッグファイブの５特性のうち、他者への攻撃性に最も影響を与える特性が何かを調べたい場合、重回帰分析を用います。

ちなみに独立変数が１つである場合は、回帰分析か単回帰分析を使います。

まとめ

人びとが抱える悩みや問題は時が経つにつれて変化していきます。

そのため、心理臨床家も日々、知識をアップデートしていかなければなりません。

したがって、エビデンスを基にした心理実践を行うだけではなく、実践の過程で導かれた仮説を様々な統計手法を用いて分析し、科学的に検証することで心理学を発展させていく必要があるのです。

【引用文献】

河合塾KALS監修坂井剛・宮川純（2021）赤本公認心理師国試対策2021　講談社

リンク

吉田寿夫（1998）「本当にわかりやすいすごく大切なことが書いてあるごく初歩の統計の本」北大路書房

リンク

【あわせて読みたい】

関連記事原因別で分ける精神障害の伝統的な３つの分類を解説

2021.01.17

関連記事「正常」と「異常」の判断基準。“普通”って一体なんなの？

2020.12.25

【このブログを応援する】

にほんブログ村

【心理統計】基本的な用語や統計の種類・選び方を分かりやすく解説