これで上司も市民も納得! 基礎からの統計教室
第7回
その検定は本当に必要か考えよう
例題
消防も団塊の世代の多くが退職し、新しい人たちがどんどん入ってきています。あるとき上司が消防本部から帰って来てあなたに、「うちの消防本部が他の消防本部より年齢が上なのか下なのか調べてくれないか」と言い出しました。そんなの消防本部の仕事で現場の人間の仕事ではないですし、上司自ら他の本部に電話すればいいだけなのでやんわり拒否すると、「これからの採用の資料にする大切な仕事なんだ」といい、「俺は統計とか全く分からない。頼むからお前がやってくれ」と頭を下げられました。あなたならどう対応しますか。
解説
この会話での「統計」とは「検定」を意味します。自分の消防ともう一つの消防の年齢を並べて、それらに有意差があるかどうか検討しろと言っているのです。
ですが、検定は考えただけで面倒ですし、検定したからといって新たに何か言えるわけではないことに注意しましょう。検定しないで済む方法を考えます。
1。検定は本当に必要か
月刊消防と同じ東京法令出版から出ている雑誌プレホスピタル・ケアにもELSTA東京の尾形純一教授が「統計と救急のはなし」を連載されています。私が見たのは平成27年6月号。内容は私の書いている小野よりかなり高度です。余裕のある方はそちらもご覧下さい。
前も書きましたように、実際の業務の範囲では検定が必要になることはまずありません。検定はやろうと思えばエクセルに数値を入れて関数に流し込めばすぐ数字が出てきます。t検定は初めから関数が用意されていますし、関数がなくても基本的な検定なら四則計算だけで可能で、大したことはありません。ですが検定結果よりもそれが持つ意味を理解する事の方が大切です。意味が理解できないのでしたら初めから検定などせずに生データで勝負することをお勧めします。
2.検定で使われる言葉
検定に入る前に、検定で使われる言葉を確認しておきます。
・検定
ここでは数学的・統計的に処理をして複数の群で数値に有意な差があることを検討することです。「漢字検定」などで使われる検定は、ある一定のレベルに物事が達しているか調べることを言います。
・有意
意味があること。
・有意差
差として意味をなすこと。何の意味かはあとで書きます。
・帰無仮説
可能性のない条件を示し、検定によって「ほら、だから可能性はないって言ったでしょ」と言わせるための仮の説
・p
Probability「確からしいこと」の頭文字。一般にp値と呼ばれ、小数点もしくは%で示される。
・有意水準
危険率とも言う。どこからが有意か線引きする値のこと。通常は0.05(5%)未満。
3.検定の考え方
検定は
「お前の考えが実現する可能性は○○%未満だ→だからお前は間違っている!」
という乱暴なものです。
具体的には
1)2つの群で差があるか調べたい
2)まずは2つの群が同一であると仮定してみる(=帰無仮説)
3)数学的に同一である確率を求める
4)同一である確率(=p)が出る
5)その確率があるレベル(=有意水準)未満なら2)の仮定は否定される(=否定されるためにある仮説なので「帰無(帰って(結論として))無くなる(消滅する))仮説」と呼ばれる)
6)同一ではない→差がある、と結論する
今回の上司の要求を対応させると
1)AB二つの消防職員で平均年齢に差があるか調べたい
2)まずはA消防とB消防の平均年齢が同一であると仮定してみる
3)数学的に同一である確率を求める
4)同一である確率(=p)が出る
5)その確率があるレベル(今回は5%としましょう)未満なら2)の仮定は否定される
6)同一ではない→A消防とB消防で平均年齢に差がある、と結論する
4.データを集める
上司の命令に渋々従ったあなたは、仕方なく隣町の消防の年齢構成を調べて表にしました。
ここでは8月号で用いた表を流用します(表1)。60歳以上は再雇用と考えて下さい。
表1 A消防とB消防の職員年齢構成
グラフにすると、このような年齢構成になります(図1、図2)。
図1 A消防の年齢構成
図2 B消防の年齢構成
5.眺める
この二つ、差があると思いますか。A消防はきれいな富士山型でB消防はもっと急峻な形ですが、年齢のピークは40歳代ですし、二つのグラフを重ねてもそれほど大きな差はありません(図3)。
図3
A消防とB消防を一緒のグラフにしたもの
こういう、見た感じで全く差がなさそうなのは、どんな検定方法を使っても有意差は出ません。検定は、違うだろうと思う2つを並べて本当に違うと証明するものです。これだけ同じなら何をやっても無駄ですから検定はしないでおきます。
検定してみて有意差が出るのは、見た目に「これは差があるだろう」というものに限られます。例えば図4のグラフのように、誰が見てもC消防とD消防で年齢構成が違うものは差が出ます。
図4
C消防とD消防の年齢構成。ここまで異なると差が出る。逆に、ここまで異ならないと検定するだけ無駄。
もともと有意差の5%も感覚的なものです(正規分布で標準偏差の2倍としても2倍の根拠が薄い)。有意差があるかどうかも生データをみればだいたい分かります。
6.考える
同じような規模の消防なら同じような年齢構成になるのはわかりきったことです。なぜなら採用は社会情勢に左右されるからです。ベビーブームで人口が増えれば採用も増えるでしょうし、その人たちが定年になれば新しい人たちが入ってきます。大手企業なら不況で採用が減り、好況で採用が増えます。
上司が消防本部から求められたのは年齢の平均値ではなく、これからの退職者の数や救命士の数などのもっと別のことだったはずです。
6.回答
頭を下げられればやらざるを得ないでしょう。データを集めグラフを作った段階で上司に結果を報告します。消防本部が上司に求めたことと上司があなたに求めたことは多分違います。上司の無能さを笑っていてはいつまでも仕事は終わりませんから、データを前に消防本部が上司に求めたことを上司に確認しつつ、上司に的確な意見を述べて下さい。
7.まとめ
1)検定が必要になることはまずない。
2)データを並べて差がないと感じた時は検定する必要はない
OPSホーム>救急の周辺>151106その検定は本当に必要か考えよう
15.11.6/12:06 PM
コメント