|
統計の基本を考える
一般論ですが、市場調査は経済的理由(経費が膨大)ってことで、サンプル調査になります。つまり「全数調査」には経費がかかるのでサンプル調査で全体を推測するのです。
言葉を統一しておくために全数を「母数」と表現します。調査対象から抽出したサンプルを日本語にしておくために「調査数」と表現します。 統計は全数調査が最良なのですが、それには膨大な調査費が必要になるので、抽出調査となります。それが、母数と調査数の関係でその中には標準誤差として誤差が計算されます。 ま、直感的に「クイズ10人に聞きました」って番組と「クイズ100人に聞きました」を比較すると100人がより真実に近いと感覚を持つのは「母数」を推測するのに「調査数」が多いほど信憑性が高いと感じているから。 このあたりを統計学の考え方からすると報道各社が行っている「世論調査」に含まれる「標準誤差(調査数対母数)」もしっかり把握する必要がある。 現在の報道各社が行っている「世論調査」は記事の中に必ず「調査数」が明記されている。その調査数は1200件程度だ。日本国民の意識調査(母数は未成年者も入れて約1億2000万名)が1200名の調査数から推測するのが「世論調査」の結果だ。統計は「調査数による誤差」が含まれるのだが、国民の意向を1200件程度で調査すると、Yes、No設問の場合の誤差は±5%程度に計算される。つまり、内閣支持率が「2%下がった」なんてのは誤差範囲だ。しかし調査を行った側の記事では「こんなん結果が出ました」みたいな扱いをする。 実際は過去の調査履歴を持っているので誤差はさらに低いのだろうけど、支持率1%の政党なんてのは公表する以前に誤差範囲なのだ。 調査対象を「全数調査」出来ない(経済的理由)ので、調査数を設定して調査し、その標準誤差を考慮して実態を描き出すのが統計手法なのだが、往々にして、調査結果だけを用いて「正しい全数」を予測したような公表が行われる。 統計学では「統計を良く知る者は誤差を良く知る者」と言われているのだが、これが一般の教育に生かされてないので「調査は絶対的な意味を持つ」と誤解されている。 もう一つ「調査数」には誤差を生む要因が含まれている。それは「回答数」だ。調査を1000件行ったが回答は10だったって場合と100だった(どっちも駄目なんだけど)を比較すると「関心が無い項目の調査を行うと誤差が拡大する」って事になる。その意味で「どっちでもない」って数が1/3以上だと回答の誤差率は拡大されることになる。(沖縄の住民投票の結果を統計学的に分析するマスコミは無いだろうが) 報道各社が行っている「世論調査」には調査方法が明記されているが、おおむね無作為抽出の1500件で、回答数は1200件」あたりと公表されている。これは先に書いたように標準誤差が±5%なのだが、回答率が常に80%って絵に描いたようになっているのも不思議だ。関心の無い事柄を調査したので回答率が下がったってことは報道各社は絶対に認めなくないから「作為」があるのではと勘ぐってしまう。実際には電話をして趣旨説明したら「ガチャリ」と電話を切られた数は「調査数」にカウントされてないのではとゲスカンするのだが。 |