不正統計問題はビックデータを生かせない情弱

統計の基本を考える
 一般論ですが、市場調査は経済的理由(経費が膨大)ってことで、サンプル調査になります。つまり「全数調査」には経費がかかるのでサンプル調査で全体を推測するのです。
 言葉を統一しておくために全数を「母数」と表現します。調査対象から抽出したサンプルを日本語にしておくために「調査数」と表現します。
 統計は全数調査が最良なのですが、それには膨大な調査費が必要になるので、抽出調査となります。それが、母数と調査数の関係でその中には標準誤差として誤差が計算されます。
 ま、直感的に「クイズ10人に聞きました」って番組と「クイズ100人に聞きました」を比較すると100人がより真実に近いと感覚を持つのは「母数」を推測するのに「調査数」が多いほど信憑性が高いと感じているから。
 このあたりを統計学の考え方からすると報道各社が行っている「世論調査」に含まれる「標準誤差(調査数対母数)」もしっかり把握する必要がある。
 現在の報道各社が行っている「世論調査」は記事の中に必ず「調査数」が明記されている。その調査数は1200件程度だ。日本国民の意識調査(母数は未成年者も入れて約1億2000万名)が1200名の調査数から推測するのが「世論調査」の結果だ。統計は「調査数による誤差」が含まれるのだが、国民の意向を1200件程度で調査すると、Yes、No設問の場合の誤差は±5%程度に計算される。つまり、内閣支持率が「2%下がった」なんてのは誤差範囲だ。しかし調査を行った側の記事では「こんなん結果が出ました」みたいな扱いをする。
 実際は過去の調査履歴を持っているので誤差はさらに低いのだろうけど、支持率1%の政党なんてのは公表する以前に誤差範囲なのだ。
 調査対象を「全数調査」出来ない(経済的理由)ので、調査数を設定して調査し、その標準誤差を考慮して実態を描き出すのが統計手法なのだが、往々にして、調査結果だけを用いて「正しい全数」を予測したような公表が行われる。
 統計学では「統計を良く知る者は誤差を良く知る者」と言われているのだが、これが一般の教育に生かされてないので「調査は絶対的な意味を持つ」と誤解されている。
 もう一つ「調査数」には誤差を生む要因が含まれている。それは「回答数」だ。調査を1000件行ったが回答は10だったって場合と100だった(どっちも駄目なんだけど)を比較すると「関心が無い項目の調査を行うと誤差が拡大する」って事になる。その意味で「どっちでもない」って数が1/3以上だと回答の誤差率は拡大されることになる。(沖縄の住民投票の結果を統計学的に分析するマスコミは無いだろうが)
 報道各社が行っている「世論調査」には調査方法が明記されているが、おおむね無作為抽出の1500件で、回答数は1200件」あたりと公表されている。これは先に書いたように標準誤差が±5%なのだが、回答率が常に80%って絵に描いたようになっているのも不思議だ。関心の無い事柄を調査したので回答率が下がったってことは報道各社は絶対に認めなくないから「作為」があるのではと勘ぐってしまう。実際には電話をして趣旨説明したら「ガチャリ」と電話を切られた数は「調査数」にカウントされてないのではとゲスカンするのだが。

山ほどあるビックデータ
 今回の不正統計問題は給与所得調査に端を発してる。
 給与所得統計を考えると昭和30年代の経済成長率の高かった時代に決められた「現地調査」って手法は合理的ではあったが、その手法が平成も30年になる現在まで続けられて来たことに驚く。
 調査対象数には経費の限界があると先に書いたが、逆に役人は調査項目を増やすことで昭和の時代に組織の拡大を図ってきたのだろう。
 「調査の精度を上げるには人手が必要」って論理だ。これは正論なんだが、調査数を増やすことで統計処理の役人を増やし部署の予算の拡大を行ってきたのも事実だろう。
 パーキンソンの法則(ほっておっておくと、役人は仕事を自ら作り人員を増大させる)は、この面での役人のしたたかさを指摘したものだ。
 そもそも調査手法を見直すって感覚が役所には無いのはまさにパーキンソンの法則なのだ。人員を削減するってのは役所の予算獲得において死活問題で実は小泉純一郎氏が総理の時代に役所の経費削減って話が出た時に現業部門を縮小して辻褄を合わせたのが今回の不正統計問題(2004年に不正開始)の根源にある。誤魔化してもバレない部署の人員を削減して(作業を削減して)経費を削減する帳面を作るって手法だ。だから、部署内で「どうでも良い活動」ってことで統計調査を人員削減し予算削減して調査数(先に書いたように経費に直結する)を減らしたのだろう。
 これは、あまりにも頭が悪すぎる。
 昭和30年代じゃないんだから、給与所得の把握には沢山のコンピュータ・データが利用できる。今では、ほとんどの企業では給与計算はコンピュータ化されており、しかも国は年金と連動する「標準報酬月額」のデータ提出を各企業にコンピュータ・データでと推奨している。標準報酬月額はいまだに「表引き」方式で、年末調整で清算することになっているが、今の時代にコンピュータ処理方式を制定するのが基本だろう。
 ここで得られた年金額だけでは無く、給与計算で行っている所得税もコンピュータ・データになっている。
 何も「調査数」を限定しなくても、母数に近いデータは既に存在し、しかも国が得られる仕組みが出来上がっているのだ。そのデータが有るにも関わらず昭和の時代の「人力調査」が連綿と行われているのが不正統計の根本的な問題なのだと立法府、つまり国会および国会議員は気づくべきだろう。
 野党が大馬鹿なのは、時代の変化を理解できない与党を追及すべきなのに、自分も一緒に「昭和時代」に生きているナンセンスだ。

情報化社会には情報庁が必要
 国がどんな情報(ビックデータ)を持っているかを包括的に把握すれば国が行う「調査事業」はコンピュータによって自動化され省力化される。それを望まない省庁の既得権益は有るだろうが、それを打破するのが政治(立法府)の仕事だ。
 直ぐにビックデータに変えろとは言わない。既存の調査との差異を検証しながら新しいビックデータ方式に替えていく試行を行うべきだ。それは、役人主導では出来ない。何故ならパーキンソンの法則が示すように役人は自らの改革(縮小)には徹底的に反抗する。だから行政府と立法府の対決が必要なのだが、事実上立法府を牛耳ることが目的の行政府に今の立法府は何も手出しができない。
 日本の政治制度は歴史的にイギリスの議院内閣制度を取り入れてきた。ま、その張本人は伊藤博文なんだが、手本のイギリスが今、EU離脱で苦しんでいるのは、議院内閣制度の矛盾点が明確になっているってことだ。
 前にも書いたけれど、民主主義(の仕組み)は今でも発展途上だ。その中で時代に即したマーケティングが求められている(ま、経済指標ともいう)のに不正統計問題が起きるのは何故か。それは、国がどんなビックデータを持っているかが共有されない「昭和時代」の機構構造に誰もメスを入れなかったからだ。
 誰がメスを入れるのか。それは立法府つまり国会だろう。
 あまりにも的外れな野党が与党を「遊ばせている」。
 国が持っているビックデータを用いれば、どれだけの内閣統計局の仕事が合理化されるのか。その視点で議論するのは国会の責務だろう。
 もちっと、勉強せやぁ>国会議員
 チコちゃんに怒られるでぇ!

button  立法府の崩壊は野党の性根が腐ってるから
button  立法府である議会の職務放棄


2019/02/04
Mint