|
見えるものを加工する「見える化」
見えないものが見えてくるのなら歓迎だが、昨今横行する「見える化」は、実は巧妙なデータの細工により白を黒と言いくるめる、発言側に有利なデータの捏造を幇助する姑息なデータ加工手法である。単純化によって本来真実を語っているデータを加工し説得力を持たせる「見える化」は犯罪ですらある。これが、マスコミを中心に蔓延しているのだから、日本の民主主義はアメリカのジェファーソン大統領が言った「情報は民主主義の糧である」と正反対に「情報は民主主義の毒物である」と化してしまっている。統計分析の1丁目1番地に「統計から傾向を読み取れる者は誤差を知る者である」との名言がある。現物から得たデータは真実を語っていると思いがちだが、想定される全体像に対して必ず誤差を含むってことだ。 我々は経験的に「クイズ100人に聞きました」のほうが「クイズ10人に聞きました」より物事の真実に近いと感じている。何故、そう感じるのかは統計学的には「母数とサンプル数の比」で著される。本来「全量検査」で真実に迫りたいのだが経済的理由や地勢的理由で全量検査が難しい場合が多い。そこで、サンプル調査を行って傾向を読み取る。この時の全量の事が対象全てとの意味で「母数」、そしてアンケートを行って回答を得た数がサンプル数である。 統計学では母数の件数とサンプルの件数の割合で行った調査結果に含まれる「誤差」を簡単な計算式で求められる。 一般的な「世論調査」はサンプルを選ぶには電話番号からコンピュータが無作為に選ぶ。実は、このサンプル選びにも偏りと呼ぶ誤差が含まれる。 例えば、現代社会において有線固定電話を設置している世帯は「平均的日本を代表する世帯」であろうか。少なくともここ10年以上住み続けている割と保守的な中高年層だろう。そのサンプルの偏りは計算では求められない誤差だが、これも誤差の範囲だ。 加えて、マスコミが最後に小声で発表するサンプル数がある。これはどの会社もおおむね1300〜1500件である。日本の人口は1億2000万人程だが、この中から1300程度の世帯、もしくは個人(それも偏りのある)を選んだ場合誤差はどの程度だろうか。 Yes Noの単純設問で5%程度である。支持政党を選ばせるような複数回答では誤差がさらに拡大する。おおむね、各社の1300〜1500件のサンプルで得られた統計は5%以上の誤差を含む。 であれば、「内閣支持率は5%「も」減少しました」は誤差の範囲で嘘じゃないかと思われるが、これは定期的に行っている裏付けから「傾向を読むと」って但し書きが付いた「真実に近いかもしれないし、遠いかもしれないし、良く解らない数値」ってことだ。 それほど、統計数値を読む場合は背景を熟慮する必要があるのだが、昨今の「見える化」は伝える側の都合の良いように細工して伝えるので十分注意が必要だ。何時も言っていることだが情報化社会の中で自分で考えて疑って掛からないと洗脳されて他人の思うままの情報奴隷(c)性奴隷(韓国)になってしまう。CPBS(コピペ脳症候群)と私は呼んでいる。。 |