« 小学生日記 | トップページ | くちぶえ番長 »

2007年12月 3日 (月)

データの罠

「データの罠世論はこうして作られる」田村秀著(集英社新書)

新聞やテレビのニュースでデータが伝えられない日はありません。そうしたニュースでは、数字やランキングが主に見出しに使われるため、特に印象に残ります。私自身、数字に弱いこともあり、かなり影響されてしまいます。
しかし、そうした「データ」の多くは、論じる条件がそろっていなかったり、意図的に条件がそろえられていなかったりする、と本書は指摘しています。

私も仕事柄「マーケティング」みたいな仕事をしておりますが、実際のところ、調べたい対象(市場)に対して、どれくらいのサンプル数があれば有効な調査となりうるのか、ぜひ知りたいと思っていました。統計学の世界では常識らしいのですが、±5%の精度で良ければサンプル数は384程度(無作為抽出の場合)でよいのだそうです。

しかしここで考えなければならないことが2つあります。それは

  • 有効回答率が高いこと
  • 1桁台の数字にこだわらないこと

です。つまり、サンプル数がたとえ400集まったとしても、調査対象の30%くらいしか集まらなかった上での数字であれば、信頼できないのだそうです。調査に回答することに意欲的な人の回答のみを扱うことになるので、サンプルがいくら無作為抽出であっても、意味がなくなるのです。
それから、そもそも調査の精度が±5%なのですから、たとえば

  • うどんが好きな人:19%
  • そばが好きな人:24%

といった結果が出たとしても、これだけで「そばが好きな人はうどんが好きな人に比べて多い」ということはいえない、そればかりか、実際はうどんが好きな人の方が多い、ということだってありえる、ということなのです。こう考えてくると、サンプル数が1700程度に過ぎないと言われているテレビの視聴率は、1%にこだわってもあまり意味がないということがわかります。実際には0.1%にさえこだわっているわけですが。

本書では、これまで述べてきたような、数字の読み取り、調査の仕方などについて、たくさんの具体的な事例に基づいた解説がなされています。私にとってはとても参考になる話ばかりでした。さらに、重要な指摘として本書で繰り返し出てくる指摘を引用します。

日本人はとかく平均志向が強いようで、自分自身が平均値と異なると不安になりがちになるなど、平均値を理想化する傾向がある。しかし、平均だけですべてを判断するのは禁物である。データの分布状況や他の統計指標も調べて、データの特徴をつかむことが大事である。

|

« 小学生日記 | トップページ | くちぶえ番長 »

教養書」カテゴリの記事

トラックバック

この記事のトラックバックURL:
http://app.cocolog-nifty.com/t/trackback/29188/45933232

この記事へのトラックバック一覧です: データの罠:

« 小学生日記 | トップページ | くちぶえ番長 »