統計について、何か間違っていないか?

最近、いくつかの正書が、アマゾンなんかのカスタマーレビューで「統計量の取り扱いがひどい」などと言うような、非常に素人的な考えで、同じグループに属しているような人たちから、連続して非難されている。統計量ほど難しいものは無いと思っている筆者にとって、たとえば私のブログでも論評している著作の一つである芹沢一也氏の著作「ホラーハウス社会」などで、「近年、少年犯罪は増加していないんだ!!」というような表現は全く意味を持っていないんだ。これは、社会学(社会統計学)をやったことのある人なら、誰でも知っていることなんだが。これらのバックにあるすごい作業を知らないから、誰かが「凶悪犯なんか増えていないんだよ」というと、それに従って同じことを発言する。私に言わせりゃ、あなたは馬鹿だと自分で言っているようなものだ。何も知りませんと言っているようなものだ。

まず、「近年、少年犯罪は増加していないんだ!!」というような表現を取り上げてみようか。そうすると、ここで挙げる「少年」が、10年前の同じジャンルの「少年」に属するかどうか、犯罪は増加しているかいないかを判断するとしたら、犯罪に対する影響する因子(要因)を挙げ、その影響を科学的手法で探り出す必要がある。そして、それらの影響は無視できると判断したら、初めて、あなたの言おうとすることを言っても良いかもしれない。

以降の文章は、次の箱の中の熟語を理解している人のみ読んでも良いこととしよう。
母集団、サンプル、検定、有意差、カテゴリ、無作為抽出、誤差。

いずれも非常に古いが、次のような参考書があるから、読んで欲しい。
  • R.A.フィッシャー著「統計的方法と科学的推論」
  • スネデカ、コクラン著「統計的方法」
  • 林知己夫、村山孝喜著「市場調査の計画と実際」
  • 林知己夫著「数量化の方法」
  • 奥野忠一他著「多変量解析法」
  • 竹内啓他著「多変量解析の基礎」
  • 安田三郎著「社会調査ハンドブック」
  • などなど、沢山の参考書があるから、一冊でも良いから読んで欲しい。それからの話にしよう。

    社会統計は、理化学的なデータ解析と異なり、連続量での分析が出来ない。犯罪の種類が連続してあるなんて考えてみたら分かるだろう。これを、「カテゴリー化」すると言う。たとえば、たった一つの「少年による犯罪」を例に取ると、その犯罪の数は、どれだけの因子(要因)から構成されているのだろうか?論議をしようとしている事象が原因となって、増減しているかもしれないが、犯罪なんて、100円がなかったから殺した、おなかが減ったから殺した、...なんて事だっていくらだってあった。それを、一言の元に、
    「全然最近は、少年犯罪は増加していないんだよ」
    、といわれると、私自身、統計、社会調査をやって長いが、そのデータの正当性を証明するのがどれほど難しいことか、すぐに思い浮かべるのだ。だから、安易にそのような言葉を吐く人は「信じない」だけ。学会だって信用しないはず。理化学的な統計解析とは全く違うのだから。家計の収入だけ取っても、それを連続量でとると思ったら大違い。0円から50万円、51万円から100万円、101万円から150万円、等々、カテゴリーかする必要がある。カテゴリー化と言う手法を使用する社会分析においては、同じカテゴリーに入っている人は同じ扱いになる。多の要因も同様である。年齢でさえ、カテゴリー化する。15歳未満、15歳から20歳未満、20歳から25歳未満、等々とカテゴリー化する。そうすると、少年犯罪が増加していないんだと言った時に、私が聞きたいのは、そのバックとなるデータはどうなっているか、どう言う前提であなたはそんなことを言っているのか?と聞く訳だ。今はやりのインターネット調査なんか、全く意味がない。だから、三浦展氏の「下流社会」の調査は全く意味を成さないのはご存知の通り。だからといって、彼の本に書いてある抽象的な、概念的な記述全てを間違っていると言うのは、逆に間違っている。この当たりが難しい。

    まず、事件数が少なすぎる。サンプルとなる犯罪者の数が少なすぎる。だから、統計量として扱うのは非常に難しい。サンプルが少なければ、その犯罪者を記述する為の要因が10あるだけで、もう、私の頭の中は混乱する。要因が10あるだけで、そのレベル(カテゴリー)は5以上あるだろう。それだけで、その犯罪者を50のカテゴリーの中の一つとしてしか当てはめることが出来ないのだ。同様な犯罪者が50名居て、やっと、平均として、1カテゴリーに1名のサンプルが当てはまる。それであなたは何を説明しようとするのだろう? 少年犯罪が急増していない?そんなことを証明できるのか? 数としては、出てくるだろう。だけど、その原因を「最近」の事象だけで証明できるのか? 給与所得レベルはどうなのだ?教育レベルはどうなのか?親の所得レベルも教育レベルも、兄弟のそれも全て問題にしなければならない。家庭環境も数値化しなければならないし、経済レベルもどうなんだ?その人の住んでいる住居環境、住宅環境はどうなんだ?交通機関のレベルはどうなんだ?犯罪に用いる「凶器」の入手のしやすさなどはどうなのだ?その人の飲んでいる薬はなんだ?それだって大きいではないか?その子の学校環境はどうか?TVを覧る時間はどうか?家の外で遊ぶ時間はどうか?ゲームをする時間はどうなんだ?エロチックな本を見る機会は増えているのか減っているのか?
    道端で、犬達がさかるのを見て育った我々と、今の子供では環境は全く違うではないか。貧しい住宅しか並んでいないバラックのような住居が続いている住宅環境と、今のように整備された住宅環境が続いているのとは全く環境は違うではないか?

    教育に対する親の関心も大きく異なるだろう。ほとんどが公立の学校に行っていた40年前と、今では全然教育に関する関心度も違うではないか。教育に使う費用も10倍以上は違うだろう。

    「社会調査」と言うのはこれらの条件を全て同じような状況に置かなければ、増えたの減ったのは居えないのは当然でしょう。だから、簡単に、少年犯罪が急激に増えている訳ではないよ、と一言で言って欲しくないのだ。他にやることが1杯あるから、人をあやめたりするようなことはしないだけかもしれない。

    また、「統計量の扱い方がひどい本」だと言ってむちゃくちゃ言われている本があった。例の「ゲーム脳」の系統を引く本かも知れないが、岡田尊司著「脳内汚染」であるが、アマゾンでのカスタマーレビューを観て笑ったね。完全に反対に分かれているが、上で私が述べたような、社会調査について全く素人が書いたレビューばかりだ。一体、社会調査にどれだけの経験を有しているのだろうか?同じことは、芹沢一也著「ホラーハウス社会」のレビューについても言える。社会調査が全く分かっていない。こんなことを書くと、また、芹沢氏や、怖い、編集者からのコメントが100程も書き込まれるだろうが、それは覚悟の上。

    まずは、社会調査について論争から始めようよ。

    今日はこれでおしまい。RSSで検索するからすぐに見つかるだろうが。

    この原稿は、明日公開することにする。

    最後までおつき合いいただきありがとうございます。
    ↓お手間でもクリックをお願いします。
    画像
    管理者の自然の観察ブログ「オレンジの独り言」もご覧ください。素敵な写真が沢山掲載されています。

    ブログ気持玉

    クリックして気持ちを伝えよう!

    ログインしてクリックすれば、自分のブログへのリンクが付きます。

    →ログインへ

    なるほど(納得、参考になった、ヘー)
    驚いた
    面白い
    ナイス
    ガッツ(がんばれ!)
    かわいい

    気持玉数 : 0

    この記事へのコメント

    stiglitz
    2006年04月21日 20:29
    量子情報をやっている親戚がいるのですが、統計というのは
    葦の髄から天井を覗く
    群盲象をなでる
    ようなもので、その一部分を通じて、現実という得たいの知れないものを認識する作業なので大変だと思います。ニートで読書ばかりしていると金にならない知識ばかり身に付きます。統計力学から量子力学に行く勉強をしたいのですが、カルチャーセンターで物理ってありますかね?

    この記事へのトラックバック