多変量解析の勉強をしていると、多変量解析の手法の種類として重回帰分析、判別分析などと並んで数量化1類、数量化2類という、不思議な響きの名前を見かけて気になっていました。実験で数値データを扱っている限り、数量化ナントカ類とは無縁ですが、質的研究の論文などで、数値ではあらわされないデータが絡んでいるときに使われている統計解析の手法だそうです。
数量化1類、数量化2類といった命名は本人によるものではないみたいですが、数量化理論と呼ばれるこの理論を構築したのは日本の統計学者だそうで、その名は林知己夫博士。名の読み方は、「ちきお」だそう。林知己夫博士は1918年6月7日生まれで、東京帝国大学理学部数学科を卒業し、統計数理研究所で研究生活を送り、1974年から1986年の間は統計数理研究所の所長を務め、2002年8月6日に死去されています。
数量化とは?
数量化とは, 質的なデータ(定量的に対する定質的なデータ, カテゴリカルなどとよばれる)に数量を与えて解析し, 科学的に目的を達成しようとする統計的方法である. ときに”林の数量化”とよばれ, 数量化I類, 数量化II類, 数量化III類, 数量化IV類と名付けられ‥
“数はものそのものに内在するものではなく,われわれが科学的に目的を達成するために与える道具である”
もとの測定と解析のための数量とを峻別して考えるのである. この考えかたが, これまでの科学的行きかたと異なっているので, 解りにくいかもしれない.
外的基準とは, “それを知ることがわれわれの目的である”という場合である. 推定, 予測という場合がこれに当たる. 外的基準がない場合は, 測定された要因(ファクター)の中から何か情報を掴み出したいという場合で, 分類(似たものあつめ)などがこれに当たる. いずれの場合も仮説・検証ではなく, 現象探索の構えである.
(統計10話 第2話 数量化理論・数量化の方法とは何か 林 知己夫 文部省統計数理研究所)
林知己夫博士の哲学、研究、業績
主要な業績を紹介した記事を紹介。
データの科学には当然三つの相がある. 一つはデータをどう計画してとるか (design for dataという), どうデータを具体的に集めるか (collection of dataという), データにする解析(analysis on dataという)である。大事なことはこの三つの相において一貫した考え方一データによる現象の解明理解ということ一が貫流していなければならないことである。
(統計十話 第10話 探索的にデータを取扱うことの大切さ(No.2) データの科学の方法論 林 知己夫 文部省統計理研究所)
「理論による現象の理解」という伝統的な科学的方法に対して「データによって現象を理解する」という主張を標榜され,その立場は数量化理論,行動計量学,データの科学として具現されました.
数量化の理論
- 質的なデータを数量化することによって,複雑・曖昧な現象を計量的に理解・解明
- 1940 年代~数量化理論の開発
- 数量化第 I 類,第 II 類,第 III 類,第 IV 類は,「日本人の読み書き能力調査」や「仮釈放」などの具体的問題に関連し, 質的データの予測,パターン分類,判別,分類の問題を解決する過程で開発
日本人の国民性に関する統計的研究
- 1948 年「日本人の読み書き能力調査」
- 日本人の価値観や心情の変遷を実証的に捉えるため,1953 年以来,国民性の調査として研究調査を5年間隔で実施し,世界にも類例を見ない50年にわたる継続調査を実現
- 計量的文明論ともいえる分野と分析法を確立
意識の国際比較方法論の研究
- 日本人とハワイ日系人との比較調査
- 日米比較調査
- 異なる国における意識調査結果の比較を可能にする「連鎖的比較調査分析法」を開発
動く調査対象集団での標本調査理論
- 調査対象が移動して、動物個体数調査が実施困難な例として、野うさぎの個体数推定の問題を研究。冬期に山林の雪上に残る野うさぎの足跡を調査し,幾何確率に基づくモデルを用いて推定する新しい方法を開発
(参照:統計数理(2002) 第 50 巻 第 2 号 111–116 林 知己夫先生を悼む 統計数理研究所長 北川 源四郎)
- 戦後日本の統計学の発達ー数廊下理論の形成から定着へー 行動計量学32(1):45-67.(2005) 森本栄一
- 林知己夫先生の研究の一側面(2) 多次元データ解析から分類へ、そしてデータの科学に向けて 統計数理研究所・名誉教授 大隅 昇 TASC MONTHLY 2005.5
- 対応分析法・数量化法III類の考え方 テキスト・マイニング研究会 第3回WordMiner活用セミナー 2005年5月19日-20日 於 統計数理研究所 大隅 昇
- 林 知己夫先生を悼む 統計数理研究所長 北川 源四郎)統計数理(2002) 第 50 巻 第 2 号 111–116
林知己夫博士のインタビュー
- 科学史と科学者 行動計量学31(2):107-124.(2004)
林知己夫博士の編著書
(書籍タイトルはアマゾンへのリンク)
- 林 知己夫(編)『社会調査ハンドブック (新装版)』 2017年04月25日 朝倉書店 ISBN:978-4-254-12225-1 *2002年刊行書籍の再刊 目次 1. 社会調査の目的―効用と限界 2. 社会調査の対象の決定 3. データ獲得法 3.1 調査のための調査対象集団(ユニバース)・母集団の決定 3.2 各種標本抽出法とその使い方 3.3 層別2段サンプリングの実施例とサンプリングの誤差等の計算例 3.4 標本設計と実施における調査誤差 3.5 調査の誤差 4. 各種の調査法とそれを行う方法 4.1 面接 4.2 留置き(自記式)配布回収法 4.3 郵送調査法 4.4 電話 4.5 インターネット調査 4.6 その他1(機械による調査) 4.7 その他2(集合・出口・街頭・購買者等) 5. 各種の調査デザイン 5.1 個人調査・事業体調査 5.2 断面調査,時系列・継続調査 5.3 パネル調査 5.4 before-after,split-half 5.5 その他の調査法 5.6 国際比較 6. 質問・質問票のつくり方 6.1 質問文 6.2 調査票 6.3 質問票の信頼性 7. 調査実施 7.1 調査実施作業の流れ 7.2 調査実施仕様明細の作成 7.3 調査員の募集・配置・指導・監査・援助 7.4 調査相手との交信 7.5 関係官庁,関係団体との関係 7.6 調査実施記録の作成 7.7 回答票のデータ化作業 8. データの質の検討 8.1 データの審査 8.2 論理的チェック(logicalcheck) 8.3 non-response 8.4 回答のゆれと“うそ” 8.5 調査法による差の把握 9. 分析に入る前に 9.1 コーディング 9.2 自由回答のコーディング,「その他」の取り扱い 9.3 データの表現 10. 分析 10.1 全体を読む(III類の活用) 10.2 自由回答の分析 10.3 単純集計,属性別分析,相関表分析,コウホート分析 10.4 多次元データ解析の重要性,interactionのこと 10.5 数量化 10.6 その他のカテゴリカルデータ解析 10.7 推定・検定 11. データの共同利用 11.1 データオーガニゼーションの重要性とあり方 11.2 コードブック,共通ファイルのつくり方 12. 報告書 12.1 構想と要約 12.2 調査論文の書き方 12.3 報告書の書き方 12.4 何の表を付けるか 13. 実際の調査例 13.1 社会調査 13.2 世論調査 13.3 有識者調査 13.4 自治体の行う調査 13.5 選挙調査 13.6 市場調査 13.7 質的調査と量的調査 13.8 NHKの放送世論調査 13.9 視聴率調査 13.10 新聞広告と調査
- 林 知己夫, 鈴木 達三『社会調査と数量化 増補版 国際比較におけるデータの科学』 (岩波オンデマンドブックス) 2014年1月10日 岩波書店 *初版は1986年6月24日
- 林知己夫『調査の科学』 (ちくま学芸文庫) 2011年5月12日 筑摩書房 目次 序章 社会調査の心 第1章 社会調査の論理 第2章 調査の基本―標本調査の考え方 第3章 質問の仕方の科学 第4章 調査実施の科学 第5章 データ分析のロジック 第6章 調査結果をどう使うか
- 『科学を考える 科学基礎論』林知己夫著作集編集委員会 編2004年12月 ISBN:978-4-585-05141-1
- 『部分から全体を サンプリング・調査法』林知己夫著作集〈第2巻〉林知己夫著作集編集委員会 編 2004年12月 ISBN:978-4-585-05142-8
- 『教育を考える』林知己夫著作集〈第13巻〉林知己夫著作集編集委員会 編2004年12月 ISBN:978-4-585-05153-4
- 『健康を測る』林知己夫著作集〈第12巻〉林知己夫著作集編集委員会 編 2004年12月
ISBN:978-4-585-05152-7 - 『現象をさぐる データの科学』林知己夫著作集編集委員会 編 2004年12月
ISBN:978-4-585-05144-2 - 『心を比べる 意識の国際比較』林知己夫著作集編集委員会 編 2004年12月
ISBN:978-4-585-05146-6 - 『心を測る 日本人の国民性』林知己夫著作集編集委員会 編 2004年12月
ISBN:978-4-585-05145-9 - 『市場を測る』林知己夫著作集編集委員会 編 2004年12月
ISBN:978-4-585-05150-3 - 『質を測る 数量化理論』林知己夫著作集〈第3巻〉林知己夫著作集編集委員会 編 2004年12月 ISBN:978-4-585-05143-5
- 『社会を測る』林知己夫著作集編集委員会 編 2004年12月
ISBN:978-4-585-05149-7 - 『政治を測る 政治意識・選挙予測』林知己夫著作集編集委員会 編 2004年12月
ISBN:978-4-585-05147-3 - 『世論を測る』林知己夫著作集編集委員会 編 2004年12月
ISBN:978-4-585-05148-0 - 『野うさぎを数える 森林・動物・自然』林知己夫著作集編集委員会 編 2004年12月 ISBN:978-4-585-05151-0
- 『人との出会い』林知己夫著作集〈第14巻〉林知己夫著作集編集委員会 編 2004年12月 ISBN:978-4-585-05154-1
- 『未来を祭れ』林知己夫著作集〈第15巻〉林知己夫著作集編集委員会 編 2004年12月 ISBN:978-4-585-05155-8
- 林知己夫著作集 全十五巻 林知己夫著作集編集委員会 編 ISBN:978-4-585-05100-8 「データの科学(Data Science)」の提唱 多岐ジャンルにわたる1,500編超の全著作から、550編余を厳選収録! 全15巻セット 01 科学を考える―科学基礎論― [科学基礎論] 02 部分から全体を―サンプリング・調査法― [サンプリング][調査方法] 03 質を測る―数量化理論― [数量化理論] 04 現象をさぐる―データの科学― [分析手法][分類・データの科学] 05 心を測る―日本人の国民性― [日本人論] 06 心を比べる―意識の国際比較― [国際比較] 07 政治を測る―政治意識・選挙予測― [政治意識][選挙予測] 08 世論を測る [世論調査] 09 社会を測る [社会心理][言語][色彩][新聞][視聴率][広告] 10 市場を測る [市場調査] 11 野うさぎを数える―森林・動物・自然― [野兎][森林][自然] 12 健康を測る [健康・医療・福祉] 13 教育を考える [災害][教育][研究][科学] 14 人との出会い [人物交流] 15 未来を祭れ [随想][追悼]
- 林知己夫『データの科学』 (林知己夫編集 シリーズ データの科学 1) 2001年 朝倉書店
- 林 知己夫『数量化―理論と方法』 (統計ライブラリー) 朝倉書店 1993年11月1日
- 林知己夫『行動計量学序説』 (行動計量学シリーズ 1)1993年 朝倉書店
- 林知己夫『データ解析法の進歩』 1988年 放送大学教育振興会
- 林知己夫, 鈴木達三『社会調査と数量化 : 国際比較におけるデータ解析』1986年 岩波書店
- 林 知己夫『データ解析法』 (放送大学教材) 1985年3月1日 放送大学教育振興会
- 林知己夫『調査の科学 : 社会調査の考え方と方法』 (ブルーバックス B-571) 1984年 講談社
- 林知己夫, 坂本賢三『あいまいさを科学する : トワイライト・カテゴリーへの招待』(ブルーバックス B-556) 1984年 講談社
- 林知己夫『多次元尺度解析法の実際』(サイエンスライブラリ統計学13) 1984年 サイエンス社
- 林知己夫『科学と常識』1982年4月1日 東洋経済新報社
- 林知己夫『確率と統計―基礎から応用まで』(テレビ大学講座) 1980年8月1日 旺文社
- 林知己夫『データ解析の考え方』 1977年6月1日 東洋経済新報社
- 林知己夫『数量化の方法』1974年1月1日 東洋経済新報社
- 林 知己夫『比較日本人論―日本とハワイの調査から』(中公新書) 1973年1月1日 中央公論社
- 林 知己夫, 樋口 伊佐夫, 駒沢 勉『情報処理と統計数理』(コンピュータ・サイエンス・シリーズ) 1970年1月1日 産業図書
参考
- 林知己夫(ウィキペディア)
- 勉誠出版 ホーム 研究書 自然科学 林知己夫著作集 全十五巻
- 統計十話 第7話 測定誤差・測定データの変動の評価なくして統計的分析の意味はない その 3 林 知 己 夫 文部省統計 理研究所 W’ Waves Vol. 2 No. 1 1996
- 統計十話 第8話 欠測値の問題 林 知己夫 文部省統計数理研究所 W’ Waves Vol. 3 No. 1 1997 21