統計手法・計算処理実習 No.14 数量化I類 2000.02.16 関谷
1.前回・判別分析までについて( コメント)
判別分析について,3回, 解析目的, 線形判別関数による計算方法と結果の見かた,Excelでの回
帰分析による方法を学習しました。
プログラミングを対象にしなかったのですが,興味のある人は, ソースを見てください。
なお,今日の分は,新しい問題です。今日の課題をまず, 一通り行って, レポートの提出をして
から、前回のまだ未提出の課題に着手のこと。
2. 今日の学習事項−第4章 数量化法 4.2 数量化I類
4.数量化法−質的な(定性的な)変数のカテゴリに数量を与えて,多次元的な解析を行う。
4.1 数量化の考え方
測定の尺度 1)名義尺度 性別,職業,支持政党など
2)順序尺度 優,良,可,不可など,
3)間隔尺度 摂氏や華氏の温度など
4)比率尺度 長さや重さなど
数量化の方法 外的基準のある場合−回帰分析の目的変数など−−林の数量化I類,II類など
外的基準のない場合−データの分類を目指すもの−− III類,IV類など
4.2 数量化I類(ダミー変数に対する重回帰分析−p.143の下から5行目)
アイテム−要因
カテゴリ−要因内の区分
ダミー変数の利用 (1)式, 表2
(1) δi(jk) =1---個体iがアイテムjのカテゴリkに反応するとき
=0---その他のとき
ダミー変数を利用した線形式による予測 (2)式
(2) Yi=a11*δi(11)+a12*δi(12)+・・・+aRCr*δi(RCr)
R Cj
= Σ Σ ajk*δi(jk)
j=1 k=1
係数をカテゴリウェイト( あるいは, 偏回帰係数) と呼ぶ。
(最小二乗法による正規方程式の導出。) (3)〜(6)式
R Cj R
(5) Σ Σ f(uv,jk)*aj =Σ yi*δi(uv), v=1,2,...,cu, u=1,2,...,R
j=1 k=1 i=1
n
(6) f(uv,jk) = Σ δi(uv)*δi(jk) 左辺の係数
i=1
関係式
線形独立な式が,カテゴリ数の合計から,(アイテム数−1)を引いたものである。
(不定性)
アイテム内の平均がゼロになるように, 標準化するのが良い。
予測式 (13)
評価−次回に行います。
求め方と例題
1 例2(p.147)
2プログラミングでは,多重回帰の応用となる。
([ 河口至商著, 多変量解析入門( I),森北出版] を参照しています。)
この方法での実行例を別のページにリンクしています。
3.実習の課題とレポートについて
1 実行した例1 −例2 の考察を行う。
(以下は、次回の課題に変更しました。)
2 数量化分析I類のプログラム−quant1.c−の考察を行う。( 例2 などのデータ)
多重回帰のプログラムを改造して,作成している。( 名前などは, 皆さんの分に変更)
(標準化は少し厄介ですが,p.148 の中央部分以下での例を参照のこと。表3)
3 章末の問題B 4.9 をデータを作って, 計算して, 考察のこと。( 実行例の一部はp.4)
(注)例プログラムでは, 処理の内容が分かりやすいように, チェックプリントを追加している。
レポートは, 各自のトップホームページから今回のレポートページへのリンクを貼ったページとします。
内容は、例題1−2の考察のみです。
レポートのページの作り方は、Wordで考察した文書をHTML形式で保存したもので良いが、
レポートHTMLファイルは、例のindex.htmlにあるタグを参照してタイトル、本文を編集して名前を付けて保存する。
本文の1番簡単な編集は、<PRE> </PRE>で、その間は整形済みとみなされる。
以上