統計手法・計算処理実習 No.14 数量化I類           2000.02.16 関谷

1.前回・判別分析までについて( コメント)

判別分析について,3回, 解析目的, 線形判別関数による計算方法と結果の見かた,Excelでの回

帰分析による方法を学習しました。

プログラミングを対象にしなかったのですが,興味のある人は, ソースを見てください。

なお,今日の分は,新しい問題です。今日の課題をまず, 一通り行って, レポートの提出をして

から、前回のまだ未提出の課題に着手のこと。

 

2. 今日の学習事項−第4章 数量化法 4.2 数量化I類

4.数量化法−質的な(定性的な)変数のカテゴリに数量を与えて,多次元的な解析を行う。

4.1 数量化の考え方

  測定の尺度 1)名義尺度 性別,職業,支持政党など

        2)順序尺度 優,良,可,不可など,

        3)間隔尺度 摂氏や華氏の温度など

        4)比率尺度 長さや重さなど

  数量化の方法 外的基準のある場合−回帰分析の目的変数など−−林の数量化I類,II類など

         外的基準のない場合−データの分類を目指すもの−− III類,IV類など

4.2 数量化I類(ダミー変数に対する重回帰分析−p.143の下から5行目)

 アイテム−要因

 カテゴリ−要因内の区分

 ダミー変数の利用           (1)式, 表2
(1) δi(jk) =1---個体iがアイテムjのカテゴリkに反応するとき
      =0---その他のとき

 ダミー変数を利用した線形式による予測 (2)式
(2) Yi=a11*δi(11)+a12*δi(12)+・・・+aRCr*δi(RCr)
     R Cj
    = Σ Σ ajk*δi(jk)
     j=1 k=1

    係数をカテゴリウェイト( あるいは, 偏回帰係数) と呼ぶ。

(最小二乗法による正規方程式の導出。)     (3)〜(6)式
    R Cj       R
(5)  Σ Σ f(uv,jk)*aj =Σ yi*δi(uv), v=1,2,...,cu, u=1,2,...,R
   j=1 k=1       i=1
         n
(6)  f(uv,jk) = Σ δi(uv)*δi(jk)    左辺の係数
         i=1

 関係式

   線形独立な式が,カテゴリ数の合計から,(アイテム数−1)を引いたものである。

   (不定性)

   アイテム内の平均がゼロになるように, 標準化するのが良い。

    予測式 (13)

   評価−次回に行います。

求め方と例題

1 例2(p.147)

  2プログラミングでは,多重回帰の応用となる。

   ([ 河口至商著, 多変量解析入門( I),森北出版] を参照しています。)

この方法での実行例を別のページにリンクしています。

3.実習の課題とレポートについて

1 実行した例1 −例2 の考察を行う。

(以下は、次回の課題に変更しました。)
2 数量化分析I類のプログラム−quant1.c−の考察を行う。( 例2 などのデータ)

   多重回帰のプログラムを改造して,作成している。( 名前などは, 皆さんの分に変更)

(標準化は少し厄介ですが,p.148 の中央部分以下での例を参照のこと。表3)

3 章末の問題B 4.9 をデータを作って, 計算して, 考察のこと。( 実行例の一部はp.4)

(注)例プログラムでは, 処理の内容が分かりやすいように, チェックプリントを追加している。

レポートは, 各自のトップホームページから今回のレポートページへのリンクを貼ったページとします。
内容は、例題1−2の考察のみです。
レポートのページの作り方は、Wordで考察した文書をHTML形式で保存したもので良いが、
レポートHTMLファイルは、例のindex.htmlにあるタグを参照してタイトル、本文を編集して名前を付けて保存する。
本文の1番簡単な編集は、<PRE>  </PRE>で、その間は整形済みとみなされる。

以上