統計手法・計算処理実習 No.15 数量化I類(その2)     2000.2.23     関谷

1.前回・数量化I類( カテゴリウェイトの計算) までについて( コメント) など

〔復習〕

4.数量化法−質的な(定性的な)変数のカテゴリに数量を与えて,多次元的な解析を行う。

4.1 数量化の考え方

  測定の尺度 1)名義尺度  2)順序尺度  3)間隔尺度  4)比率尺度

  数量化の方法 外的基準のある場合−−回帰分析の目的変数など−林の数量化I類,II類など

         外的基準のない場合−−データの分類を目指すもの−    III類,IV類など

4.2 数量化I類(ダミー変数に対する重回帰分析−p.143の下から5行目)

 アイテム−要因

 カテゴリ−要因内の区分( ランク・分類のA,B,Cや1,2,3 など)

 ダミー変数の利用           (1)式, 表2

 ダミー変数を利用した線形式による予測 (2)式 あるいは(18)式

    係数をカテゴリウェイトと呼ぶ。

    (最小二乗法による。)     (3)〜(6)式

 関係式

   線形独立な式が,カテゴリ数の合計から,(アイテム数−1)を引いたものである。

   (不定性)−−このために,2番目のアイテムからは, 最初のカテゴリを除いて計算する。

   回帰係数については、カテゴリ内の平均がゼロになるように, 標準化するのが良い。

   予測式 (13)

       (10)は,アイテム2以降はカテゴリの2からの予測である。標準化前)

 求め方と例題  1 例2(p.147)

各自のホームページを作ってのレポート提出」

1)telnetでのフォルダ(ディレクトリ)public_htmlの作成

2)ftpあるいは、ffftpを使ってのindex.htmlなどのサーバへの転送

3)トップページ編集やレポートのページ作成(ローカルやWindowsNTフォルダ内)とブラウザでの確認。(レポートページの作成は、Wordでの文書をHTML形式で保存しても良い。)

4)サーバへの転送・ブラウザによるサーバでの確認

〔実習・レポートを見ての感想〕

1)ホームページの作成によるレポート提出:

@telnetやftp作業で、ユーザ名やパスワードについて、混乱した。

Aindex.htmlファイルが各自のトップページになることが徹底していなかった。

BHTMLのタグ等について、説明が不足した。すべてのページの「ソース」が見れることは話したが。


2)数量化I類の例題2についての考察を行うこと

 例2とその解析結果について,まとめること。(どんな問題について,どのような計算をして,

何が分かったのかです。)

・サンプルの値を予測すること。 カテゴリ得点を標準化するまえの値は,掃きだしで求まってい

るので,それとデータ行列Xとの積和を求めることになる。

〔次回〕定期試験です。2時限目に4期の範囲(多変量解析1〜4.2まで)で,記述式の問題に

している。持ち込みはすべて可。(テキストやプリントの復習をしておくこと。)

 

2. 今日の学習事項

 カテゴリウェイト(偏回帰係数)の標準化

   カテゴリ内の平均がゼロになるように, 標準化するのが良い。(P.267 ajk*)

 予測式:ソースでは,7)項で計算している。

  ただし,yb(yの平均値)は,積和行列の計算で求まっている。

  テキストでは,(13)式である。(P.267のYi)

  (カテゴリごとの得点の和の平均は,yの平均値になっていることが分かる。)

 

 テキストの「4.2の途中(p.144の中段」から

1) どの程度よく予測されているか?

    →観測値と予測値との重相関係数 R

   なお,この計算は,偏相関係数の計算で,同時にもとめることが出来る。

2) 外的基準Yi に対する各要因(アイテムj)の影響の大きさ

    →カテゴリウェイトの範囲で分かる。

        max(ajk)−min(ajk),j=1,2,・・・,アイテム数

         k       k

     (カテゴリ・ウェイトの範囲が大きいものほど,外的基準に対する影響が大きい。)

3) アイテムとカテゴリの偏相関係数

 1)と3)の計算式については,テキストに導出してあるが,前回紹介した参考書の方が,分かりやすい。

 重相関係数 R=√((Σ(yhi −yb)2 )/(Σ(yi −yb)2 ))

        =√(1−1/ryy)        このryyは,次の 4のk+1軸にある。

 偏相関係数については、次の通りである。

  1 まず,アイテム得点とyとの行列Xを求める。

  2 これの平方和・積和行列Sを求める。

  3 yと要因間の標本相関行列Rを求める。

  4 その逆行列R-1を求める。(掃き出しを1から,アイテム数+1までの軸で行う。)

  5 偏相関係数を求める。

   par(y,i)=−riy/√(riiryy)

 (注)重回帰での,偏相関係数の求め方に,手順では同じである。(No.4のp.2)

    ただし,もとの行列Xの作り方が違う。

3.演習課題

3,1 演習問題Bの4.9を考察のこと。

( この実行例は, 別ページにリンクしている。)

3.2 数量化T類用のプログラムQUANT1.Cについて解析のこと。

(計算の手法とプログラムの構造、処理手順などを考察のこと。)

レポートは,各自のトップホームページにリンクを貼って「統計手法No.15レポート」 として提出のこと。