統計手法・計算処理実習 No.15 数量化I類(その2) 2000.2.23 関谷
1.前回・数量化I類( カテゴリウェイトの計算) までについて( コメント) など
〔復習〕
4.数量化法−質的な(定性的な)変数のカテゴリに数量を与えて,多次元的な解析を行う。
4.1 数量化の考え方
測定の尺度 1)名義尺度 2)順序尺度 3)間隔尺度 4)比率尺度
数量化の方法 外的基準のある場合−−回帰分析の目的変数など−林の数量化I類,II類など
外的基準のない場合−−データの分類を目指すもの− III類,IV類など
4.2 数量化I類(ダミー変数に対する重回帰分析−p.143の下から5行目)
アイテム−要因
カテゴリ−要因内の区分( ランク・分類のA,B,Cや1,2,3 など)
ダミー変数の利用 (1)式, 表2
ダミー変数を利用した線形式による予測 (2)式 あるいは(18)式
係数をカテゴリウェイトと呼ぶ。
(最小二乗法による。) (3)〜(6)式
関係式
線形独立な式が,カテゴリ数の合計から,(アイテム数−1)を引いたものである。
(不定性)−−このために,2番目のアイテムからは, 最初のカテゴリを除いて計算する。
回帰係数については、カテゴリ内の平均がゼロになるように, 標準化するのが良い。
予測式 (13)
(10)は,アイテム2以降はカテゴリの2からの予測である。標準化前)
求め方と例題 1 例2(p.147)
「各自のホームページを作ってのレポート提出」
1)telnetでのフォルダ(ディレクトリ)public_htmlの作成
2)ftpあるいは、ffftpを使ってのindex.htmlなどのサーバへの転送
3)トップページ編集やレポートのページ作成(ローカルやWindowsNTフォルダ内)とブラウザでの確認。(レポートページの作成は、Wordでの文書をHTML形式で保存しても良い。)
4)サーバへの転送・ブラウザによるサーバでの確認
〔実習・レポートを見ての感想〕
1)ホームページの作成によるレポート提出:
@telnetやftp作業で、ユーザ名やパスワードについて、混乱した。
Aindex.htmlファイルが各自のトップページになることが徹底していなかった。
BHTMLのタグ等について、説明が不足した。すべてのページの「ソース」が見れることは話したが。
2)数量化I類の例題2についての考察を行うこと
例2とその解析結果について,まとめること。(どんな問題について,どのような計算をして,
何が分かったのかです。)
・サンプルの値を予測すること。 カテゴリ得点を標準化するまえの値は,掃きだしで求まってい
るので,それとデータ行列Xとの積和を求めることになる。
〔次回〕定期試験です。2時限目に4期の範囲(多変量解析1〜4.2まで)で,記述式の問題に
している。持ち込みはすべて可。(テキストやプリントの復習をしておくこと。)
2. 今日の学習事項
カテゴリウェイト(偏回帰係数)の標準化
カテゴリ内の平均がゼロになるように, 標準化するのが良い。(P.267 ajk*)
予測式:ソースでは,7)項で計算している。
ただし,yb(yの平均値)は,積和行列の計算で求まっている。
テキストでは,(13)式である。(P.267のYi)
(カテゴリごとの得点の和の平均は,yの平均値になっていることが分かる。)
テキストの「4.2の途中(p.144の中段」から
1) どの程度よく予測されているか?
→観測値と予測値との重相関係数 R
なお,この計算は,偏相関係数の計算で,同時にもとめることが出来る。
2) 外的基準Yi に対する各要因(アイテムj)の影響の大きさ
→カテゴリウェイトの範囲で分かる。
max(ajk)−min(ajk),j=1,2,・・・,アイテム数
k k
(カテゴリ・ウェイトの範囲が大きいものほど,外的基準に対する影響が大きい。)
3) アイテムとカテゴリの偏相関係数
1)と3)の計算式については,テキストに導出してあるが,前回紹介した参考書の方が,分かりやすい。
重相関係数 R=√((Σ(yhi −yb)2 )/(Σ(yi −yb)2 ))
=√(1−1/ryy) このryyは,次の 4のk+1軸にある。
偏相関係数については、次の通りである。
1 まず,アイテム得点とyとの行列Xを求める。
2 これの平方和・積和行列Sを求める。
3 yと要因間の標本相関行列Rを求める。
4 その逆行列R-1を求める。(掃き出しを1から,アイテム数+1までの軸で行う。)
5 偏相関係数を求める。
par(y,i)=−riy/√(riiryy)
(注)重回帰での,偏相関係数の求め方に,手順では同じである。(No.4のp.2)
ただし,もとの行列Xの作り方が違う。
3.演習課題
3,1 演習問題Bの4.9を考察のこと。
( この実行例は, 別ページにリンクしている。)
3.2 数量化T類用のプログラムQUANT1.Cについて解析のこと。
(計算の手法とプログラムの構造、処理手順などを考察のこと。)
レポートは,各自のトップホームページにリンクを貼って「統計手法No.15レポート」 として提出のこと。