|
| No | 課題内容 |
|---|---|
| 1 | 説明変数の独立性の検証 |
| 2 | 求めた回帰式の信頼性の検証 |
| 3 | Excelの「回帰分析ツール」の調査 |
| 4 | 回帰分析の手法を使うと有効な応用例 |
社員A:以上が課題でしたね・・・
ではちょっと説明が相前後しますが順に説明していきます。
今回の報告を一言で言うと「回帰分析をツールとして使う」ということになると思いますのでその線で進めます。
まずは先回の手順の復習。
【回帰分析の意味】
特定のモノについての性質をすでに収集された数値データに基づいて調査し新しい条件から結果を予測する。
回帰式というカタチで成果を得る。
【重回帰分析の方法】
元となる数値=説明変数(X1・・Xn)
結果の数値 =目的変数(Y)
回帰式
Y=a+b1・X1+b2・X2+・・・・+bn・Xn ・・ X1〜Xnの係数b1〜bnを求める
計算手順
1)説明変数の平均をもとめる(この平均と各説明変数の差を偏差と言う)
2)各説明変数偏差の平方及びその合計をもとめる(これが偏差平方和)
3)同じく各説明変数偏差と他の説明変数偏差の積及びその合計をもとめる(これを偏差積和と言う)
4)さらに説明変数偏差と目的変数偏差の偏差積和をもとめる
5) 2)3)の結果から偏差平方和・積和行列をつくりこれを求めたい回帰式に当てはめて 4)と組み合わせて解く
この部分はちょっと補足が必要かもしれません。
偏差平方和と偏差積和のイメージですがそれぞれ平均と実値との差を平方つまり2乗しているわけですがこれは
カタチとしては正方形のイメージです。偏差積和ですが説明変数ごとの偏差同士の積つまり掛け算でこちらは
長方形のイメージです。
偏差平方和・積和行列は説明変数(X1・・Xn)を縦項目と横項目にとって星取表の要領で平方和と積和を配置
した行列です。先回の説明では説明変数は3個ですから行列のサイズは3x3になります。
偏差平方和・積和
X1
X2
X3
X1
X1の偏差平方和
X1-X2偏差積和
X1-X3偏差積和
X2
X2-X3偏差積和
X2の偏差平方和
X1-X2偏差積和
X3
X1-X3偏差積和
X2-X3偏差積和
X3の偏差平方和
この表のピンクの部分を偏差平方和・積和行列と呼んでこの行列と説明変数を縦に並べた行列との積が
目的変数の偏差積和行列と等しいことから行列式を解いて各係数を求めました。
これは説明変数が増えても減っても手順としては変わりません。でも手計算で行うにはこの3つまでが
どうにか我慢できる限界だと思います。
勿論どうすれば計算できるかを知っていることは大事ですが今回の目的は回帰分析の応用です。
そこで先回社長から提案をいただいたExcelの分析ツールが役に立ちます。
§課題3:Excel分析ツールの使用
この便利(?)な分析ツールですが普通にExcelをインストールしただけでは表に出てないときがあります。
まず最初にExcelで分析ツールが使えるようにしておきます。
【Excelで分析ツールが使えるようにする】
1)メニューバーのツールを開く
ここに上のように分析ツールが無いときは以下の手順を実行します。
2)メニューバーのアドインを実行(上図参照)
3)分析ツールを探してチェックをつける
実行
3)メニューバーを開いたら
分析ツールがあるのを確認
4)試しに分析ツールを開いてみると
ちゃんと回帰分析の項目がある
以上
では先回の例をもとに実際に分析ツールを使って見ましょう。
先回の例はとある業種の店舗構成と売上表でした。
これを先回は手計算で
として解いてみました。
今回は分析ツールを使います。
もとデータが開かれた上体でメニューから先ほどあることを確認した分析ツールを起動して回帰分析を選んでOKします。
次はパラメータの入力ですがxは説明変数の値、yは目的変数の値の範囲を入れます。
下のほうの「残差」の所にチェックを入れておきましょう。得られた回帰式で計算した値と各目的変数の実値との差を
みることが出来ます。結果はこの設定だと新しいシートに得られます。
では実行してみましょう。
結果を入れた新しいシートが自動的に開きます。
係数のところには手計算で求めたのとほぼ同様な
a,b1,b2,b3に相当する2.504143324,0.816118114,1.054971989,-0.274918301
が見事に求められています。
残差は±2万円にほぼ収まっていますね。手計算に比べたら実に簡単です。資料を開いて範囲指定をして実行するだけ。
ここで注目したいのが重相関の0.91という値です。
§課題2:求めた回帰式の信頼性の検証 が関わってきます。
重相関、正式には重相関係数と呼びますが回帰式の当てはまりの良さを評価する指標だそうです。
1に近づくほどドンピシャとなります。
そしてこれが0.7で結構良いと評価している場合もあるようですから0.91ってのはこの標本のまとまりが良い
ことがわかります。 もちろん隠れた他の要因で決まる影響があるかもしれませんから万全とはいえませんが
同じ条件の店を出す際の目安にはなるでしょう。
分析ツールを使うと簡単に回帰式を求めることが出来るばかりか残差や重相関の検証も出来るのでサンプルさえ集める
手間をいとわなければ説明変数の数をかなり増やしたりすることも可能でしょうね。
同時にあまり関係が無いと思える説明変数を減らしたときの回帰結果への影響も眺めることが出来ます。
1つやってみましょう。
先の実例では「メニューの充実度」がどの程度、回帰全体に影響を与えているのか不明ですのではずして計算をして見ます。
結果は下のようになりました。
得られる回帰式は y=1.83+0.810X1+0.8957X2になります。
評価は・・・
思ったとおりメニューの充実度は極端な影響が無いようです。重相関は0.1ポイントマイナスになっただけですし残差も最大で
5千円程度増えただけです。手計算なら間違いなくはずすでしょう。
もちろんサンプルが変わればまた式や影響も変わりますのであくまでも今回までのサンプルではということになります。
ここで知りたいのは簡単に説明変数を削除したり加えたりしながら対象を分析できるということです。
さて課題の1の説明変数の独立性を説明します。
通常、回帰分析では複数の説明変数を用いますがこのときある説明変数と別の説明変数との間に強い相関関係があると
それらをもとにした回帰分析は結果が妙なものになる可能性があります。それで各説明変数の間に相関関係がない、
つまり独立であることが求められるわけです。
(良い例えかどうかは自信無いですが、ある大学の医学部の合格率を小学校の時の成績と中学校のときの成績で判断し
ようとするとき満遍なく全科目を入れるとかえって変な結果になることがあるかもしれません。なぜなら小学生の
算数の成績と国語の成績に強い相関関係があるからです。統計の参考書によればこのような時は算数と国語の和とか
差を1つの説明変数にすると良い分析ができることがあるようです。)
いよいよ最後の課題です。
§課題4:回帰分析の手法を使うと有効な応用例
社長が作られた例はトイレの見積もりシステムでした。
1)便器の値段、2)配管の長さ、3)内装の価格から総工事費の概算をするものでした。
同じように本来、細かい積算で計算するような見積計算をいくつかのパラメータで概算出来るような分野は多くあります。
例えば建物の衛生設備工事で建物の構造、床面積、階数、配管種別(種類の数値化が必要ですが)、などから工事費を
概算できると自分で作成した見積書が極端に外れていないかどうか前もって予測することが出来ますし、
予定していなかった入札をいきなりの概算で行うことも出来るかもしれません。
パソコンのタイプ(デスクトップ、ノートPC)、ハードディスクの回転数、毎日の使用時間、等から故障予測時間を出して
危機回避に役立てるかもしれません。
このように予想値の概算や予測系のことにはかなり使えると思います。応用分野は適用の工夫をすれば無限ですね。
具体例を示せると良いのですが今回はページの分量も伸してきたので割愛します。
以上で報告を終わります。
|
さて今回の『技術者のための教養講座「回帰分析応用編」』はいかがでしたか? A君は毎朝遅れずに来て役員室の掃除ができるのかな? みなさんも回帰分析という言葉でしり込みせずに道具として使ってみてはいかがですか? 結構役に立ちますよ! 次回の『技術者のための教養講座』をお楽しみに! |