<<< 予測名人 説明書  '21/4/18  だるま(鈴木正国) >>> 【ソフト名称  】予測名人 【バージョン  】1.30.1 【主ファイル名 】重回帰.xlam 【動作環境   】OS : Windows7/8.1/10          Excel : Excel2007-2019         (動作確認:Windows8.1+Excel2016(32ビット), Windows10+Excel2019(64ビット)) 【ソフト種別  】フリーソフト 【著作権    】だるま(鈴木正国)が保有しています。          雑誌等への掲載は自由です。但し、事前または事後連絡願います。 【免責     】作者は一切責任を負いません。ご自身の責任でご使用ください。 【E-mail    】daruma3.vbaアットマークoffice.tnc.ne.jp      (スパムメール対策です↑を「@」に変えてください。) 【ホームページ 】http://hp.vector.co.jp/authors/VA033788/index.html 【ベクターだるまのページ】http://www.vector.co.jp/vpack/browse/person/an033788.html ■更新履歴■ Ver. 1.30 初公開 Ver. 1.30.1 【64ビット版】のExcelに対応 ■■■ 目次 ■■■ ●予測名人とは ●インストールについて ●同梱ファイルについて ●機能概要 ●まずは使ってみましょう ●メニュー各項目の説明 ★そのまえに ◆【信頼区間と予測区間】の意味について ◆【標準残差】について ◆【標準回帰係数】という表現について ◆【有意水準・有意確率、P値、t値、F値】について ★【変数自動選択】 ★【重回帰予測】 ★【グラフ】 ★【非表示】 ★【サンプルデータ】 ●分析結果の見方 ★相関行列 ★回帰係数と検定値t ★重相関係数と検定値F ★推定値 ★標準残差グラフ ★推定計算結果 ●よくある質問 ★CSVファイルのデータを使うには ★Excel2003以前では使えないのでしょうか ★F99.99=??とは何ですか ★F値とは何ですか ★OKボタンが淡色で押せません ★t99=??とは何ですか ★t値とは何ですか ★t分布とは何ですか ★VIFとは何ですか ★アクティブセル領域とは何ですか ★アドインの素.xlaはシェアウエアではないですか ★異常値、外れ値とは何ですか ★上書きしてもよいかという警告が出ます、はいを押しても大丈夫でしょうか ★エラー表示への対処方法を教えてください ★回帰線のX軸方向延長割合とは何ですか ★t値(やF値)の基準値との比較は「より大(>)」ですかそれとも「以上(>=)」ですか ★グラフ表示にある固定値Xとは何ですか ★グラフで固定値Xを指定したものなど実用的には意味がないのではありませんか ★グラフの回帰線のX軸方向延長割合はどの程度を指定するのが良いのでしょうか ★グラフの確認のためになぜ一々非表示ボタンを押さなければならないのですか ★グラフはなぜ別ブックに作成されるのですか ★グラフ表示で「回帰式表示」と「元データ表示」が淡色で選択できません ★グラフ表示で入力した目盛値が勝手に変わってしまいます ★グラフ表示はなぜ95%以上有意な時だけなのですか ★貢献度とは何ですか ★個々のボタンなどの機能説明はどこにありますか ★残差とは何ですか ★残差分散とは何ですか ★誤差分散とは何ですか ★残差グラフは何のために作成するのですか ★サンプルデータの振れ幅とは何ですか ★サンプルデータを作ろうとしましたが無反応で終わってしまいました ★重回帰モデルとは何ですか ★自由度とは何ですか ★信頼区間と予測区間の違いは何ですか ★推定、信頼、予測の言葉の違いを説明してください ★推定幅とは何ですか ★推定幅は95%が一般的ですか ★説明書内をキーワードで検索できますか ★多重共線性とは何ですか ★他のソフトと計算結果が違うみたいですが ★単回帰なのですがデータはX,Yの順でもできますか ★単回帰のグラフに表示される数式は分析結果で表示される数式と違うみたいですが ★データに文字列が含まれているとエラーになりました ★データ範囲としてアクティブシート以外を指定できますか ★データ範囲の効率的な選択方法を教えてください ★データ範囲の指定を直接キーボードから入力できますか ★なぜ95%という数字がよく使われるのでしょうか ★任意のX(新たなX)に対する推定値はどうやったら得られますか ★変数自動選択とは何ですか ★変数選択基準とは何ですか ★変数自動選択の実行は必ず必要ですか ★変数自動選択結果の見方を教えてください ★変数名に変な数字が表示されます ★補正R2とは何ですか ★補正R2の計算はどうやるのですか ★元データには一行目に項目名が必須ですか ★元データの並び方に決まりはありますか ★元データ入力(入力元範囲の設定)では範囲全体ではなく部分的な選択も出来ますか ★元データ入力(入力元範囲の設定)で列全体は選択できますか ★有意性の95%と推定幅の95%の関係は何ですか ★横並びのデータは使えませんか ★量的変数ではなく質的(カテゴリ別)変数で分析するには ★過誤の確率5%未満とは何ですか ★対数、指数、べき乗回帰分析を行なうには ●お問い合わせ **************************************************************************** ●予測名人とは **************************************************************************** 独立変数X最大52個まで使いステップワイズ法で変数自動選択、対数回帰、区間推定、グラフ表示 も出来る簡単操作の重回帰分析ソフトです。 予測(推定)を主な目的とし簡単に操作できるように、推定に必要な項目に絞った入出力 になっています。 直線回帰、対数回帰の他、指数回帰、べき乗回帰も出来ます。区間推定では、信頼区間又は 予測区間の計算が出来、重回帰でもそのグラフ表示が出来ます。 **************************************************************************** ●インストールについて **************************************************************************** 解凍したファイルを、適当に作成したフォルダ(※1)の中にすべて入れてください。 本ソフトはアドインとして設定しなくても、必要な都度ファイルを開いて使用することも 出来ますが、アドインとして設定して使用することをお勧めします。 (通常のファイルとして開く時の【マクロの警告】の関係です。) アドインとして設定して使用する時は、以下の方法で設定して下さい。   「ファイル」タブ-「オプション」-「アドイン」-「設定」-「参照」   で、重回帰.xlamを選択します。 ※1 WindowsVista以降ではシステムフォルダに対する制限が厳しくなっていて、ProgramFiles  フォルダの下などでは動作時にシステムエラーになったり、エラーにはならなくても正常に  動作しているように見えているのにプログラムからのファイル作成が失敗していたりなどと  いうことがあります。  ですので、ユーザーアドイン用のフォルダとしては【システムフォルダ以外】の例えば  C:\Addins\MultipleRegressionなどというフォルダの作成をお勧めします。 アンインストールは、まずアドイン設定してある時はそれを解除します。   「ファイル」タブ-「オプション」-「アドイン」-「設定」 その後、フォルダごと削除してください。 アップデート方法 旧バージョンからのアップデートは、解凍したファイルで旧ファイルを上書きしてください。 **************************************************************************** ●同梱ファイルについて **************************************************************************** ★重回帰.xlam  本体プログラムです。 ★予測名人_説明書.txt、予測名人_説明書.xlsx  説明書ファイル、本ファイルです。  Excel版の方はハイパーリンクや画像を使い読み易くなっています。 ★アドインの素.xla  本体プログラムが参照しているファイルです。同じフォルダ内に置きます。 **************************************************************************** ●機能概要 **************************************************************************** ・ワークシート上のデータから、重回帰分析(直線、対数、指数、べき乗)を行ないます。 ・独立変数Xは最大52個まで扱えます。 ・ステップワイズ法により、最適な変数の自動選択が迅速に出来ます。  選択基準は%で指定し、選択過程の表示も可能です。 ・標準残差のグラフ表示により、異常値の発見が容易です。 ・新たなXに対する推定値Yの計算、信頼区間又は予測区間の計算、グラフ表示が出来ます。 **************************************************************************** ●まずは使ってみましょう **************************************************************************** まず、前項に従ってインストールしてください。 そして、詳しい説明は後にして、とりあえず使ってみましょう。 ★1.データの準備 「データ」タブ、「予測名人」グループ、「メインメニュー」をクリックします。 メインメニューフォームが表示されます。 「サンプルデータ」ボタンをクリックします。 ダイアログが表示されて行きますのでそのまま「OK」を(3回)、そして「はい」をクリックします。 新しいシートが追加されてサンプルデータが作成されます。 ★2.変数自動選択 「メインメニュー」の「変数自動選択」ボタンをクリックします。 「変数自動選択」フォームが表示されます。 「入力元」、「Y範囲」の「選択」ボタンをクリックします。 セル範囲選択のダイアログが表示されます。 そのまま「OK」をクリックします。 (A1セル(一セル)のみが選択された状態から「選択」を実行すると自動で  アクティブセル領域が選択されます。) これで、「入力元」の「Y範囲」「X範囲」共に設定出来ました。 「ラベル」にチェックが入っていること、「変数選択基準」が80%であることを確認し 「OK」をクリックします。 変数の自動選択結果がテキストボックスに表示されます。 ** または * が付いた変数が表示されれば良いですが、表示されなかった時は再度 サンプルデータを作り直してみてください。 逆に、**や*が付かない変数も選択されたときは選択基準の%を大きくして再度「OK」 をクリックし、変数を絞り込んでください。 ** または * が付いた変数のみが選択結果に表示されるように調整します。 (**は99%以上、*は【95%以上の確率で有意】な変数です。表現が長過ぎますので、  以下では単に、【95%以上有意】、というような書き方にします。) ★3.選択されたデータのコピー 「コピー」ボタンをクリックします。 これにより、自動選択されたデータが新規シートにコピーされます。 「キャンセル」ボタンで変数自動選択を終了します。 ★4.重回帰予測 「メインメニュー」の「重回帰予測」ボタンをクリックします。 「重回帰予測」フォームが表示されます。 「入力元」、「Y範囲」の「選択」ボタンをクリックします。 セル範囲選択のダイアログが表示されます。 前段階でコピーされたデータ範囲の中の一セルを選択して「OK」をクリックします。 (一セルのみの選択で、自動でアクティブセル領域が選択されます。) これで、「入力元」の「Y範囲」「X範囲」共に設定出来ました。 「ラベル」にチェックが入っていることを確認します。 「出力オプション」の「セル」「選択」ボタンをクリックします。 セル範囲選択のダイアログが表示されます。 入力元データと重ならない適当なセルを選択し「OK」をクリックします。 フォームに戻り「OK」ボタンのクリックで、分析結果がシートに出力されます。 (分析結果の見方は後述) ★5.グラフ表示 「重回帰予測」を実行しその分析結果が、すべての独立変数Xについて95%以上有意な時に、 グラフ表示が出来ます。 「メインメニュー」の「グラフ」ボタンをクリックします。 「グラフ」フォームが表示されます。 とりあえず、設定はそのままで「OK」ボタンをクリックします。 すると、別ブックにグラフが表示されます。 画面はメインメニューに戻ります。 そのままではグラフが確認できないので、一旦メインメニューの「非表示」をクリックします。 (「非表示」によって、分析結果を保持したまま、手作業でブック切り替えができます。) ブックを切り替えてグラフを確認します。 最初に作られたグラフは「貢献度」が一番大きいXを横軸としたグラフです。 他のXは固定値で指定します。(初期値は各Xの平均値です。) 横軸を他のXとしたグラフを描くには再度「メインメニュー」「グラフ」とします。 分析結果が保持されている間は何度でも「グラフ」を描くことが出来ます。 二つ目以降のグラフは、一つ目と同じブックへ、シートを追加して描かれます。 (グラフへの、回帰式表示と元データ表示は、Xが一つの単回帰の時のみ可能です。) **************************************************************************** ●メニュー各項目の説明 **************************************************************************** ★そのまえに ◆【信頼区間と予測区間】の意味について  「推定」では「信頼区間」または「予測区間」を選択できます。  例えば推定幅を95%と指定して「信頼区間」を選んだ場合、次回同条件で同程度のデータを  取得した時、その平均(回帰線)が95%の確率で信頼区間の幅の範囲に入ります。  一方「予測区間」の場合は、次回同条件で一つのデータを取得した時、平均ではなく  その一つのデータが95%の確率で上下の予測区間の幅の範囲に入ります。  【つまり推定の対象が、「平均」の時は「信頼区間」、「個々のデータ」の時は  「予測区間」を選択します。】 ◆【標準残差】について  本ソフトの標準残差(標準化残差)は一般の統計ソフトとは少しだけ意味合いが違います。  一般的には、残差/(SQRT(Ve*(n-p-1)/(n-1))) として標準化しているようです。  しかし本プログラムでは「予測区間」「信頼区間」を求める下記数式で使用している  SQRT(σ2)で残差を割っています。 *計算式 1.点推定値 = AY+Σ{byi*(Xi-AXi)} 又は a+Σ{byi*Xi}、(a = *******) 2.推定誤差(予測区間) σ2=[ 1+1/n+ Σ{Cij*(Xi-AXi)*(Xj-AXj)} ]*Veとして 推定値 = 点推定値 ± t(n-p-1,95%)*SQRT(σ2)  上記数式にあるように、推定区間の上下限はSQRT(σ2)を単位として t 倍した分だけ  点推定値から±した値になります。  そこで標準残差グラフでは、縦軸の値を、残差(実値)をSQRT(σ2)で割った値とし、  (その商は t となるので)縦軸を t としています。  そして、予測区間または信頼区間の上限と下限の線も入れています。  これにより、P=1(Xの数=1)の時だけでなくP>=2の時でも標準残差グラフにより、  【各データが平均(回帰線)からどの程度離れているかの目安】が分かります。  (P>=2では回帰線とデータをプロットした通常のグラフは表示出来ません。) ◆【標準回帰係数】という表現について  一般的には「標準偏回帰係数」と言うようです。ネットには「偏」がどういう意味なのか  という情報もありますが分かりにくいです。さらに、「偏」は不要であると言う専門家も  いるとの事です。  であれば、わざわざ分かりにくい「偏」を付けて呼ぶよりも単純に「標準回帰係数」  と表示しても問題ないと考えました。  「回帰係数」(標準が付かない方)も同様です。  また、標準回帰係数は独立変数Xが従属変数Yをどの程度説明しているかの目安でも  あるので(貢献度)と追記しています。(寄与率と表現する場合もあるようです。) ◆【有意水準・有意確率、P値、t値、F値】について  統計学の世界では有意水準・有意確率5%(=0.05)で有意であるから云々、というような  表現をよくします。  これは、ある帰無仮説(仮説を否定する事によって、仮説の逆の事を立証しようとする仮説)  の水準・確率の事です。  例えば重回帰分析の独立変数Xのt検定では「回帰係数=0」という帰無仮説を立てて、  その確率を計算しています。その計算結果の値がt値、t値を元にt分布から導き出した  確率がP値です。t値が大きいほど、確率P値は小さくなります。  例えばt値が、t分布の両側5%の値より大きければ(P値<5%なら)、そんな低い確率の事が  起きていると考えるより、帰無仮説「回帰係数=0」を捨てて「回帰係数≠0」つまり  その変数Xは存在すると考える方が自然である、とするわけです。  (その帰無仮説を捨てる基準の確率として5%なら、有意水準0.05で、と表現します)  実に回りくどい表現ですが、学問としてはそうせざるを得ないのでしょう。  しかし、一般人には分かりにくいです。  有意水準0.05とか0.01とか、有意水準が小さいほど変数Xが有意?って何?と普通は  考えてしまいそうです。  そこで本ソフトではあえて反対側からの表現をしています。  一般に言う【有意水準5%】で云々は、【95%以上の確率で有意】又は単に【95%有意】  などと表現しています。  これで、意味は全然間違っていません。  むしろ、有意水準が5%未満であるから変数Xが有意であると表現するよりは、普通に  95%有意といった方が感覚的には自然ではないでしょうか。  学問的な基本はそれはそれとして、一般人が普通に使うには分かり易い表現の方が良い  と私は考えます。学問的な表現を、一般人が使うソフトで必ずしも使わなければならない  という事はないと思います。  それから、t値とP値ですが、本ソフトでは基本的にt値を使っています。  値が大きい方がより存在が有意(確率が大)である、とした方が分かり易いと考えるからです。  ただ、t値は、95%有意と判断するその比較基準となる値が自由度によって変わるため  単純にその値だけを見ても95%以上有意なのかどうかは判断できません。  その為、本ソフトでは、自由度によって変わるその基準値もt0(或いはt95=2.10など)  として表示するようにしています。  (勿論、95%有意かどうかなどということは内部で判断して「*」などで表示しています   から、一々値を目で見て比較する必要はありません。参考表示です。)  【t値は独立変数Xの有意性の検定値】、それに対して重回帰モデル全体としての有意性  の検定値である F値 についても同様(大きいほど有意性大)です。  ただ、F値に関してはソフトによってあるいは文献上でもそうですが、計算で算出した値  そのものを扱っている場合と、P値のように確率で扱っている場合があるようです。  さらに、一般的なソフトそして文献上でも「変数選択」時の、変数の「投入/除去」  の基準値としてもF値という表現が使われています。(Fin, Fout)  実に紛らわしいです。  ということで、本ソフトでは【F値は重回帰モデル全体の有意性の検定値】で、計算で  算出した「値」そのもの(確率ではない)としています。  そして、t値と同様に比較基準値も、F0(或いはF99.9=123.4など)として表示しています。 ============================================  【有意水準・有意確率、P値、t値、F値】について要約すると  t値とは独立変数Xの有意性の検定値、それを確率で表したのがP値  一般に言う有意水準0.05(5%)は、本ソフトでは【95%以上の確率で有意】又は単に【95%有意】と表現  F値は重回帰モデル全体の有意性の検定値  ついでに、補正R2は、重回帰モデルの当てはまり具合の指標です  (有意かどうかと、当てはまり具合、は別次元の問題です。) ============================================ ★【変数自動選択】 ・指定セル範囲のデータから、ステップワイズ法で最適な独立変数Xを選択します。 ・「入力元」の「Y範囲」「X範囲」を入力しますが、「選択」ボタンでダイアログを表示し  マウスで選択するのが簡単です。 ・「Y範囲」と「X範囲」は別々に選択する事も出来ますが、一列目がY、二列目以降にX  という並びのデータであれば一度に範囲を選択できます。  それには、「Y範囲」の「選択」でY,X1,X2…の全範囲を選択します。 ・「範囲」の選択では、一セルのみを選択すると自動でアクティブセル領域が選択されます。 ・「範囲」の選択では、列全体の選択が可能です。適宜上下の空セルはカットされます。 ・変数を対数で扱う時は「対数」チェックボックスをチェックします。  Xを対数にすれば対数回帰、Yを対数にすれば指数回帰、共に対数にすればべき乗回帰  になります。 ・Xを個別に対数指定する場合は「設定」をクリックします。 ・変数選択基準は独立変数Xの有意水準を%で指定します。(60% 〜 99%)  直接の入力は出来ません、スピンボタンで指定します。  (これは一般的な統計ソフトでいうところのFin,Foutで、80%がほぼ 2 に相当します。   P値で指定しているソフトでいえば、80%が0.2です。   投入基準と除去基準は別値の指定は出来ず、同一値です。) ・「選択過程表示」をチェックすれば、選択過程を別ブックへ書き出す事も出来ます。 ・「OK」ボタンで変数自動選択を実行します。 ・選択結果はフォーム上のテキストボックスに表示されます。  表示は、変数名・t値・有意確率判定の印で、「X6 t = -14.91 **」のような感じです。  ** は >99%、* は >95%、+ は >90%、無印はそれ以下です。 ・重回帰モデル全体の有意性の検定値である「F値」と、当てはまり具合の指標「補正R2」が  フォーム右側のラベルへ表示されます。 ・ラベルにはt値の基準値「t99」「t95」、F値の基準値「F99.99」「F99.9」も参考に表示されます。  (一般的に独立変数Xの有意性は、95%あれば一応OK、99%あればかなり信頼できると考えます。   それに対して重回帰モデル全体の有意性では、99.9%ぐらいが一応OK、99.99%であればかなり   信頼できる、と考えます。但し、私見ですが。) ・変数が選択された場合、「コピー」ボタンでそのデータを別シートへコピー出来ます。  (コピーしたのちに「重回帰予測」メニューで「予測」が出来ます。) ★【重回帰予測】 ・指定セル範囲の全データで重回帰分析を行ないます。 ・「データ名」は分析結果一覧表等のタイトルに使用されるだけで計算には無関係です。  適宜入力してください、無しでも構いません。ダブルクリックでクリアできます。 ・「現在時刻」ボタンでデータ名に現在時刻を付加出来ます。 ・「入力元」の「Y範囲」「X範囲」を入力しますが、「選択」ボタンでダイアログを表示し  マウスで選択するのが簡単です。 ・「Y範囲」と「X範囲」は別々に選択する事も出来ますが、一列目がY、二列目以降にX  という並びのデータであれば一度に範囲を選択できます。  それには、「Y範囲」の「選択」でY,X1,X2…の全範囲を選択します。 ・「範囲」の選択では、一セルのみを選択すると自動でアクティブセル領域が選択されます。 ・「範囲」の選択では、列全体の選択が可能です。適宜上下の空セルはカットされます。 ・変数を対数で扱う時は「対数」チェックボックスをチェックします。  Xを対数にすれば対数回帰、Yを対数にすれば指数回帰、共に対数にすればべき乗回帰  になります。 ・Xを個別に対数指定する場合は「設定」をクリックします。 ・分析結果の出力先は、セル、新規ワークシート、新規ブックから選択します。  セルの場合はさらに、「選択」ボタンで書き込み先のセルを選択します。 ・「新規ワークシート」の場合は、アクティブブックにシートが追加されて書き込まれます。 ・「新規ブック」の場合は、常に新規ブックが作成されて、そのSheet1に書き込まれます。 ・異常値(外れ値)を確認するために、残差グラフが表示できます。  「残差グラフの作成」にチェックを入れます。 ・「推定」では、「信頼区間」か「予測区間」のどちらかを選択します。  推定の対象が「平均」の時は「信頼区間」、「個々のデータ」の時は「予測区間」を選択します。 ・「推定」の「X範囲」では、新たなXに対する推定値Yを計算する、そのXの範囲を指定します。  元データのX範囲の指定でも構いませんし、全然別個にXの値を入力した範囲でも構いません。 ・「推定」では、「推定幅」を指定します。「信頼区間」又は「予測区間」で使用されます。  例えば「信頼区間」を選択して「推定幅」を95%と指定すれば、平均(回帰線)が95%の確率  で入る上限と下限を算出できます。  また「予測区間」で「推定幅」を95%と指定すれば、個々のデータが95%の確率で入る  上限と下限を算出できます。 ・「OK」ボタンで重回帰分析を実行し、結果をシートへ書き込みます。  その分析結果の見方については後述します。 ★【グラフ】 ・「重回帰予測」を実行しその分析結果が、すべての独立変数Xについて95%以上有意な時  (** 又は * の時)にグラフ表示が出来ます。 ・「重回帰予測」実行後、続けて「メインメニュー」の「グラフ」をクリックします。  グラフの設定フォームが表示されます。 ・「グラフタイトル」は「重回帰予測」から継承されますが、任意に書き換え可能です。 ・「推定幅」は「重回帰予測」から継承され、変更は不可です。 ・「X軸」では、独立変数Xが2つ以上ある時はその内の1つを選択します。 ・残りのXについては「固定値」を指定します、初期値は各々の平均値です。 ・「固定値」を変更する時はリストボックスから対象のXを選択し、右側のテキストボックス  に入力します。 ・「全て平均に設定」ボタンをクリックすると全てのXの固定値が平均値に設定されます。 ・「X軸」「Y軸」の「対数」チェックボックスは軸スケールの対数指定です。  初期値は計算時の設定になっていますが変更可能です。  ただし、データ値に0以下の値が含まれている時は対数目盛は指定できません。 ・「回帰線のX軸方向延長割合」は回帰線と推定幅(「信頼区間」又は「予測区間」)を  X軸方向にどれだけ延長するかを、元データの幅を基準として指定します。  0%または未指定(空白)の時は、元データのX軸方向の幅ちょうどになります。 ・「X軸」と「Y軸」の目盛値(「 」To「 」Step「 」)は、元データと上記延長割合  から自動で算出されますが、任意に指定することも出来ます。 ・「OK」ボタンのクリックで、別ブックにグラフが表示され、画面はメインメニューに  戻ります。 ・そのままでは確認できないので、一旦メインメニューの「非表示」をクリックします。  (「非表示」によって、分析結果を保持したまま、手作業でブック切り替えができます。)  ブックを切り替えてグラフを確認します。  最初に作られたグラフは「貢献度」が一番大きいXを横軸としたグラフです。 ・X軸を他のXとしたグラフを描くには再度「メインメニュー」「グラフ」とします。  分析結果が保持されている間は何度でも「グラフ」を描くことが出来ます。 ・二つ目以降のグラフは、一つ目と同じブックへ、シートを追加して描かれます。 ・グラフへの、回帰式表示と元データ表示は、Xが一つの単回帰の時のみ可能です。 ★【非表示】 ・「重回帰予測」の分析結果を保持したまま「メインメニュー」を非表示にするボタンです。 ・再度「メインメニュー」を表示すると前回と同じデータ(分析結果)で「グラフ」表示出来ます。 ・「メインメニュー」の「終了」又は「×」ボタンをクリックすると保持していた分析結果は  破棄されます。 ★【サンプルデータ】 ・本ソフトの操作練習に使うサンプルデータを作成するメニューです。 ・独立変数Xの数は1から52までが指定できます。 ・データ数は上記Xの数+2以上の値が指定できます。 ・データの振れ幅は、重回帰モデルの当てはまり具合に影響します。  0%とすると重回帰係数R=1となるデータになります。ただし、指定はできません。  100%は、Y軸方向の値を中くらいの幅で上下にバラつかせたデータを作成します。  %が小さいほど当てはまりが良く、大きいほどバラついたデータになります。 ・サンプルデータの作成先として新規シートと新規ブックが指定できます。  「新規シート」の時はアクティブブックに新規シートが追加されます。  「新規ブック」の時は常に新規ブックが作成されそのSheet1に作成されます。 **************************************************************************** ●分析結果の見方 **************************************************************************** ★相関行列  独立変数X単独ではどの変数がより従属変数Yと相関があるのか(貢献度が高そうか)、  また、独立変数Xどうしで相関が高いものが無いかを確認するための表です。  Xどうしは相関0が理想ですが現実にはまずありません。Xどうしで相関が高いと多重共線性の  問題が出てきます。VIFで5又は10以上の時はその警告としてセルに黄又は赤色が付きます。  色が付かなくても、変数X間で単相関係数が大きい場合は、一方を除外するとか、両変数を  演算して一つにまとめるとかの工夫が必要な場合があります。 ★回帰係数と検定値t ・標準回帰係数(貢献度)  独立変数Xが重回帰モデルの中でどのくらい従属変数Yの説明に貢献しているかの指標です。  絶対値が大きいほど貢献度大です。  負数は従属変数Yの値を減らす方向に貢献(影響)していることになります。 ・平均値Axi  独立変数Xの単純平均値で、「推定値」の計算式の中で使っている値です。  (推定値計算は内部で自動で行ないますので特に気にしなくても良いです。   提示の計算式と値で計算しています、という事の確認の表示です。) ・回帰係数Byi  独立変数Xが1単位変化した時に従属変数Yがどの位変化するかという係数です。  (これを、単位の大きさに影響されないように標準化したのが上記の標準回帰係数です。) ・検定値t  独立変数Xの有意性(ある確率で存在が有意か)を検定する為の値です。  絶対値が、基準となる確率のt値(t0)よりも大であれば、その確率で有意であるとなります。  例えば検定値t=2.42で、99%t0=2.62, 95%t0=1.98 であれば、99%には届かないが95%では  有意である、となります。  一覧表には、どの程度の確率で有意なのかが一目でわかるように、** や * の印が付けられます。  t検定では95%以上の確率(過誤の確率5%未満)を採用するのが一般的ですが、  絶対そうしなければならないという決まりはありません。ケースバイケースで判断します。 ★重相関係数と検定値F ・重相関係数  重回帰モデル全体の当てはまり具合の指標です。(通常Rと表示します。)  単回帰でいえば元データがどれだけ一直線上に並んでいるかという目安です。 ・R2  重相関係数の二乗で、決定係数ともいい、実際には当てはまり具合の評価はこの値又は  次の補正R2を使用するのが一般的です。 ・補正R2  独立変数Xの数を増やすと、例えそのXがあまりYの説明に寄与していなくても、追加した  というただそれだけで計算上は重相関係数が上がってしまいます。  そのため、自由度を考慮してR2を補正した値が、補正R2です。  自由度調整済み(又は補正済み)決定係数ともいいます。  本ソフトでは、重回帰モデル全体の当てはまり具合の指標としては補正R2を使用しています。  補正R2 = 1 - (1 - R^2) * (Dn - 1)/(Dn - P - 1)   R:重相関係数 Dn:データ数 P:独立変数Xの数 ・検定値F  重回帰モデル全体の有意性(ある確率で存在が有意か)を検定する為の値です。  値が、基準となる確率のF値(F0)よりも大であれば、その確率で有意であるとなります。  検定値tが独立変数Xの有意性の検定値であるのに対し、F値は重回帰モデル全体に対する  有意性の検定値というわけです。  例えば検定値F=32.9で、99.99%F0=6.59 ならば、99.99%以上の確率で有意であるとなります。 ★推定値  推定計算に必要な、その他の値と、計算式を表示しています。  但し、手計算が必要なわけではなく、提示の計算式と値で計算しています、  という事の確認の表示です。 ・Ve  不偏誤差分散(偏りの無い誤差分散の推定値)。残差分散と表示するソフトもあります。 ・t(n-p-1,??%)  区間推定の計算に使用するtの値です。??は指定したパーセンテージです。  (一般的には95%は0.05、99%は0.01と表示されています。) ・計算式  推定値はまず点推定値(単回帰の回帰線に相当する)が計算されます。  そして、区間(信頼区間または予測区間)の幅の単位(の二乗)σ2が計算され、  区間の上下限値は、点推定値±t×ルートσ2 となります。  (これらは、以上で表示された値と計算式を使えば、新たなXに対するYとその区間推定値   が計算できます、という確認の表示です。) ★標準残差グラフ  元データの各点が、平均(単回帰の回帰線相当)からどの程度離れているかの目安です。  区間の上下限の線も表示していますので、極端に離れた値(異常値)の発見に有効です。  また、Y方向だけですがデータのばらつき具合の確認に役立ちます。  単回帰(独立変数Xの数1つ)であれば、予測区間95%の幅でデータ値と共にグラフ化  するなどして、異常値の確認や、データのばらつき具合を見ることは容易ですが、  Xの数>=2ではそのようなグラフ表示は出来ません。  標準残差グラフは、独立変数Xの数に関係なく表示できます。 ★推定計算結果  「推定」で「X範囲」の入力を行なうと推定計算結果が出力(表示)されます。  「推定幅」で指定した幅(95%など)で「信頼区間」又は「予測区間」の推定値も  計算されます。  出力は指定したX(いわゆる新たなX)、その点推定値(回帰線相当)、推定値上下限です。  例えば推定幅95%の場合、  「予測区間」では、次回に新たなXのデータをひとつ取得した時【真のY値】は  95%の確率で推定幅の上限から下限の間に入ります。  一方「信頼区間」では、次回新たなXデータを複数取得した時【真のY値の平均値】  (回帰線相当)が95%の確率で推定幅の上下限の間に入ります。  すべてのXのt検定値が95%以上有意でなければ、グラフ表示は出来ませんが、この推定計算  は、分析結果がどんな場合でも可能です。  (分析結果から、推定値が使用に耐え得るものであるかどうかはご自身の責任で判断して   ください。一般的には変数の有意性は95%以上が必要であると考えられます。) **************************************************************************** ●よくある質問 **************************************************************************** ★CSVファイルのデータを使うには  一旦Excelでブックとして開いてから使ってください。 ★Excel2003以前では使えないのでしょうか  申し訳ありませんが使えません。  リボンとグラフで使用している機能が以前のバージョンにはありませんので。 ★F99.99=??とは何ですか  F値の有意確率99.99%の値(比較基準値)です。  F値がこの値より大であれば99.99%の確率で有意であると判断します。 ★F値とは何ですか  重回帰モデル全体の有意性の検定値です。  F値が基準値より大であればその基準値の確率で有意であると判断します。 ★OKボタンが淡色で押せません  「変数自動選択」や「重回帰予測」などのフォームの「OK」ボタンは  入力値が適切でないと淡色表示となり押せません。  セルの選択範囲など、入力が適切か確認してください。 ★t99=??とは何ですか  t値の有意確率99%の値(比較基準値)です。  t値がこの値より大であれば99%の確率で有意であると判断します。 ★t値とは何ですか  独立変数Xの有意性の検定値です。  t値が基準値より大であればその基準値の確率で有意であると判断します。  有意とはそのXを重回帰モデルに取り込む意味があるという事です。  (但し、あくまでも単に計算上でです、理論的な解釈は別途必要な場合があります。) ★t分布とは何ですか  ざっくり言うと母集団が正規分布である時、少数のサンプルを抜き出して  得られる新たな分布です。  少数(有限個数)のサンプルで検定を行なう時などに使用します。  サンプル数(正確には自由度)によって分布の形(山なり具合)が変わります。  サンプル数が無限大になるとt分布は正規分布と同じになります。 ★VIFとは何ですか  多重共線性の指標です。一般的に10以上になると可能性濃厚とされます。  多重共線性とは独立変数X間での相関が高過ぎることを言い、その場合正しい  重回帰分析が出来ません。 ★アクティブセル領域とは何ですか  Excelワークシートで空白行と空白列で囲まれた範囲を言います。  Excelではデータ範囲の選択として、一セルのみの時に範囲をアクティブセル領域  に自動で拡大するという手法が良く使われます。 ★アドインの素.xlaはシェアウエアではないですか  そうですが、別のアドインに組み込むという形でフリーウエアの一部として  機能させることが出来ます。なので本ソフトでは【フリー】です。 ★異常値、外れ値とは何ですか  分析データ取得時に何らかの原因で集団からとび抜けたデータが得られる  場合があり、そのデータの事を言います。  単回帰(Xの数=1)であれば予測区間とデータ点をグラフ化すれば異常値は  比較的簡単に確認できますが、重回帰の場合はそういうグラフ化は出来ません。  本ソフトでは重回帰でも、標準残差グラフによって容易に異常値を確認する  ことができます。 ★上書きしてもよいかという警告が出ます、はいを押しても大丈夫でしょうか  重回帰予測の出力オプションで選択したセルが空セルでない場合に上書き  確認として表示されます。  これは、書き込み先が元データにかぶってしまったりしないように注意を  促しているものです。  間違いなく指定セル及びそれ以下のセルに上書きして良いのであれば  「はい」を押してください。 ★エラー表示への対処方法を教えてください ◆Yデータに数値以外が含まれています。 ◆Xデータに数値以外が含まれています。  入力元のセル範囲に数値以外が含まれています。  指定範囲が余分な空白列まで含んでいるか、項目名が先頭行にあるのに「ラベル」  にチェックが入っていないためです。  セル範囲の再確認、「ラベル」チェックの要否を確認してください。 ◆入力元範囲のYとXの行数が違います。  他方の入力値が残っている状態でもう一方で行数が違う範囲を選択すると表示されます。  そのまま他方の範囲選択を続行して構いません。  YとXで、行数が違うままだと「OK」は押せません。 ◆データ行数が足りません、独立変数Xの数+2以上必要です。 ◆データ数は変数Xの数 +2以上必要です。  メッセージ通りです。選択データ行数を増やしてください。 ◆多重共線性の可能性があります。続けますか?  VIFが5以上の時に表示されます。  一般的には10以上では可能性濃厚ですが、5以上でも可能性は大です。  一旦「重回帰予測」を実行して「相関行列」を表示し、独立変数X間で相関係数の  大きなものを確認し、一方を除外するまたは双方を演算して一つの変数にするなど  してみてください。 ◆独立変数の数は 1 から 52 までです。  選択したXの範囲が52列を超えています。52以内に選択し直してください。 ◆xxxは、対数指定では計算出来ません。 ◆対数扱いの変数X??には 0以下の値は指定出来ません。  0以下の数を含む変数は対数指定出来ません。  0以下のデータを削除するか、対数指定をやめてください。 ◆逆行列が計算出来ません。 ◆重相関係数が計算出来ません。  独立変数X間の相関係数が1に極めて近い時に表示されます。  完全に多重共線性があると言えますので、データを見直してください。 ★回帰線のX軸方向延長割合とは何ですか  グラフのX軸とした独立変数Xの最小値から最大値までの幅を100%として、  「延長割合」未指定または0%の時はその幅100%の範囲で回帰線と推定区間の  線(上下限線)が描かれます。  その線をX軸方向に、その前後何%延長するかの指定です。 ★t値(やF値)の基準値との比較は「より大(>)」ですかそれとも「以上(>=)」ですか  有意と判定する境が、t値>t基準値、なのか、t値>=t基準値、なのかということなの  ですが、結論的にはどちらでも同じということになるそうです。  実際にt値を計算した結果がt分布表の指定確率の値とぴったり一致することはまず  あり得ません。  因みにネットの情報によると、欧米では>=、日本では>が良く使われているそうです。  本ソフトでも > を使用していますが、文章の表現上では以上としている部分もあります。 ★グラフ表示にある固定値Xとは何ですか  例えばXが2つの場合を考えます。この場合はY,X1,X2という3次元グラフで全体を表せます。  推定値としては回帰線ではなく回帰平面になります。そしてグラフを立方体でイメージ  して、辺X2のある個所でその立方体を切断したとイメージしてください。  その切断面の2次元グラフが本ソフトで描かれるグラフで、切断個所のX2の値が固定値X  となります。  Xの数が3つ以上の場合もこの考え方の延長線上にあります(イメージするのは困難ですが)。 ★グラフで固定値Xを指定したものなど実用的には意味がないのではありませんか  量的データ(1.23, 567 など数値で表されるもの)だけでは確かにあまり実用的ではない  かもしれませんが、質的データ(男女の別、関東と関西など)を0と1に置き換えて使用  するような場合であれば、関東男性のグラフ、関西女性のグラフなどのように表示でき  ある程度実用性が見込めるのではないかと思われます。 ★グラフの回帰線のX軸方向延長割合はどの程度を指定するのが良いのでしょうか  特に基準はありませんが概ね10%から20%程度がよろしいかと思われます。  回帰線はどこまで延長しても直線のままですが、推定区間(信頼区間または予測区間)  の幅は、元データ(の平均値)から離れるほど広くなり推定の精度が落ちてきます。  ですので100%とか200%などあまり大きな値を指定しても意味がありません。 ★グラフの確認のためになぜ一々非表示ボタンを押さなければならないのですか  グラフを描くためには「重回帰予測」で計算(分析)した結果が残っている必要があります。  その、結果が残っている状態を保持したままメインフォームを閉じるためです。  単回帰以外では通常、固定値Xを複数指定していくつのもグラフを描くことになりますので  一つのグラフを描くたびに「重回帰予測」を実行するという手間を省く仕様です。 ★グラフはなぜ別ブックに作成されるのですか  元データ、選択されたデータ(複数)、選択過程(複数)、分析結果(複数)、グラフ(複数)  という各種データが一つのブック内に混在すると分かりにくいと考えたからです。  一回の操作(一回の試行)で全てが完結するのであれば、むしろ一つのブックにまとまって  いた方が良いかもしれませんが、通常分析というものは試行錯誤するものですから。 ★グラフ表示で「回帰式表示」と「元データ表示」が淡色で選択できません  回帰式と元データのグラフへの表示は単回帰の時のみ有効です。 ★グラフ表示で入力した目盛値が勝手に変わってしまいます  X軸を選択し直したり、対数のチェックを入れたり、回帰線のX軸方向延長割合を変更したり  すると、自動的に目盛値が最適な範囲に設定し直される仕様です。  目盛値を任意に指定する時は、これらを設定した後、最後に指定してください。 ★グラフ表示はなぜ95%以上有意な時だけなのですか  統計学では一般的に5%未満(又は以下)を小さな確率であるとして、帰無仮説を棄却する  基準にします。(場合によっては1%や0.1%、0.01%などもあり得ます。)  なぜ5%かといえば、人の感覚として普通、20回に1回しか起こらないような確率であれば  低い確率だと考えられるからです。  ですから本ソフトも基本的には5%(本ソフトでは反対から見た95%)を基準にしています。  最終的な結果表示とも言えるグラフで、例えば90%以上有意で描いてもあまり説得力の無い  グラフになると考え、95%以上という仕様としました。 ★貢献度とは何ですか  重回帰モデルの中で独立変数Xが、従属変数Yの決定にどの程度寄与しているかという指標です。  寄与率と表現しているソフトや文献もあります。 ★個々のボタンなどの機能説明はどこにありますか  ボタンまたはその項目名ラベル上などにマウスカーソルを当てれば表示されます。 ★残差とは何ですか ★残差分散とは何ですか ★誤差分散とは何ですか  観測値(分析元データ)と推定値(回帰線)の差が残差です。  推定値はあくまで推定であり真の平均(回帰線)ではありませんが、観測値と真の平均  との差を誤差といいます。  残差のバラツキが残差分散です。  誤差のバラツキを誤差分散といい、本来は誤差分散を使えば区間推定を行なえるのですが、  その肝心の誤差分散は、真の平均が分からないため使えません。  そこで、代わりに残差分散を、偏りの無い誤差分散の推定値という意味で不偏誤差分散として  使用します。  つまり、「不偏誤差分散」=「残差分散」です。  残差分散という言い方は、そのデータを得る過程に於ける事実そのものを意味し、  不偏誤差分散という言い方は、その値は推定に使用するものであるという意味合いを込めた  言い方であるという事が出来ます。 ★残差グラフは何のために作成するのですか  異常値(外れ値)の発見、データのバラツキの確認(但しY方向のみ)に使用します。  単回帰であれば、データ値と共にグラフ表示すればこれらは確認できますが、重回帰の場合  できません。残差グラフは重回帰でも表示できます。  データのバラツキをX方向も含めて確認したいときは、各X値を横軸にして縦軸に標準残差  とした複数のグラフが必要になりますが、本ソフトではそこまではしていません。 ★サンプルデータの振れ幅とは何ですか  サンプルデータは独立変数Xの値と係数を乱数で発生させ、従属変数YをXと係数から計算して  います。しかしそれだけでは重相関係数1のデータとなってしまいサンプルデータとしての  意味がありません。  そこで、Y値は適当に上下にバラつかせるようにしています。その幅が振れ幅です。  振れ幅0%なら振れ無しなので重相関係数=1となります。(但し0%は指定できません。)  100%は中くらいのバラツキ、大きくなるとバラついた当てはまりの悪いデータになります。 ★サンプルデータを作ろうとしましたが無反応で終わってしまいました  サンプルデータは独立変数Xの数、データ数(サンプル数)、振れ幅を入力しますが  不正な入力がされると、そこで終了する仕様です。  練習時に必要なだけの機能なので簡単な作りになっています、ご了承ください。 ★重回帰モデルとは何ですか  例えば独立変数Xの候補がX1,X2,…,X10とあったとします。  すると例えば変数選択の過程で、X1,X7,X9が選ばれて、Y=a+b1*X1+b2*X7+b3*X9 という数式  を当てはめて計算されたりします。  このような数式一つ一つが重回帰モデルです。  実際には最終的に選択された数式、或は選択過程の主だった数式のみをさす場合が多いです。 ★自由度とは何ですか  統計の専門家ではないのでうまく説明できません。ネット情報か専門書を参照してください。  聞きかじった知識では、ある数値を算出する過程で使用した平均値の数をサンプル数から  引いた値と覚えておけばほぼ間違いないとの事です。 ★信頼区間と予測区間の違いは何ですか  「◆【信頼区間と予測区間】の意味について」を参照してください。 ★推定、信頼、予測の言葉の違いを説明してください  本ソフトでは、重回帰モデルにてY値とその信頼または予測区間を計算する事を推定と表現します。  推定値の計算式とそれに使用する値は「重回帰予測」にて出力されます。  平均値(回帰線)の区間推定を信頼区間、個々のデータ値の区間推定を予測区間と表現します。 ★推定幅とは何ですか  重回帰式によって独立変数Xに対する従属変数Yの推定値は計算できますが、それはあくまで推定値  であり真の値ではありません。真の値はそれより大きいかもしれませんし小さいかもしれません。  その真の値が、例えば95%の確率でこの範囲にあるという場合、この95%を推定幅と呼んでいます。 ★推定幅は95%が一般的ですか  特に決まりはありませんが95%ぐらいが一般的だと思います。  例えば推定幅を99%にすれば推定の精度は上がり(間違える確率が1%になりますから)一見良さそう  に思えますが、%を大きくすると幅の上下の値も上下に大きく広がり、実用的ではなくなります。  例えば、95%なら推定値10±1であったものが、99%だと推定値10±5とかになるような感じです。  逆に90%や80%にすれば、±の幅は小さくなりますが、その信頼性は落ちます。(間違い確率10%,20%) ★説明書内をキーワードで検索できますか  特別な機能は付いていませんので標準的な検索機能(Ctrl+Fなど)を使用してください。 ★多重共線性とは何ですか  独立変数X間で強い相関関係があると、解析不能(逆行列が求まらない)であったり、たとえ結果  が求まったとしてもその信頼性が低くなります。このような場合に多重共線性があると言います。 ★他のソフトと計算結果が違うみたいですが ★単回帰なのですがデータはX,Yの順でもできますか  X,Yの順でも出来ます。  ただしその場合は、YとXを別々に選択する必要があります。  本ソフトではY,X1,X2...という順で並んでいるデータであれば一度に選択することができます。  その為、単回帰では並び順に注意しないとXとYを間違って指定してしまうことがあり得ますので  注意してください。  (勿論重回帰でも指定間違いはあり得ますが、重回帰では計算結果が大きく異なるため間違いに   気づきやすいです。単回帰では気づきにくいので注意が必要です。) ★単回帰のグラフに表示される数式は分析結果で表示される数式と違うみたいですが  単回帰グラフ内の数式は、手計算でも簡単に利用できるように数式を変形して表示しています。  内容は分析結果で表示されている数式と同じです。 ★データに文字列が含まれているとエラーになりました  入力元のセル範囲に数値以外が含まれています。  指定範囲が余分な空白列まで含んでいるか、項目名が先頭行にあるのに「ラベル」  にチェックが入っていないためです。  セル範囲の再確認、「ラベル」チェックの要否を確認してください。 ★データ範囲としてアクティブシート以外を指定できますか  はい、出来ます。  「選択」ボタン、セル選択ダイアログで、シート又はブックを切り替えて選択してください。 ★データ範囲の効率的な選択方法を教えてください  データがY,X1,X2…と並んでいると範囲を一括選択できます。  その場合は、Y範囲の選択で一括選択すればX範囲も一度に設定されます。  データ範囲の周りが空白行列になっていると、アクティブセル領域として選択できます。  アクティブセル領域として選択するには「単一セル」を選択します。自動で範囲拡張されます。  一括で選択する時もY,Xを別々に選択する時も、列全体を選択してもかまいません。  上下の空セルは自動的に選択範囲から除外されます。  新しく範囲選択する時は一旦テキストボックスをダブルクリックでクリアしてから「選択」します。  前の入力値が残っている時は「選択」によってまず前の入力範囲が選択状態になります。 ★データ範囲の指定を直接キーボードから入力できますか  できますがあまりお勧めはできません。  もし、データ行数が多いからという事でしたら列全体を選択しても構いません。上下の空セルは  自動で除外されます。 ★なぜ95%という数字がよく使われるのでしょうか  統計学では一般的に5%未満(又は以下)を小さな確率であるとして、帰無仮説を棄却する  基準にします。(場合によっては1%や0.1%、0.01%などもあり得ます。)  なぜ5%かといえば、人の感覚として普通、20回に1回しか起こらないような確率であれば  低い確率だと考えられるからです。  ですから本ソフトも基本的には5%(本ソフトでは反対から見た95%)を基準にしています。 ★任意のX(新たなX)に対する推定値はどうやったら得られますか  任意のXは元データとは別のセルに記入しておいてください。  項目名はあってもなくても構いませんがXの順番と列数は元データと同じである必要があります。  そして、「重回帰予測」で「推定」の「X範囲」を指定すれば、推定値が出力されます。  (「信頼区間」か「予測区間」の選択、「推定幅」の指定もしてください。) ★変数自動選択とは何ですか  独立変数Xの候補の中から従属変数Yを推定するのに最もふさわしいXを自動で選択する機能です。 ★変数選択基準とは何ですか  重回帰モデルに変数Xを取り込む又は除外する基準です。  基本的には指定した%以上の有意性が認められるXが選択されます。 ★変数自動選択の実行は必ず必要ですか  既に全ての独立変数Xが95%以上有意と分かっていれば実行の必要はありません。  変数自動選択は、そのようなデータに絞り込むための機能ですから。 ★変数自動選択結果の見方を教えてください  選択結果はフォーム上のテキストボックスに表示されます。  表示は、変数名・t値・有意確率判定の印で、「X6 t = 3.413 **」のような感じです。  ** は >99%、* は >95%、+ は >90%、無印はそれ以下です。  +または無印の変数が選択されたら変数選択基準の%を上げて再度「OK」してください。  そして、*または**の変数だけが選択されるようにしてください。  F値はF99.99の値より大であること、補正R2が適度に大きいこと(0.4096以上)を確認します。  例え変数が選択されて、**や*が付いていても、上記の基準を満たさない場合は分析結果は  NGである(Yの推定に使用するには難がある)と考えられます。(一般論ですが。) ★変数名に変な数字が表示されます  元データに項目名(変数名)が無いのに「ラベル」にチェック入れたため、データの一行目  が変数名として扱われてしまい、そのような表示になったと思われます。  「ラベル」のチェックを外して再度実行してください。 ★補正R2とは何ですか  重相関係数Rの二乗を決定係数R2といいます。  独立変数Xの数を増やすと、例えそのXがあまりYの決定に寄与していなくても、追加した  というただそれだけで計算上は決定係数R2が上がってしまいます。  そのため、自由度を考慮してR2を補正した値が、補正R2です。  自由度調整済み(又は補正済み)決定係数ともいいます。  本ソフトでは、重回帰モデル全体の当てはまり具合の指標としては補正R2を使用しています。 ★補正R2の計算はどうやるのですか  補正R2 = 1 - (1 - R^2) * (Dn - 1)/(Dn - P - 1)   R:重相関係数 Dn:データ数 P:独立変数Xの数 ★元データには一行目に項目名が必須ですか  必須ではありません。  項目名が無い(一行目からデータである)場合は「ラベル」のチェックを外してください。  項目名が無い時、変数名には順に「X1」「X2」…という名前が付けられます。 ★元データの並び方に決まりはありますか  行方向の並びのデータのみ処理できます。  一行目に項目名は有っても無くても構いません。  一列目にY、二列目以降にXという並びですとデータ範囲の選択が楽ですが必須ではありません。  列方向データを処理したい時はExcelの機能「行列を入れ替て貼り付け」でデータを入れ替えてください。 ★元データ入力(入力元範囲の設定)では範囲全体ではなく部分的な選択も出来ますか  出来ますが、分析結果とのつながりが分かりにくくなりますので、お勧めできません。  特別な事情がある時だけにして、且つ「データ名」にその旨を記入するなどして、  元データがどの範囲なのかが分からなくならないようにしてください。 ★元データ入力(入力元範囲の設定)で列全体は選択できますか  出来ます。  列全体を選択すると、上下の空セルは自動で排除されます。 ★有意性の95%と推定幅の95%の関係は何ですか  同じ95%でも両者は関係ありません。  95%(5%)という数字が一般的な基準としてよく使われるというだけの事です。 ★横並びのデータは使えませんか  列方向データを処理したい時はExcelの機能「行列を入れ替て貼り付け」でデータを入れ替えてください。 ★量的変数ではなく質的(カテゴリ別)変数で分析するには  男女別などのような質的変数は、例えば男=>0、女=>1、のようにデータを変換することで  独立変数として使用することが出来ます。 ★過誤の確率5%未満とは何ですか  過誤とはまちがいのことで、例えば独立変数Xの有意性検定であるt検定で、95%t0=1.96、検定値t=1.97  であったとした時、検定値tはぎりぎり95%t0より大ですので95%の確率でそのXは有意であると判定  しますが、逆に言えばその判定は5%はまちがっている可能性があるという事です。  過誤の確率を5%とするか1%とするか或いはもっと小さくするかは、その分析結果をどういう目的で  使うのかなどの諸条件を考慮して決めなければなりませんが、一般的には5%がよく使われます。 ★対数、指数、べき乗回帰分析を行なうには  入力元の設定で「対数」にチェックを入れてください。  Xを対数にすれば対数回帰、Yを対数にすれば指数回帰、共に対数にすればべき乗回帰になります。 **************************************************************************** ●お問い合わせ **************************************************************************** ・ご意見、ご感想、ご要望などは電子メールにて承ります。 ・★必ずOSとExcelのバージョンもお知らせください。 ・返信に多少時間がかかる場合がありますので、予めご了承ください。 ・連絡先   だるま   E-mail:daruma3.vbaアットマークoffice.tnc.ne.jp   (スパムメール対策です↑を「@」に変えてください。) 以上