
統計学上の解析手法である重回帰分析をご存じだろうか。統計と聞いただけで拒否反応を起こすかもしれない。しかし、重回帰分析は戦略立案の場面で非常に有用だ。今回は、重回帰分析の概要をはじめ、目的や手順、メリット・デメリットなどをわかりやすく説明する。
目次

回帰分析とは
多くの企業では、事業にデータ分析を取り込みさまざまな指針を決定している。ただしひとくちにデータ分析といっても手法はさまざまだ。そのなかでも重要なデータ分析のひとつが回帰分析である。データは、多くの場合数値などの値として把握されることが多い。
回帰分析は「影響を受ける数値」「影響を与える数値」の2つの関係性に注目する分析方法である。具体的には、結果を示す数値である「目的変数」と要因になる数値である「説明変数」の関係を明らかにしていく。
例えば来店者数がどのように売上高に影響を与えているのかを分析したい場合、回帰分析では売上高が「目的変数」、来店者数が「説明変数」となる。回帰分析が多くの企業で取り入れられている理由は、数値で示すことができる根拠のある推論を立てることができるからである。
根拠のある推論が立てられるため、より具体的に将来を予測したり目標や計画を立てたりすることが可能だ。ただしあくまで推論のため、要因になる「説明変数」の見落としや間違いがあった場合は、正しい結果が出ない可能性もある。なお回帰分析は、説明変数の数の違いなどで大別すると「単回帰分析」と「重回帰分析」の2つだ。
両者では、検証する内容や結果が異なるため、どちらの手法を使って回帰分析をするのかが重要となる。
重回帰分析とは
そもそも回帰分析とは、結果を示す数値(目的変数)と要因になる数値(説明変数)の関係を明らかにする統計手法だ。上述したように回帰分析は、説明変数の数の違いなどにより大きく「単回帰分析」と「重回帰分析」の2つに分けられる。ここでは、重回帰分析とは何かについて見ていこう。重回帰分析は、複数の説明変数を含む回帰分析である。

結果と複数の要因の因果関係がわかれば将来を予測できるというわけだ。では、簡単に重回帰分析の具体例を見ていこう。
重回帰分析の具体例
・飲食店
飲食店は、売上高の大小により店舗の経営状態が大きく変わってくるのが特徴だ。そのため飲食店の経営をするうえで重要なのが「売上がいくらになるのか」を予測することである。飲食店では、さまざまな要因が売上の結果に影響を与える。具体的な要因としては、店舗の面積やスタッフ数、メニュー内容、駅からの距離、駐車場の有無などが挙げられるだろう。
重回帰分析では、店舗の面積やスタッフ数、メニュー内容、駅からの距離、駐車場の有無などの要因が「説明変数」、売上高が「目的変数」となる。重回帰分析を活用すれば、新規店の各要因から将来の売上の予測が可能だ。
・アパート経営
アパート経営では、家賃収入が売上となるため「家賃をいくらにすればよいか」が重要だ。なぜなら家賃の金額が適正でないと空室リスクを負うからである。家賃の金額が決まる要因は、駅に近いかどうかや部屋の広さ、設備の充実度合い、築年数などさまざまだ。重回帰分析では、駅に近いかどうかや部屋の広さや設備、築年数などの要因が「説明変数」、家賃の金額が「目的変数」となる。
重回帰分析と単回帰分析との違い
単回帰分析とは、ひとつの要因から結果を分析・予測する統計的手法だ。例えば、広告費と売上の相関関係を求める際に用いる。「広告費を#### #### 円にしたら売上が△△円になった」というような実績データを集め、回帰係数を探す。そしてグラフにして「y=ax+b」といった回帰式を求める。

「y」は目的変数、「x」は説明変数、「a」を回帰係数という。広告費が説明変数、売上が目的変数とするなら、この式のxにいくつか数字を当てはめることで、広告費に対する売上がわかる。ただし実際のビジネスでは、売上を決める要素は1つではない。飲食店なら立地や駅からの距離、価格帯、天気などの要素が売上に影響する。
そのため、2つ以上の要素を用いる重回帰分析のほうが、予測精度を高めるのに適切だろう。基本的な構造は変わらないが、重回帰分析は単回帰分析より説明変数が増えるので、式がその分長くなる。重回帰分析の式は「y=a_1 x_1+a_2 x_2+a_3 x_3+a_4 x_4…a_p x_p+b_0」だ。分析の流れは、単回帰分析も重回帰分析もほぼ同じである。
重回帰分析をするためには、上記の式で計算したり専用のソフトやExcelを使ったりして求める必要がある。またある程度の理解度がないと結果の解釈やそこから導く予想ができないケースもあるため、注意が必要だ。
重回帰分析以外の主な多変量解析
重回帰分析以外にも、多変量解析にはさまざまな種類がある。ここでは、主な手法を分析の目的別にまとめた。

それぞれの手法について簡単に紹介していく。
数量化Ⅰ類
複数の説明変数(カテゴリーデータ)から目的変数を量的変数として予測する分析手法で、重回帰分析と似ている。両者の違いは、重回帰分析は説明変数が数量データ(量的変数)だが、数量化Ⅰ類は、説明変数がカテゴリーデータ(質的変数)である点だ。
数量化Ⅰ類は「説明変数の各カテゴリーが目的変数にどのように影響しているか」について両方の変数から関係式を導き出して明らかにする。例えば性別や飲酒・喫煙の有無などから特定の疾病に罹患する確率を予測するといった手法だ。
判別分析
数量化Ⅰ類とは逆で複数の量的変数から質的変数を予測する手法だ。最終的には、1か0かの判別を行う。例えば自社オンラインショップのアクセスログに残る訪問者の性別・年齢・来訪回数などから商品を購入する可能性の高い見込み客を抽出する場合は、判別分析が適している。
ロジスティック回帰分析
予測に使用される多変量解析のひとつ。「量的変数から質的変数を予測する」という点では、判別分析と似ている。ロジスティック回帰分析の大きな特徴は、目的変数が1となる確率を予測する点だ。目的変数は、2値の結果が起こる確率を示す。
※2値:試験の合格・不合格や、見込み客の契約・非契約など答えが2つしかない値のこと
数量化Ⅱ類
判別分析と同じように1か0かのグループ分けをする手法だが、説明変数も目的変数も質的変数になる点が違う。性別や飲酒・喫煙の有無から特定の疾病に罹患する・しないの予測をする場合などに用いられる。
以降は、要約に用いられる多変量解析である。
主成分分析
主成分分析は、複数の量的変数を説明変数として集約し、主成分を作成する分析手法だ。例えば顧客満足度の調査を行う際、商品の品質・価格・デザイン・接客サービスなどの各項目の満足度を調査して集約することで商品の顧客満足度を算出できる。この分析を行う過程で「どの項目が最も顧客満足度向上に影響しているか」についても確認することが可能だ。
因子分析
複数の説明変数に影響を与えている共通因子を探り出すための分析手法だ。例えば購入者のアンケート結果を分析して「なぜ商品を購入したのか」という隠れた気持ち・潜在的な意思などを探り出すのに用いられる。
クラスター分析
ある集団のなかから似たものを集約してクラスターを作成し対象を分類する手法。ブランドの分類や消費者のセグメンテーションなどに利用される。
数量化Ⅲ類
主成分分析と似ている分析方法で、複数の説明変数(質的変数)から少数の変数へと要約する。乱した少数の変数は「潜在変数」と呼ぶ。顧客アンケートから、自社ブランドのポジショニングを分類する場合などに用いられる。
コレスポンデンス分析
数量化Ⅲ類では複数の説明変数に質的変数を用いたが、コレスポンデンス分析では量的な説明変数から少数の変数へと要約する。クロス票の集計結果をわかりやすくグラフ化するには、コレスポンデンス分析を用いるとよい。
重回帰分析の目的2つ
重回帰分析の目的は主に2つにある。
目的1.影響の大きい要因を特定する
要因分析とは、複数ある変数から目的変数に関連する重要な変数を調べる手法だ。影響の大きい要因を明らかにすれば、改善の優先順位を決定しやすくなる。
目的2. 未来の値を予測する
予測分析とは、要因分析をもとに重回帰式を求めて未来の値を予測する手法だ。重回帰式に値を入れると、予測分析の結果が得られる。予測の精度を高めるには、すべての変数を盛り込むのではなく、複数の変数から影響の大きい変数を選ぶことが重要だ。
重回帰分析のやり方
これから飲食店を新しく出店するとして、新規店の売上を予測したいとする。このケースを想定しながら、重回帰分析のやり方を考えてみよう。
ステップ1.成果を左右する要因を考える
店舗の売上高に影響しそうな要因(説明変数)を考える。売上高を増やすのに重要で、既存店のデータを活用できる要素を抽出する。飲食店の事例で要因を挙げるとすれば下記の通りだ。
- 商圏人口
- 競合店舗数
- 店舗面積
- 最寄駅からの距離
- 座席数
- 従業員数
- メニュー数
- 客単価
- 利益率
- 広告費
- クレーム数
ステップ2.重回帰式を求める意義を検討する
説明変数と目的変数の点グラフを描いて検討する。仮に目的変数を1ヵ月の売上額、説明変数を既存店舗の店舗面積、最寄駅からの距離だとしよう。グラフにした点に過度なバラツキがなく、相関関係が認められるなら重回帰式を求める意義がある。例えば、「店舗の面積が広いほど1か月の売上額が大きい」「最寄駅から近いほど売上額が大きい」などの相関関係だ。
ステップ3.重回帰式を求める
重回帰式を求めるときは、最小二乗法を使って複数の回帰係数(a_1 、a_2など)を計算するが、かなり面倒だ。そこで、分析用のソフトウェアを使う方法もある。例えば、無料の「統計分析フリーソフトR」、有料の「JMP」「SPSS」などだ。候補となる説明変数を加えたり減らしたりしながら、データの精度を高めるために最適な組み合わせを探る。
なお、説明変数は多すぎても少なすぎても良い分析結果が得られないので、注意したい。
ステップ4.重回帰式の精度を確認する
重回帰式を求めても精度が低ければ、正しく予測できない。精度を確認するときは「重相関係数」と「寄与率」を求める。重相関係数とは、回帰式の精度(グラフの点と回帰式の一致率)を表す指標だ。実際には、実測値と予測値の相関関係を見ていく。そして、重相関係数を二乗した値が寄与率(決定係数)だ。寄与率が取りうる値は0から1までとなる。
回帰式の精度が高いほど1に近づき、そうでないほど0に近くなる。精度の目安としては0.5以上と見ておくとよい。なお重回帰分析では、寄与率に関して注意すべきことがある。説明変数の数が多いと、説明変数の影響度に関係なく、値が1に近くなってしまうのだ。そのため重回帰分析では、自由度調整済み寄与率を求めて判定することが多い。
さらに、重回帰式のそれぞれの回帰係数が適切かどうか、統計に用いたデータが客観的に見て信頼できるかどうかを確認する。
ステップ5.結果を予測する
最後に新規店舗の売上予測を行う。信頼できる重回帰式に新規店舗の店舗面積、最寄駅からの距離などの数字を当てはめ、売上の結果を確認する。
重回帰分析を活用できる場面2つ
重回帰分析は要因と結果を定式化できるので、出店や販売の効果を測定しやすい。そのため、売上予測やプロモーション戦略策定といったマーケティングの現場でも用いられる。
活用場面1.マーケティング
重回帰分析は、店舗の売上を予測する際に用いられる。予測に用いる要素には、接客や品揃えなども選ばれる。ただし、接客や品揃えといった要素は数値化しにくい。こういった要素は調査でスコアリングを行うことが一般的だ。
活用場面2.営業予測
重回帰分析を用いると、数値的な根拠にもとづいて営業予測を立てられる。例えば、営業訪問回数や値引き率などの要素で戦略を数値化し、取引額を目的変数に設定すれば、戦略が変化した場合の結果について予測できる。
重回帰分析のメリット・デメリット
重回帰分析のメリット・デメリットを確認していく。
重回帰分析のメリット
重回帰分析を経営戦略に用いれば、費用対効果の高いマーケティングを行える。新規商品の販売に関しても、重回帰分析を用いれば将来の予測をある程度立てられる。また、新規出店や広告宣伝の戦略についてプレゼンを行うとき、根拠を提示するためにも重回帰分析は役立つだろう。
重回帰分析のデメリット
重回帰分析では、データに必要な要因を見誤れば予測も間違えてしまう。すでに自社が把握するデータから要因をピックアップすることが多いが、ほかにも有用な要因があるかもしれない。また、重回帰分析は概念や計算が複雑なので、理解しづらい。一から計算するのは実務においてほぼ不可能だろう。
そのため、Excelや無料・有料のソフトを用いて分析する。重回帰分析の強みは、複数の要因から精度の高いシミュレーションを行うことだ。しかし、説明変数同士がお互い強く関連しあうと、「多重共線性」に陥ることがある。多重共線性とは平たくいうと「回帰係数が求められない」「求めた回帰係数があやしい」といった状況だ。
分析要素に不安があると予測も信頼できなくなる。そのため、関連しすぎている説明変数が存在するなら、いずれか一方を省いて分析する工夫が必要となる。
Excelを利用した重回帰分析
重回帰分析を自力で行うことは難しいため、専用のソフトを使って重回帰分析をするほうが良いだろう。しかし専用のソフトを使う場合は、コストの問題も出てくる。実は、簡単な重回帰分析であれば専用のソフトを使わなくてもExcelを利用して行うことができる。ここからは、Excelを利用した重回帰分析の方法を解説していく。Excelを利用した重回帰分析の一般的な手順は、以下のようになる。
1.事前準備
Excelでは、分析に使う数値とExcelを用意すれば簡単な重回帰分析を行うことができる。Excelは、あくまで重回帰分析をするためのツールにすぎない。どのような要因と数値を重回帰分析で使うのかによって検証結果が異なるため、事前にしっかりと検討しておこう。
2.Excelに各データの数値を入力する
分析に使う数値とExcelが用意できたらExcelに各データの数値を入力していく。通常A列に分類を入力し、B列に目的変数、C列以降に説明変数を入力する。例えば店舗ごとの売上高について重回帰分析をする場合、各列には以下のデータを入力していく。
- A列:店舗名(店舗A、店舗Bなど)
- B列:売上高の数値
- C列以降:店舗面積、座席数、客単価などの各説明変数の数値
3.データ分析の選択
Excelに各データの数値の入力が終わったら次はデータ分析だ。Excelのデータ分析は、メニューバーの「データ」タブから「データ分析」を選択する。(Excelのバージョンによっては、メニューバーの「ツール」タブから「データ分析」を選択)「データ分析」を選択するとさまざまな分析名が表示されるのでそのなかから「回帰分析」を選択する。
4.分析範囲(変数)の指定
「データ分析」から「回帰分析」を選択するとYとXの範囲を指定する画面が出てくる。
- 入力Y範囲
目的変数(B列)の範囲を指定。例えばB列の1~15行目に数値が入力されている場合は、1~15行目を指定する。
- 入力X範囲
説明変数(C列以降)の範囲を指定。例えばC列とD列に数値が入力されている場合は、C列とD列の数値が入力されている範囲すべてを指定する。
店舗面積、座席数などの変数の名称をデータ範囲に含めて指定する場合は「ラベル」にチェックを入れる。分析範囲(変数)の指定をし「OK」をクリックすればExcelの別シートに重回帰分析の結果が出力される。
5.分析結果の確認
Excelの別シートに重回帰分析の結果が出力されたら内容を確認しよう。出力された内容は「回帰統計」と「分散分析表」として表示される。
- 回帰統計
簡単にいうと分析の信頼度を表している。例えば回帰統計にある「重相関R」は、1に近いほど信頼度の高い分析モデルであることを意味しているのだ。また「重決定R2」も1に近いほど説明変数の信頼度が高い(説明できる割合が大きい)。
- 分散分析表
簡単にいうと分析の結果を表している。例えば「係数」は、各変数の影響力を表す。係数が大きいほど影響力も大きくなる。「t値」も影響の大きさを表しておりt値が大きければ大きいほど目的変数に与える影響力が大きい。一般的に2を超えるt値は、目的変数に何らかの影響を与えていることを示している。
一方「P値」が表しているのは、指標の関係性だ。一般的にP値が0.05未満のときは、説明変数が目的変数に関係がある可能性が高く逆に0.05以上の場合は、関係がある可能性は低くなる。
このように、Excelを使えば、簡単に重回帰分析ができる。ただし分析結果は、多くの項目と数値で表示されるため、それぞれが何を示しているのかを把握することが必要だ。Excelを使って重回帰分析をする場合でも重回帰分析の知識は必須となるので、注意したい。
重回帰分析で注意したいポイント
重回帰分析は、事業のさまざまな事項について予測や計画を立てることができる。そのためビジネスでとても役立つ分析方法だ。しかし重回帰分析をするうえで注意すべき点も多い。重回帰分析で注意したいポイントには、次のようなものがある。
1.説明変数の数
重回帰分析をするうえで注意すべきポイントのひとつが「説明変数の数」だ。実は、重回帰分析では、使用する説明変数の数が多すぎても少なすぎてもいけない。より正確な分析結果を得ようとつい多くの数の説明変数を用いがちだが、説明変数の数が多いからといってより正確な分析結果が出るわけではないのだ。
説明変数の数が多すぎるとかえって説明変数同士が邪魔をし、正確な分析結果を阻害する可能性がある。また説明変数の数が少なすぎても同様に正確な分析結果が出ない。なぜなら説明変数の数が少なすぎると分析に必要な情報が不足するからである。重回帰分析を適切に行うためにどれぐらいの説明変数の数が必要なのかは、ケースバイケースだ。
ひとつのケースにいくつかのパターンで分析してみるのもよいだろう。
2.お互いに関連性の強い説明変数が含まれている
重回帰分析をより正確に行うためには、説明変数にあまり関連性がないほうがよい。なぜなら説明変数は、同じ目的変数に対する要因のため、どうしても似た内容のものになってしまうことがあるからだ。ただしお互いに関連性の強い説明変数が含まれる場合は、大きなひとつの要素が強く分析結果に影響を与えているのと同じことになる。
傾きのある分析結果となってしまうため、それは正しい結果とはいえない。重回帰分析する場合は、お互いに関連性の強い説明変数は、できるだけ省くようにしよう。
3.目的変数と説明変数の関係が正しくないものになっている
重回帰分析をする際に注意しなければならないのが、「目的変数と説明変数の関係が本当に正しいのか」ということだ。例えば説明変数がほかの説明変数の要素になっていることも多くある。いわば説明変数が2階建てのようになっていたり複雑に絡み合っていたりする状態だ。目的変数に対する直接的な説明変数になっていないため、正しい分析結果が出ない。
またひとつだけ偶発的な特殊な説明変数が混ざっている場合も正しい分析結果がないため、注意が必要だ。
4.目的変数に誤りがある
重回帰分析では、説明変数だけでなく目的変数にも注意が必要である。何を目的変数にしたらよいのかがあやふやな状態で説明変数を集めて重回帰分析をしても当然正しい分析結果は期待できない。また分析する目的変数がほかの目的変数の要因になっていることも多くある。例えば目的変数Aを分析しようとしているが「目的変数Aは目的変数Bの説明変数」といった場合だ。
この場合、本当に分析しなければならないのは、目的変数Bである。いくら目的変数Aを分析しても今後の事業などの予想をする際に意味をなさない結果となってしまうだろう。このように重回帰分析をする際は、目的変数が本当に分析すべき成果なのかどうかをしっかりと検討することが必要だ。
5.信頼性の高いデータを集められるかどうかに注意する
正しく重回帰分析をするためには、信頼性の高いデータ(数値)が必要である。データの精度が低い場合は、正しい分析結果が出ない。なかには、数値化が難しいものもあるかもしれない。しかしそれらは、そもそも重回帰分析ができない。まずは、信頼性の高いデータが集められるのかどうかを見極めることが重要だ。
これまで見てきた通り重回帰分析で注意したいポイントは、そもそものデータに関することが多い。重回帰分析を行う際は、事前にデータの正確性や目的変数と説明変数の関係が正しくなっているのかを十分に検討しておく必要がある。
重回帰分析を活用して事業の成功率を高めよう
重回帰分析の考え方や実際の計算プロセスは非常に難しいが、少しでも知識があれば今後の戦略で活用できる可能性がある。単なる思いつきよりも、根拠のある事業計画ならば取引先を説得しやすい。事業の成功率を高めるためにも、ビジネスに重回帰分析を取り入れてみてはどうだろうか。
重回帰分析に関するよくある質問
Q.重回帰分析の具体例は?
A.「新規開店した飲食店の売上予測」「アパート経営における家賃相場の予測」といった2つの具体例を紹介する。
【新規開店した飲食店の売上予測】
・説明変数:店舗面積・スタッフ数・メニュー内容・駅からの距離・駐車場の有無
・目的変数:売上高
【アパート経営における家賃相場の予測】
・説明変数:駅からの距離・部屋面積、設備の充実度合い、築年数
・目的変数:家賃の金額
説明変数や目的変数を上記のように設定して周辺地域の情報を収集し、重回帰分析を行うことで目的変数を導き出せる。
Q.重回帰分析で何がわかる?
A.重回帰分析を行うことで「各説明変数が目的変数にどのように影響しているか」を具体的な数値で把握できるようになる。例えばマーケティングの場においては、費用対効果を具体的に示すことができるだろう。また経営戦略では、根拠として具体的な数値データを出せる点は大きなメリットだ。
Q.回帰分析と重回帰分析の違いは?
A.両者の違いは、説明変数の数にある。回帰分析は、目的変数の影響度を分析するための説明変数はひとつでよい。一方、重回帰分析の場合、説明変数は複数ある。
Q.重回帰分析の進め方は?
A.飲食店の売上予測を例に、重回帰分析のやり方を5つのステップで紹介する。
ステップ1.成果を左右する要因を考える
ステップ2.重回帰式を求める意義を検討する
ステップ3.重回帰式を求める
ステップ4.重回帰式の精度を確認する
ステップ5.結果を予測する
ステップ1では、説明変数をできる限り多く探し出すことが必要だ。ステップ2では、説明変数と目的変数の相関関係があるかを確認して重回帰式を求める意義を検討する。例えば「店舗の面積が広いほど1ヵ月の売上額が大きい」「最寄り駅から近いほど売上額が大きい」などの相関関係が認められれば、重回帰式を求める意義はあるとみなす。
ステップ3で重回帰式を求める際は、分析用のソフトウェアを用いるといいだろう。さらにステップ4で精度を確認する際は「重相関係数」と「寄与率」を求める。最後に結果を確認して売上高を予測しよう。
事業承継・M&Aをご検討中の経営者さまへ
THE OWNERでは、経営や事業承継・M&Aの相談も承っております。まずは経営の悩み相談からでも構いません。20万部突破の書籍『鬼速PDCA』のメソッドを持つZUUのコンサルタントが事業承継・M&Aも含めて、経営戦略設計のお手伝いをいたします。
M&Aも視野に入れることで経営戦略の幅も大きく広がります。まずはお気軽にお問い合わせください。
【経営相談にTHE OWNERが選ばれる理由】
・M&A相談だけでなく、資金調達や組織改善など、広く経営の相談だけでも可能!
・年間成約実績783件のギネス記録を持つ日本M&Aセンターの厳選担当者に会える!
・『鬼速PDCA』を用いて創業5年で上場を達成した経営戦略を知れる!