統計学上の解析手法である重回帰分析をご存じだろうか。統計と聞いただけで拒否反応を起こすかもしれない。しかし、重回帰分析は戦略立案の場面で非常に有用だ。今回は、重回帰分析の概要をはじめ、目的や手順、メリット・デメリットなどをわかりやすく説明する。
目次
重回帰分析とは
重回帰分析とは、複数の要因が特定の結果にどのように影響しているかを理解するための統計的手法である。マーケティングの場面では、この手法を用いることで企業の売上や利益などの成果に対してさまざまな要素(例えば、広告支出、市場の動向、製品価格など)がどの程度影響しているかを数値的に明らかにすることが可能だ。
さらにこの分析を通じて各要因が目的とする成果に対してプラスの影響を与えているのか、マイナスの影響を与えているのか、またその影響の大きさを定量的に評価することができる。これにより経営上の意思決定において「どの要素に重点を置くべきか」「資源をどのように配分すべきか」などより根拠のある判断が可能になる。
例えば広告キャンペーンの効果を分析するとしよう。重回帰分析を用いることで、どの広告媒体が売上に最も効果的か、または顧客の購買行動にどのように影響しているかを詳細に理解することができる。このように重回帰分析は、複雑なビジネス環境において、より精緻な戦略立案と効果的な意思決定を支援する強力なツールだ。
重回帰分析は、回帰分析の一種である。では、回帰分析とはどのような分析手法なのだろうか。
そもそも回帰分析とは
回帰分析とは、結果を示す数値(目的変数)と要因になる数値(説明変数)の関係を明らかにする統計手法だ。
多くの企業では、事業にデータ分析を取り込みさまざまな指針を決定している。ただしひとくちにデータ分析といっても手法はさまざまだ。そのなかでも重要なデータ分析のひとつが回帰分析である。データは、多くの場合数値などの値として把握されることが多い。
回帰分析は「影響を受ける数値」「影響を与える数値」の2つの関係性に注目する分析方法である。具体的には、結果を示す数値である「目的変数」と要因になる数値である「説明変数」の関係を明らかにしていく。
例えば来店者数がどのように売上高に影響を与えているのかを分析したい場合、回帰分析では売上高が「目的変数」、来店者数が「説明変数」となる。回帰分析が多くの企業で取り入れられている理由は、数値で示すことができる根拠のある推論を立てることができるからである。
根拠のある推論が立てられるため、より具体的に将来を予測したり目標や計画を立てたりすることが可能だ。ただしあくまで推論のため、要因になる「説明変数」の見落としや間違いがあった場合は、正しい結果が出ない可能性もある。なお回帰分析は、説明変数の数の違いなどで大別すると「単回帰分析」と「重回帰分析」の2種類に分類される。
重回帰分析と単回帰分析との違い
単回帰分析とは、ひとつの要因から結果を分析・予測する統計的手法だ。例えば、広告費と売上の相関関係を求める際に用いる。「広告費を○○円にしたら売上が△△円になった」というような実績データを集め、回帰係数を探す。そしてグラフにして「y=ax+b」といった回帰式を求める。
「y」は目的変数、「x」は説明変数、「a」を回帰係数という。広告費が説明変数、売上が目的変数とするなら、この式のxにいくつか数字を当てはめることで、広告費に対する売上がわかる。
一方、重回帰分析は、複数の説明変数を含む回帰分析である。以下は、広告費・店舗面積・スタッフ数という複数の説明変数と売上という目的変数から成る重回帰分析の例だ。
単回帰分析と重回帰分析では、検証する内容や結果が異なるため、どちらの手法を使って回帰分析をするのかが重要となる。
ただし実際のビジネスでは、売上を決める要素はひとつではない。飲食店なら立地や駅からの距離、価格帯、天気などの要素が売上に影響する。結果と複数の要因の因果関係がわかれば将来を予測できるというわけだ。
そのため、ビジネスの場面では、2つ以上の要素を用いる重回帰分析のほうが、予測精度を高めるのに適切だろう。基本的な構造は変わらないが、重回帰分析は単回帰分析より説明変数が増えるので、式がその分長くなる。重回帰分析の式は「y=a_1 x_1+a_2 x_2+a_3 x_3+a_4 x_4…a_p x_p+b_0」だ。分析の流れは、単回帰分析も重回帰分析もほぼ同じである。
重回帰分析をするためには、上記の式で計算したり専用のソフトやExcelを使ったりして求める必要がある。またある程度の理解度がないと結果の解釈やそこから導く予想ができないケースもあるため、注意が必要だ。
重回帰分析の目的2つ
重回帰分析の目的は、主に2つある。それぞれの目的は、ビジネスや研究において非常に重要な役割を果たすため、どちらもしっかりと把握しておきたい。
目的1.影響の大きい要因を特定する
要因分析とは、複数ある変数のなかから、目的変数(例えば売上、顧客満足度など)に大きく影響を与える重要な変数を特定する手法である。
例えば、ある企業が売上向上を目指している場合、重回帰分析を用いて広告支出や販売価格、市場のトレンド、季節変動など複数の変数のなかから売上に最も大きな影響を与える要因を特定するとしよう。この場合、重回帰分析を行うことで企業は効果的な資源配分や戦略立案を行い、改善の優先順位を決定しやすくなる。
また広告支出が売上に大きな影響を与えていることが判明すれば、広告戦略の見直しや予算の再配分を行う根拠になるだろう。
目的2. 未来の値を予測する
予測分析とは、要因分析をもとに重回帰式を求めて未来の値を予測する手法だ。重回帰式に値を入れると、予測分析の結果が得られる。予測の精度を高めるには、すべての変数を盛り込むのではなく、複数の変数から影響の大きい変数を選ぶことが重要だ。
予測分析とは、要因分析をもとに構築された重回帰式を用いて、未来の値(例えば、次四半期の売上、来年の市場シェアなど)を予測する手法だ。重回帰式に現在のデータや予測したい条件の値を入れることで、将来の状況を予測できる。
予測の精度を高めるためには、すべての変数を盛り込むのではなく、実際に影響力のある重要な変数を選択することが重要だ。例えば不動産価格の予測を行う際には、立地や物件の大きさ、築年数、近隣の開発状況など価格に影響を与えると考えられる主要な変数を選択し、これらを用いて未来の価格動向を予測する。このような予測は、戦略的な意思決定やリスク管理において非常に有用だ。
重回帰分析のメリット
重回帰分析のメリットとしては、主に以下の2点が挙げられる。
より現実に即した分析ができる
重回帰分析は、複数の変数を同時に考慮できるため、現実の複雑な状況をより正確に反映した分析が可能だ。例えば不動産の価格を予測する際に面積だけでなく立地や築年数、周辺の設備など複数の要因を同時に考慮することで、より現実に即した価格予測が行え、単一の要因だけでは見落としがちな相関関係や影響度を把握できる。
費用対効果の高いマーケティングにつなげられる
重回帰分析を用いることで、マーケティング活動の各要素が売上にどの程度影響しているかを定量的に評価できるようになる。これにより、どのマーケティング活動が最も効果的かを判断し限られた予算をより効果的に配分することが可能だ。
例えばオンライン広告の投資が売上増加に最も寄与していることが分析から明らかになれば、その領域への予算配分を増やすことで、全体のマーケティング効果を最大化できる。
重回帰分析のデメリット
重回帰分析は、メリットだけではなくデメリットもある。重回帰分析をより効果的に活用するために、デメリットも把握しておこう。
多重共線性により分析が困難になるケースも
重回帰分析では、分析に用いる変数間で高い相関がある場合、正確な結果を得ることが困難になることがある。例えば製品の品質と価格が互いに強く関連している場合、これらの変数を同時に分析すると、どちらが売上により大きな影響を与えているのかを正確に判断しにくくなる。この問題は、分析の信頼性を低下させる原因となり得るだろう。
概念や計算が複雑になりがち
重回帰分析は、単回帰分析に比べて概念が複雑かつ計算が高度である。そのため分析を正確に行うには、統計学の知識や専門的なソフトウェアが必要だ。例えば企業が市場調査データを分析する際、複数の消費者特性と購買行動の関係を分析するには、高度な統計的手法とソフトウェアの理解が求められる。これは、特に統計学に精通していない人にとっては、分析の障壁となりかねない。
重回帰分析の具体例
・飲食店
飲食店は、売上高の大小により店舗の経営状態が大きく変わってくるのが特徴だ。そのため飲食店の経営をするうえで重要なのが「売上がいくらになるのか」を予測することである。飲食店では、さまざまな要因が売上の結果に影響を与える。具体的な要因としては、店舗の面積やスタッフ数、メニュー内容、駅からの距離、駐車場の有無などが挙げられるだろう。
重回帰分析では、店舗の面積やスタッフ数、メニュー内容、駅からの距離、駐車場の有無などの要因が「説明変数」、売上高が「目的変数」となる。重回帰分析を活用すれば、新規店の各要因から将来の売上の予測が可能だ。
・アパート経営
アパート経営では、家賃収入が売上となるため「家賃をいくらにすればよいか」が重要だ。なぜなら家賃の金額が適正でないと空室リスクを負うからである。家賃の金額が決まる要因は、駅に近いかどうかや部屋の広さ、設備の充実度合い、築年数などさまざまだ。重回帰分析では、駅に近いかどうかや部屋の広さや設備、築年数などの要因が「説明変数」、家賃の金額が「目的変数」となる。
重回帰分析以外の主な多変量解析
重回帰分析以外にも、多変量解析にはさまざまな種類がある。ここでは、主な手法を分析の目的別にまとめた。
それぞれの手法について簡単に紹介していく。
数量化Ⅰ類
複数の説明変数(カテゴリーデータ)から目的変数を量的変数として予測する分析手法で、重回帰分析と似ている。両者の違いは、重回帰分析は説明変数が数量データ(量的変数)だが、数量化Ⅰ類は、説明変数がカテゴリーデータ(質的変数)である点だ。
数量化Ⅰ類は「説明変数の各カテゴリーが目的変数にどのように影響しているか」について両方の変数から関係式を導き出して明らかにする。例えば性別や飲酒・喫煙の有無などから特定の疾病に罹患する確率を予測するといった手法だ。
判別分析
数量化Ⅰ類とは逆で複数の量的変数から質的変数を予測する手法だ。最終的には、1か0かの判別を行う。例えば自社オンラインショップのアクセスログに残る訪問者の性別・年齢・来訪回数などから商品を購入する可能性の高い見込み客を抽出する場合は、判別分析が適している。
ロジスティック回帰分析
予測に使用される多変量解析のひとつ。「量的変数から質的変数を予測する」という点では、判別分析と似ている。ロジスティック回帰分析の大きな特徴は、目的変数が1となる確率を予測する点だ。目的変数は、2値の結果が起こる確率を示す。
※2値:試験の合格・不合格や、見込み客の契約・非契約など答えが2つしかない値のこと
数量化Ⅱ類
判別分析と同じように1か0かのグループ分けをする手法だが、説明変数も目的変数も質的変数になる点が違う。性別や飲酒・喫煙の有無から特定の疾病に罹患する・しないの予測をする場合などに用いられる。
以降は、要約に用いられる多変量解析である。
主成分分析
主成分分析は、複数の量的変数を説明変数として集約し、主成分を作成する分析手法だ。例えば顧客満足度の調査を行う際、商品の品質・価格・デザイン・接客サービスなどの各項目の満足度を調査して集約することで商品の顧客満足度を算出できる。この分析を行う過程で「どの項目が最も顧客満足度向上に影響しているか」についても確認することが可能だ。
因子分析
複数の説明変数に影響を与えている共通因子を探り出すための分析手法だ。例えば購入者のアンケート結果を分析して「なぜ商品を購入したのか」という隠れた気持ち・潜在的な意思などを探り出すのに用いられる。
クラスター分析
ある集団のなかから似たものを集約してクラスターを作成し対象を分類する手法。ブランドの分類や消費者のセグメンテーションなどに利用される。
数量化Ⅲ類
主成分分析と似ている分析方法で、複数の説明変数(質的変数)から少数の変数へと要約する。乱した少数の変数は「潜在変数」と呼ぶ。顧客アンケートから、自社ブランドのポジショニングを分類する場合などに用いられる。
コレスポンデンス分析
数量化Ⅲ類では複数の説明変数に質的変数を用いたが、コレスポンデンス分析では量的な説明変数から少数の変数へと要約する。クロス票の集計結果をわかりやすくグラフ化するには、コレスポンデンス分析を用いるとよい。
重回帰分析のやり方
これから飲食店を新しく出店するとして、新規店の売上を予測したいとする。このケースを想定しながら、重回帰分析のやり方を考えてみよう。
ステップ1.成果を左右する要因を考える
店舗の売上高に影響しそうな要因(説明変数)を考える。売上高を増やすのに重要で、既存店のデータを活用できる要素を抽出する。飲食店の事例で要因を挙げるとすれば下記の通りだ。
・商圏人口
・競合店舗数
・店舗面積
・最寄駅からの距離
・座席数
・従業員数
・メニュー数
・客単価
・利益率
・広告費
・クレーム数
ステップ2.重回帰式を求める意義を検討する
説明変数と目的変数の点グラフを描いて検討する。仮に目的変数を1ヵ月の売上額、説明変数を既存店舗の店舗面積、最寄駅からの距離だとしよう。グラフにした点に過度なバラツキがなく、相関関係が認められるなら重回帰式を求める意義がある。例えば、「店舗の面積が広いほど1か月の売上額が大きい」「最寄駅から近いほど売上額が大きい」などの相関関係だ。
ステップ3.重回帰式を求める
重回帰式を求めるときは、最小二乗法を使って複数の回帰係数(a_1 、a_2など)を計算するが、かなり面倒だ。そこで、分析用のソフトウェアを使う方法もある。例えば、無料の「統計分析フリーソフトR」、有料の「JMP」「SPSS」などだ。候補となる説明変数を加えたり減らしたりしながら、データの精度を高めるために最適な組み合わせを探る。
なお、説明変数は多すぎても少なすぎても良い分析結果が得られないので、注意したい。
ステップ4.重回帰式の精度を確認する
重回帰式を求めても精度が低ければ、正しく予測できない。精度を確認するときは「重相関係数」と「寄与率」を求める。重相関係数とは、回帰式の精度(グラフの点と回帰式の一致率)を表す指標だ。実際には、実測値と予測値の相関関係を見ていく。そして、重相関係数を二乗した値が寄与率(決定係数)だ。寄与率が取りうる値は0から1までとなる。
回帰式の精度が高いほど1に近づき、そうでないほど0に近くなる。精度の目安としては0.5以上と見ておくとよい。なお重回帰分析では、寄与率に関して注意すべきことがある。説明変数の数が多いと、説明変数の影響度に関係なく、値が1に近くなってしまうのだ。そのため重回帰分析では、自由度調整済み寄与率を求めて判定することが多い。
さらに、重回帰式のそれぞれの回帰係数が適切かどうか、統計に用いたデータが客観的に見て信頼できるかどうかを確認する。
ステップ5.結果を予測する
最後に新規店舗の売上予測を行う。信頼できる重回帰式に新規店舗の店舗面積、最寄駅からの距離などの数字を当てはめ、売上の結果を確認する。
重回帰分析を活用できる場面2つ
重回帰分析は要因と結果を定式化できるので、出店や販売の効果を測定しやすい。そのため、売上予測やプロモーション戦略策定といったマーケティングの現場でも用いられる。
活用場面1.マーケティング
重回帰分析は、店舗の売上を予測する際に用いられる。予測に用いる要素には、接客や品揃えなども選ばれる。ただし、接客や品揃えといった要素は数値化しにくい。こういった要素は調査でスコアリングを行うことが一般的だ。
活用場面2.営業予測
重回帰分析を用いると、数値的な根拠にもとづいて営業予測を立てられる。例えば、営業訪問回数や値引き率などの要素で戦略を数値化し、取引額を目的変数に設定すれば、戦略が変化した場合の結果について予測できる。
Excelを利用した重回帰分析
重回帰分析を自力で行うことは難しいため、専用のソフトを使って重回帰分析をするほうが良いだろう。しかし専用のソフトを使う場合は、コストの問題も出てくる。実は、簡単な重回帰分析であれば専用のソフトを使わなくてもExcelを利用して行うことができる。ここからは、Excelを利用した重回帰分析の方法を解説していく。Excelを利用した重回帰分析の一般的な手順は、以下のようになる。
1.事前準備
Excelでは、分析に使う数値とExcelを用意すれば簡単な重回帰分析を行うことができる。Excelは、あくまで重回帰分析をするためのツールにすぎない。どのような要因と数値を重回帰分析で使うのかによって検証結果が異なるため、事前にしっかりと検討しておこう。
2.Excelに各データの数値を入力する
分析に使う数値とExcelが用意できたらExcelに各データの数値を入力していく。通常A列に分類を入力し、B列に目的変数、C列以降に説明変数を入力する。例えば店舗ごとの売上高について重回帰分析をする場合、各列には以下のデータを入力していく。
・A列:店舗名(店舗A、店舗Bなど)
・B列:売上高の数値
・C列以降:店舗面積、座席数、客単価などの各説明変数の数値
3.データ分析の選択
Excelに各データの数値の入力が終わったら次はデータ分析だ。Excelのデータ分析は、メニューバーの「データ」タブから「データ分析」を選択する。(Excelのバージョンによっては、メニューバーの「ツール」タブから「データ分析」を選択)「データ分析」を選択するとさまざまな分析名が表示されるのでそのなかから「回帰分析」を選択する。
4.分析範囲(変数)の指定
「データ分析」から「回帰分析」を選択するとYとXの範囲を指定する画面が出てくる。
・入力Y範囲
目的変数(B列)の範囲を指定。例えばB列の1~15行目に数値が入力されている場合は、1~15行目を指定する。
・入力X範囲
説明変数(C列以降)の範囲を指定。例えばC列とD列に数値が入力されている場合は、C列とD列の数値が入力されている範囲すべてを指定する。
店舗面積、座席数などの変数の名称をデータ範囲に含めて指定する場合は「ラベル」にチェックを入れる。分析範囲(変数)の指定をし「OK」をクリックすればExcelの別シートに重回帰分析の結果が出力される。
5.分析結果の確認
Excelの別シートに重回帰分析の結果が出力されたら内容を確認しよう。出力された内容は「回帰統計」と「分散分析表」として表示される。
・回帰統計
簡単にいうと分析の信頼度を表している。例えば回帰統計にある「重相関R」は、1に近いほど信頼度の高い分析モデルであることを意味しているのだ。また「重決定R2」も1に近いほど説明変数の信頼度が高い(説明できる割合が大きい)。
・分散分析表
簡単にいうと分析の結果を表している。例えば「係数」は、各変数の影響力を表す。係数が大きいほど影響力も大きくなる。「t値」も影響の大きさを表しておりt値が大きければ大きいほど目的変数に与える影響力が大きい。一般的に2を超えるt値は、目的変数に何らかの影響を与えていることを示している。
一方「P値」が表しているのは、指標の関係性だ。一般的にP値が0.05未満のときは、説明変数が目的変数に関係がある可能性が高く逆に0.05以上の場合は、関係がある可能性は低くなる。
このように、Excelを使えば、簡単に重回帰分析ができる。ただし分析結果は、多くの項目と数値で表示されるため、それぞれが何を示しているのかを把握することが必要だ。Excelを使って重回帰分析をする場合でも重回帰分析の知識は必須となるので、注意したい。
重回帰分析で注意したいポイント
重回帰分析は、事業のさまざまな事項について予測や計画を立てることができる。そのためビジネスでとても役立つ分析方法だ。しかし重回帰分析をするうえで注意すべき点も多い。重回帰分析で注意したいポイントには、次のようなものがある。
1.説明変数の数
重回帰分析をするうえで注意すべきポイントのひとつが「説明変数の数」だ。実は、重回帰分析では、使用する説明変数の数が多すぎても少なすぎてもいけない。より正確な分析結果を得ようとつい多くの数の説明変数を用いがちだが、説明変数の数が多いからといってより正確な分析結果が出るわけではないのだ。
説明変数の数が多すぎるとかえって説明変数同士が邪魔をし、正確な分析結果を阻害する可能性がある。また説明変数の数が少なすぎても同様に正確な分析結果が出ない。なぜなら説明変数の数が少なすぎると分析に必要な情報が不足するからである。重回帰分析を適切に行うためにどれぐらいの説明変数の数が必要なのかは、ケースバイケースだ。
ひとつのケースにいくつかのパターンで分析してみるのもよいだろう。
2.お互いに関連性の強い説明変数が含まれている
重回帰分析をより正確に行うためには、説明変数にあまり関連性がないほうがよい。なぜなら説明変数は、同じ目的変数に対する要因のため、どうしても似た内容のものになってしまうことがあるからだ。ただしお互いに関連性の強い説明変数が含まれる場合は、大きなひとつの要素が強く分析結果に影響を与えているのと同じことになる。
傾きのある分析結果となってしまうため、それは正しい結果とはいえない。重回帰分析する場合は、お互いに関連性の強い説明変数は、できるだけ省くようにしよう。
3.目的変数と説明変数の関係が正しくないものになっている
重回帰分析をする際に注意しなければならないのが、「目的変数と説明変数の関係が本当に正しいのか」ということだ。例えば説明変数がほかの説明変数の要素になっていることも多くある。いわば説明変数が2階建てのようになっていたり複雑に絡み合っていたりする状態だ。目的変数に対する直接的な説明変数になっていないため、正しい分析結果が出ない。
またひとつだけ偶発的な特殊な説明変数が混ざっている場合も正しい分析結果がないため、注意が必要だ。
4.目的変数に誤りがある
重回帰分析では、説明変数だけでなく目的変数にも注意が必要である。何を目的変数にしたらよいのかがあやふやな状態で説明変数を集めて重回帰分析をしても当然正しい分析結果は期待できない。また分析する目的変数がほかの目的変数の要因になっていることも多くある。例えば目的変数Aを分析しようとしているが「目的変数Aは目的変数Bの説明変数」といった場合だ。
この場合、本当に分析しなければならないのは、目的変数Bである。いくら目的変数Aを分析しても今後の事業などの予想をする際に意味をなさない結果となってしまうだろう。このように重回帰分析をする際は、目的変数が本当に分析すべき成果なのかどうかをしっかりと検討することが必要だ。
5.信頼性の高いデータを集められるかどうかに注意する
正しく重回帰分析をするためには、信頼性の高いデータ(数値)が必要である。データの精度が低い場合は、正しい分析結果が出ない。なかには、数値化が難しいものもあるかもしれない。しかしそれらは、そもそも重回帰分析ができない。まずは、信頼性の高いデータが集められるのかどうかを見極めることが重要だ。
これまで見てきた通り重回帰分析で注意したいポイントは、そもそものデータに関することが多い。重回帰分析を行う際は、事前にデータの正確性や目的変数と説明変数の関係が正しくなっているのかを十分に検討しておく必要がある。
重回帰分析を活用して事業の成功率を高めよう
重回帰分析の考え方や実際の計算プロセスは非常に難しいが、少しでも知識があれば今後の戦略で活用できる可能性がある。単なる思いつきよりも、根拠のある事業計画ならば取引先を説得しやすい。事業の成功率を高めるためにも、ビジネスに重回帰分析を取り入れてみてはどうだろうか。
重回帰分析に関するよくある質問
Q.重回帰分析の具体例は?
A.「新規開店した飲食店の売上予測」「アパート経営における家賃相場の予測」といった2つの具体例を紹介する。
【新規開店した飲食店の売上予測】
・説明変数:店舗面積・スタッフ数・メニュー内容・駅からの距離・駐車場の有無
・目的変数:売上高
【アパート経営における家賃相場の予測】
・説明変数:駅からの距離・部屋面積、設備の充実度合い、築年数
・目的変数:家賃の金額
説明変数や目的変数を上記のように設定して周辺地域の情報を収集し、重回帰分析を行うことで目的変数を導き出せる。
Q.重回帰分析で何がわかる?
A.重回帰分析を行うことで「各説明変数が目的変数にどのように影響しているか」を具体的な数値で把握できるようになる。例えばマーケティングの場においては、費用対効果を具体的に示すことができるだろう。また経営戦略では、根拠として具体的な数値データを出せる点は大きなメリットだ。
Q.回帰分析と重回帰分析の違いは?
A.両者の違いは、説明変数の数にある。回帰分析は、目的変数の影響度を分析するための説明変数はひとつでよい。一方、重回帰分析の場合、説明変数は複数ある。
Q.重回帰分析の進め方は?
A.飲食店の売上予測を例に、重回帰分析のやり方を5つのステップで紹介する。
ステップ1.成果を左右する要因を考える
ステップ2.重回帰式を求める意義を検討する
ステップ3.重回帰式を求める
ステップ4.重回帰式の精度を確認する
ステップ5.結果を予測する
ステップ1では、説明変数をできる限り多く探し出すことが必要だ。ステップ2では、説明変数と目的変数の相関関係があるかを確認して重回帰式を求める意義を検討する。例えば「店舗の面積が広いほど1ヵ月の売上額が大きい」「最寄り駅から近いほど売上額が大きい」などの相関関係が認められれば、重回帰式を求める意義はあるとみなす。
ステップ3で重回帰式を求める際は、分析用のソフトウェアを用いるといいだろう。さらにステップ4で精度を確認する際は「重相関係数」と「寄与率」を求める。最後に結果を確認して売上高を予測しよう。