Excelで相関係数を見つける方法

Excelで相関係数を見つける方法

最も単純で最も一般的なものの1つ 統計Excel計算 あなたが作るかもしれない相関関係です。これは単純な統計ですが、2つの変数が関連しているかどうかを確認する場合に非常に役立ちます。適切なコマンドを知っていれば、Excelで相関係数を見つけるのは非常に簡単です。





相関関係とは何かを見て、それが提供する情報のアイデアを提供します。次に、2つの方法と相関を調べるための優れたグラフを使用してExcelで相関係数を見つけることに移ります。最後に、線形回帰について簡単に紹介します。これは、相関関係を調べるときに役立つ可能性のあるもう1つの統計関数です。





相関とは何ですか?

始める前に、相関の定義について説明しましょう。これは、物事がどのように関連しているかを示す簡単な尺度です。相関関係がまったくない2つの変数を見てみましょう。





これらの2つの変数(1つはX軸にプロットされ、もう1つはY軸にプロットされます)は完全にランダムであり、密接に関連していません。

ただし、以下の2つの変数には相関関係があります。



一般に、一方の変数が上昇すると、もう一方の変数も上昇します。それは相関関係です。 (逆の場合もあることに注意してください。一方が上昇し、もう一方が下降した場合、それは負の相関関係になります。)

相関係数を理解する

相関係数は、2つの変数がどの程度関連しているかを示します。係数は-1から1の間です。相関係数0は、2つの変数間に相関がまったくないことを意味します。これは、2セットの乱数がある場合に取得する必要があるものです。





係数-1は、完全な負の相関があることを意味します。一方の変数が増加すると、もう一方の変数は比例して減少します。係数1は完全な正の相関関係です。一方の変数が増加すると、もう一方の変数も比例して増加します。

それらの間の任意の数はスケールを表します。たとえば、.5の相関は、中程度の正の相関です。





下の図でわかるように、相関は線形関係のみを探します。 2つの変数は、別の方法で強く関連していても、相関係数がゼロである可能性があります。

画像クレジット:DenisBoigelot / ウィキメディアコモンズ

CORRELを使用してExcelで相関係数を見つける方法

Excelには相関のための組み込み関数があります。 CORREL関数の構文は非常に単純です。

=CORREL(array1, array2)

array1は最初の数値グループであり、array2は2番目のグループです。 Excelは数値を吐き出します、そしてそれはあなたの相関係数です。例を見てみましょう。

このスプレッドシートには、モデルと年式、およびそれらの値を含む車のリストがあります。 CORREL関数を使用して、モデルの年と値が関連しているかどうかを確認しました。

非常に弱い正の相関があります。年が上がるにつれて、車両の価値も上がります。しかし、それほどではありません。

相関関係のグラフ化

相関関係を実行しているときは、散布図を使用して、データセットがどのように関連しているかを視覚的に理解することをお勧めします。に移動 チャート>スキャッター データがどのように見えるかを確認するには:

このデータでは、車の年が値にあまり影響を与えていないことがわかります。あります わずか ポジティブな傾向ですが、それは弱いです。それがCORREL関数で見つけたものです。

散布図のもう1つの便利な要素は、次のようなトレンドラインです。

トレンドラインは、散布図で相関関係を明確にしたい場合に役立ちます。 Windowsでは、をクリックします グラフツール>デザイン>グラフ要素の追加 選択します トレンドライン 。 Macの場合は、次の場所に移動する必要があります。 チャートレイアウト また チャートデザイン 、Excelのエディションによって異なります。

そして、私たちのチェックを忘れないでください Excelで優れたグラフを作成するためのガイド 調査結果を提示する前に!

複数の変数をデータ分析ツールパックと相関させる

多数の異なる数値のセットがあり、それらの間の相関関係を見つけたい場合は、各組み合わせでCORREL関数を実行する必要があります。ただし、Data Analysis Toolpakを使用すると、いくつかのデータセットを選択して、相関関係がどこにあるかを確認できます。

データ分析ツールパックをお持ちかどうかわかりませんか?私たちをチェックしてください 基本のウォークスルー ダウンロードしてコツをつかむ。

写真の背景を変更する方法

Toolpakを起動するには、に移動します。 データ>データ分析 。選択肢のリストが表示されます。

選択する 相関 ヒット わかった

表示されたウィンドウで、ですべてのデータセットを選択します 入力範囲 ボックスをクリックし、結果を配置する場所をExcelに指示します。

ヒットしたときに得られるものは次のとおりです わかった

上の画像では、4つの異なるデータセット(年、世界人口、および2セットの乱数)で相関を実行しています。

すべてのデータセットとそれ自体との相関は1です。年と世界の人口には非常に強い相関がありますが、乱数で予想されるように、他の場所では非常に弱い相関があります。

ポートフォワーディングはゲームに対して何をしますか

Excelでの相関と線形回帰

相関は単純な尺度です。2つの変数はどの程度密接に関連していますか。ただし、この測定値には予測値や原因値はありません。 2つの変数が相関しているからといって、一方が他方に変化を引き起こしているとは限りません。 これは、相関関係について理解するための重要なことです。

因果関係について主張することに興味がある場合は、線形回帰を使用する必要があります。 Data AnalysisToolpakからこれにアクセスすることもできます。 (この記事では、線形回帰の仕組みの詳細については説明しませんが、基本を説明できる無料の統計リソースがたくさんあります。)

データ分析ツールパックを開き、を選択します 回帰 、をクリックします わかった

XとYの範囲を入力します(X値は説明変数であり、Y値は予測しようとしている値です)。次に、出力を送信する場所を選択し、をクリックします わかった また。

ここで注目したい数値は、説明変数のp値です。

0.05未満の場合は、X変数の変更がY変数の変更を引き起こしているという強い主張があります。上の画像では、年が世界人口の重要な予測因子であることを示しています。

線形回帰は、複数の値を調べることができるという点でも役立ちます。ここでは、回帰を使用して、年と人口が原油の価格の重要な予測因子であるかどうかを確認しました。

両方のp値は0.05未満であるため、年と世界の人口の両方が原油の価格の重要な予測因子であると結論付けることができます。 (ただし、X変数間の強い相関は、独自の問題を引き起こす可能性があります。)

繰り返しますが、これは線形回帰の非常に単純な説明です。因果関係に興味がある場合は、いくつかの統計チュートリアルを読む必要があります。

しかし、より多くの統計情報を探している場合は、単純な相関関係を超える方法がわかりました。

Excelからより良いデータを取得する

Excelの基本的な統計関数を理解すると、データからより多くの有用な情報を取得するのに役立ちます。相関関係は単純な尺度ですが、スプレッドシートの数値について主張しようとしているときに大きな助けになる可能性があります。

もちろん、他にももっと複雑な対策をたくさん実行できます。しかし、統計に慣れていない限り、 基本から始める

Excelの相関機能を定期的に使用していますか?他にどのような統計関数について知りたいですか?

共有 共有 つぶやき Eメール FBIがHiveランサムウェアに対して警告を発した理由は次のとおりです

FBIは、特に厄介なランサムウェアについて警告を発しました。これが、Hiveランサムウェアに特に注意する必要がある理由です。

次を読む
関連トピック
  • 生産性
  • マイクロソフトエクセル
著者について その後、オルブライト(506件の記事が公開されました)

ダンは、企業が需要とリードを生み出すのを支援するコンテンツ戦略およびマーケティングコンサルタントです。彼はまた、dannalbright.comで戦略とコンテンツマーケティングについてブログを書いています。

ダン・オルブライトのその他の作品

ニュースレターを購読する

ニュースレターに参加して、技術的なヒント、レビュー、無料の電子書籍、限定セールを入手してください。

購読するにはここをクリックしてください