【SQL文法】相関を計算するCORR関数

SQL
※本ページにはプロモーションが含まれます
※本ページにはプロモーションが含まれます
スポンサーリンク

CORR関数はじめに

CORR関数は、2つの数値列の相関係数を計算するための関数です。

相関係数は、2つの変数間の関連性の強さや方向性を示す指標です。相関係数は通常、-1から1の範囲で表されます。

CORR関数について

CORR関数使用例

基本的な使用例は以下のようになります。

SELECT CORR(column1, column2) AS correlation 
FROM your_table

上記のコード例では、column1column2は相関を計算したい数値の列を示しています。
また、your_tableはデータが格納されているテーブル名です。

相関係数は、2つの変数間の関連性の強さや方向性を示す指標です。
相関係数は通常、-1から1の範囲で表され、以下のような性質を持ちます。

  • 1に近い場合: 正の強い相関があることを示します。一方の変数が増加すると、もう一方の変数も増加する傾向があります。
  • -1に近い場合: 負の強い相関があることを示します。一方の変数が増加すると、もう一方の変数は減少する傾向があります。
  • 0に近い場合: 相関が弱いかほとんどないことを示します。変数間の関連性はほとんど存在しないか、非線形の関係がある可能性があります。

もしプログラム学習でお困りでしたら、受講生に1人ずつ現役プロのパーソナルメンターがつく TechAcademy [テックアカデミー] のご活用をぜひご検討ください!

相関係数について

相関係数は、2つの変数間の関連性を数値で示す統計量です。具体的には、2つの変数がどれだけ同時に増減するか、あるいは逆に片方が増加するともう一方は減少するかを評価する指標です。

相関係数は以下のような特性を持ちます。

  1. 範囲: 相関係数は通常、-1から1の範囲に存在します。
    • 1に近い場合: 正の相関が強いことを示します。一方の変数が増加すると、他方の変数も増加する傾向があります。
    • -1に近い場合: 負の相関が強いことを示します。一方の変数が増加すると、他方の変数は減少する傾向があります。
    • 0に近い場合: 相関がほとんどないか弱いことを示します。変数間の関連性は限られたか、非線形の関係がある可能性があります。
  2. 方向性: 相関係数は変数間の関連性の方向を示します。正の相関の場合は、一方の変数が増加すると他方の変数も増加する傾向があります。負の相関の場合は、一方の変数が増加すると他方の変数は減少する傾向があります。
  3. 強さ: 相関係数の絶対値が1に近いほど、関連性が強いことを示します。0に近いほど、関連性が弱いかほとんど存在しないことを示します。

相関係数は2つの変数の線形関係を評価する指標であり、非線形の関係や外れ値の影響を受けやすいという制約もあります。また、相関関係があるからといって因果関係があるとは限らないことにも注意が必要です。因果関係を評価するためには、実験デザインや統計的手法の適切な使用が必要です。

散布図化をおこなって外れ値の確認や全体の傾きを確認することが
有用な手段と考えます!

その他の相関を計算するための関数

  • COVAR関数: 2つの数値列の共分散を計算します。
SELECT COVAR_POP(column1, column2) AS covariance 
FROM your_table
  • REGR関数: 線形回帰モデルのパラメータを計算します。
SELECT REGR_SLOPE(column1, column2) AS slope, REGR_INTERCEPT(column1, column2) AS intercept 
FROM your_table
  • STATS関数: 様々な統計情報を計算します。例えば、相関係数、共分散、回帰モデルのパラメータなどを一度に計算できます。
SELECT 
    STATS_CROSSTAB(column1, column2) AS crosstab, 
    STATS_CORR(column1, column2) AS correlation, 
    STATS_COVAR_POP(column1, column2) AS covariance, 
    STATS_REGR_SLOPE(column1, column2) AS slope, 
    STATS_REGR_INTERCEPT(column1, column2) AS intercept 
FROM your_table

CORR関数まとめ

以上が2つの数値列の相関係数を計算するための関数である、CORR関数の解説となります。

2つの変数間の関係を数値化したいときに有用となります。
因果関係や外れ値の確認など、ほかの関数や統計手法と組み合わせてご活用ください!

SQL文法関連記事

そのほか、SQL関連記事をこちらにまとめておりますのでご参考ください。
Coffee Tech Blog SQL関連記事

また、厳選された優良IT/Web系企業約260社からダイレクトスカウトを受け取ることができる

年収UP率93.8% / 平均年収UP額126万円のエンジニア転職サイト【転職ドラフト】 への登録もおススメです。
転職のみならず、ご自身の市場価値の査定にもつながるかと思います!

参考になれば幸いです☕

コメント

タイトルとURLをコピーしました