説明
この関数は、一連の数値ペアの相関係数を計算するために使用されます。相関係数は数値ペア間の関連強度を表し、その範囲は [-1,1] です。ここで、0 は無相関を示し、0 より小さい値は負の相関を、0 より大きい値は正の相関を示します。この関数は集計または分析関数として使用できます。
説明
- 分析関数として使用する場合、
OVER句を使用してウィンドウを定義し、計算を行う必要があります。これは一連の行セットに対して計算を実行し、複数の値を返します。 - 集計関数として使用する場合、この関数は一連の行セットに対して集計計算を行い、結果として1つの値しか返せません。この場合、
OVER句を追加する必要はありません。
構文
CORR(expr1, expr2) [ OVER (analytic_clause) ]
パラメータの説明
| パラメータ | 説明 |
|---|---|
| expr1 | 最初のパラメータを指定します。数値データ型に属するか、暗黙的に数値データ型に変換できる値です。 |
| expr2 | 2 番目のパラメータを指定します。数値データ型に属するか、暗黙的に数値データ型に変換できる値です。 |
| OVER | OVER 句を使用してウィンドウを定義し、計算を行います。詳細については、分析関数の説明を参照してください。 |
説明
- データベースは、最も高い数値優先順位を持つパラメータを特定し、他のパラメータをそのデータ型に暗黙的に変換して返します。
- パラメータ
expr1とexpr2の位置は、返される結果に影響しません。 - 返される結果の計算式は次のとおりです:
COVAR_POP(expr1, expr2) / (STDDEV_POP(expr1) * STDDEV_POP(expr2))。
戻り値の型
いずれかのパラメータが空または1行のデータしかない場合、NULL を返します。それ以外の場合は、NUMBER 型の値を返します。
例
テーブル tbl1 を作成し、データを挿入します。
obclient> CREATE TABLE tbl1(col1 INT,col2 varchar(10),col3 INT,col4 INT);
Query OK, 0 rows affected
obclient> INSERT INTO tbl1 VALUES(1,'A1',8,12),(1,'A2',10,15),(1,'A3',11,16),
(2,'B1',9,14),(2,'B2',10,15),(2,'B3',8,13),(2,'B4',11,16),(3,'C1',8,18),
(3,'C2',9,16),(3,'C3',10,15),(3,'C4',11,12),(3,'C5',12,10);
Query OK, 12 rows affected
Records: 12 Duplicates: 0 Warnings: 0
obclient> SELECT * FROM tbl1;
+------+------+------+------+
| COL1 | COL2 | COL3 | COL4 |
+------+------+------+------+
| 1 | A1 | 8 | 12 |
| 1 | A2 | 10 | 15 |
| 1 | A3 | 11 | 16 |
| 2 | B1 | 9 | 14 |
| 2 | B2 | 10 | 15 |
| 2 | B3 | 8 | 13 |
| 2 | B4 | 11 | 16 |
| 3 | C1 | 8 | 18 |
| 3 | C2 | 9 | 16 |
| 3 | C3 | 10 | 15 |
| 3 | C4 | 11 | 12 |
| 3 | C5 | 12 | 10 |
+------+------+------+------+
12 rows in set
集計関数の例
列 col3 のデータと列 col4 のデータの相関係数を計算します。
obclient> SELECT CORR(col3,col4) FROM tbl1;
+--------------------------------------------+
| CORR(COL3,COL4) |
+--------------------------------------------+
| -.2705008904002296868793073195758520224002 |
+--------------------------------------------+
1 row in set
分析関数の例
列 col1 でグループ化し、列 col3 のデータと列 col4 のデータの相関係数を計算します。
obclient> SELECT col1,col3,col4,CORR(col3,col4) OVER(PARTITION BY col1) "corr" FROM tbl1;
+------+------+------+--------------------------------------------+
| COL1 | COL3 | COL4 | corr |
+------+------+------+--------------------------------------------+
| 1 | 8 | 12 | .9958705948858223809835060513429288056548 |
| 1 | 10 | 15 | .9958705948858223809835060513429288056548 |
| 1 | 11 | 16 | .9958705948858223809835060513429288056548 |
| 2 | 9 | 14 | 1 |
| 2 | 10 | 15 | 1 |
| 2 | 8 | 13 | 1 |
| 2 | 11 | 16 | 1 |
| 3 | 8 | 18 | -.9901475429766743091532731291244706579003 |
| 3 | 9 | 16 | -.9901475429766743091532731291244706579003 |
| 3 | 10 | 15 | -.9901475429766743091532731291244706579003 |
| 3 | 11 | 12 | -.9901475429766743091532731291244706579003 |
| 3 | 12 | 10 | -.9901475429766743091532731291244706579003 |
+------+------+------+--------------------------------------------+
12 rows in set