MLS-C01#3(exploratory-analysis)
マーケティング部門は、年齢と購入金額の関係性を確認したいと考えています。両変数とも数値ですが、購入金額は外れ値の影響で歪んでおり、線形ではなく単調な関係が成立しているか調べたいです。最も適切な相関係数はどれですか。
正解:B
正解の根拠
スピアマンの順位相関は値そのものではなく順位を用いるため外れ値に頑健で、非線形でも単調であれば相関を捉えられます。年齢と購入金額のような順序的傾向の評価に適しています。
| 係数 | 関係 | 外れ値耐性 |
|---|---|---|
| Pearson | 線形 | 低 |
| Spearman | 単調 | 高 |
| Kendall τ | 順序一致 | 高 |
不正解の理由
- A: ピアソンは線形性と正規性を前提とし、外れ値で値が大きく揺らぎ信頼性が下がります。
- C: コサイン類似度はベクトル方向の評価で、変数間の相関係数とは目的が異なります。
- D: Cramér の V はカテゴリ同士の関連指標で、数値変数の相関には用いません。

コメント