아래는 400명의 신용카드 고객에 대한 신용카드와 관련된 변수들이 포함된 Credit 데이터를 분석하기 위해 산점도와 피어슨 상관계수를 활용하였다. 다음 설명 중 가장 적절하지 않은 것은?
보기
선택지 1
Limit와 Rating 간에는 강한 선형관계가 있다.
선택지 2
Income의 분포는 오른쪽 꼬리가 긴 분포를 가진다.
선택지 3
Balance는 Income과 가장 높은 상관관계를 보인다.
선택지 4
Age와 Balance 사이에는 유의미한 상관관계가 관찰되지 않는다.
정답
3
해설
상관 패널플롯에서 Balance는 Limit·Rating과 약 0.86의 매우 높은 양의 상관을 보이지만, Income과는 약 0.46으로 상대적으로 낮아 “Balance가 Income과 가장 높은 상관관계를 보인다”는 설명은 잘못이다. 반면, Limit와 Rating의 피어슨 상관계수는 1.00으로 매우 강한 선형관계를 가지며, Income은 오른쪽 꼬리가 긴 우측 비대칭 분포를 보인다. 한편 Age와 Balance의 상관계수는 0.00으로 두 변수 사이에는 유의미한 선형 상관관계가 거의 없다고 볼 수 있다.