상관관계(Correlation)는 두 변수 간의 연관성을 나타내는 통계적 개념. 이는 두 변수 사이의 관계를 측정하는 방법으로, 한 변수가 변할 때, 다른 변수가 어떻게 변하는지를 나타냄.
인과관계(Caustion)는 한 변수(원인)가 다른 변수(결과)에 직접적인(확실한) 영향을 미치는 관계
상관관계는 결과에 원인이 될 수도 있고 아닐수도 있다. 반면, 인과관계는 필연적으로 결과에 영향을 준다. 확률성을 따지는 데이터 분석에서 자주 언급되는 상관관계는 가능성의 여지를 준다. 이를 통해 여러 가설을 만들고 실험할 수 있다. 어쩌면 말장난일 수 있겠다. '그럴수도 있고, 아닐수도 있음. 하지만 그럴 가능성이 조금 있네?' 쯤으로 생각하지 않을까? 확률이란게 재밌으면서 얄밉다.
'공부 > 데이터 분석' 카테고리의 다른 글
인사이트 (0) | 2025.03.10 |
---|---|
데이터 분석을 위한 5단계 절차 (0) | 2025.03.10 |