:: 게시판
:: 이전 게시판
|
- PGR21 관련된 질문 및 건의는 [건의 게시판]을 이용바랍니다.
- (2013년 3월 이전) 오래된 질문글은 [이전 질문 게시판]에 있습니다. 통합 규정을 준수해 주십시오. (2015.12.25.)
통합규정 1.3 이용안내 인용"Pgr은 '명문화된 삭제규정'이 반드시 필요하지 않은 분을 환영합니다.법 없이도 사는 사람, 남에게 상처를 주지 않으면서 같이 이야기 나눌 수 있는 분이면 좋겠습니다."
24/05/31 12:31
/// 궁금해서 챗gpt한테 물어봤습니다. ///
변수를 백분위로 변환하는 과정과 피어슨 적률상관계수에 미치는 영향을 이해하기 위해 다음 내용을 참고해 주세요. ### 백분위 변환이란? 변수를 백분위로 변환한다는 것은 각 데이터 값이 전체 데이터 집합에서 차지하는 상대적 위치를 0에서 100 사이의 값으로 변환하는 것을 의미합니다. 예를 들어, 어떤 데이터 값이 전체 데이터에서 75%의 값보다 작다면, 해당 값은 75번째 백분위에 위치하게 됩니다. 이는 원래 값 자체를 사용하는 것이 아니라, 해당 값이 데이터 집합에서 어디에 위치하는지를 상대적으로 나타내는 것입니다. ### 피어슨 적률상관계수(Pearson correlation coefficient) 피어슨 적률상관계수는 두 변수 간의 선형 관계를 측정하는 지표입니다. 그 값은 -1에서 1 사이의 값을 가지며, 1에 가까울수록 양의 선형 관계, -1에 가까울수록 음의 선형 관계를 나타내고, 0에 가까울수록 선형 관계가 없음을 의미합니다. 이 상관계수는 다음과 같이 계산됩니다: [ r = frac{sum (X_i - overline{X})(Y_i - overline{Y})}{sqrt{sum (X_i - overline{X})^2 sum (Y_i - overline{Y})^2}} ] ### 백분위 변환과 피어슨 상관계수의 관계 피어슨 상관계수는 각 변수의 평균과 표준편차를 기반으로 계산되므로, 변수의 상대적 순위나 위치가 아닌 원래 값 자체에 의존합니다. 따라서 변수를 백분위로 변환하면 원래 변수의 순위만 남고 값 자체가 달라지기 때문에, 피어슨 상관계수는 달라질 수 있습니다. - **변환 전 피어슨 상관계수**: 원래 변수들의 값을 사용하여 계산됩니다. - **백분위 변환 후 피어슨 상관계수**: 변환된 변수들의 백분위 값을 사용하여 계산됩니다. 이 경우 각 값은 0에서 100 사이의 값이 되며, 이 값들은 원래 값들의 순위만 반영합니다. 변수를 백분위로 변환하게 되면 피어슨 상관계수가 달라지는 이유는 다음과 같습니다: 1. **변환의 비선형성**: 백분위 변환은 원래 값들의 순위를 기준으로 하므로, 원래 값들 간의 차이를 그대로 유지하지 않습니다. 2. **상관계수 계산 방법의 변화**: 피어슨 상관계수는 평균과 표준편차를 기반으로 하여 계산되지만, 백분위로 변환된 값들은 이러한 통계적 특성이 달라집니다. 따라서 "X와 Y를 백분위로 변환하더라도 변환된 두 변수간의 피어슨 적률상관계수는 변하지 않는다"는 잘못된 진술입니다. 백분위 변환은 변수의 상대적 순위만을 반영하므로, 변환 후 피어슨 상관계수는 원래 값들로 계산된 상관계수와 다를 수 있습니다. 해설에서 언급한 "피어슨 적률상관계수는 지수이기 때문에 수치에 변화가 생긴다"는 표현은 다소 부정확하지만, 요점은 변환으로 인해 원래의 데이터 값 분포가 달라지고, 그로 인해 상관계수가 변할 수 있다는 점입니다.
|