결정계수 상관계수 - gyeoljeong-gyesu sang-gwangyesu

1. R square (결정계수)

- 표본 회귀선이 관측치를 얼마나 잘 설명하는지 측정하는 척도

1) R square 구하기

결국 R square는 종속 변수에서 독립 변수로 설명 가능한 영역을 나타냄

2) R square 특징

- 음의 값을 가질 수 없음. 0 <= R square <=1

- 1에 가까울수록 모든 i에 대해 Yi_hat에 근사함을 의미,

반대로 0에 가까울수록 설명변수와 종속 변수 간의 관계가 약해짐을 의미(독립변수의 기울기가 0이 됨 : b2=0)

2. Adjusted R square

- R square는 독립 변수를 추가하는 것만으로도 수치가 증가함. 따라서 독립 변수 증가를 감안한 R square 가 필요

- 독립 변수 증가는 곧 자유도의 감소를 의미하므로 자유도를 R square 계산에 사용

- R square와 Adjusted R square 값의 차이가 크다면 의미 없는 독립 변수가 많다고 할 수 있음.

3. R (상관계수)

- 두 변수간의 상관관계를 측정하는 척도

1) R 구하기

- 결정계수 R square에 제곱근으로 구할 수 있음

상관계수 R 구하기

2) R의 특징

- -1<= R <= 1

- 독립변수와 종속변수가 서로 독립이면 R=0(역은 성립하지 않는다.)

- 두 변수의 선형 관계 척도일 뿐, 인과관계를 의미하지 않는다.

- R은 선형관계, 선형 종속관계만 측정할 수 있다.

독립 변수와 종속 변수가 2차 함수를 그릴 때,

서로 상관관계가 있는 것처럼 보이지만 선형 종속관계만 측정하는 R 상관계수는 0으로 측정됨.

통계학에서 결정계수(決定係數, 영어: coefficient of determination)는 추정한 선형 모형이 주어진 자료에 적합한 정도를 재는 척도이다. 반응 변수의 변동량 중에서 적용한 모형으로 설명가능한 부분의 비율을 가리킨다. 결정계수의 통상적인 기호는 표본에서

이 그리고 모집단에서는 이 사용된다.

일반적으로 모형의 설명력으로 해석되지만 모형에 설명 변수가 들어갈수록 증가하기 때문에 해석에 주의해야 한다. 이러한 문제를 해결하기 위해 조정 결정 계수가 제시되었다.

결정계수의 값은 0에서 1사이에 있으며, 종속변인과 독립변인 사이에 상관관계가 높을수록 1에 가까워진다. 즉, 결정계수가 0에 가까운 값을 가지는 회귀모형은 유용성이 낮은 반면, 결정계수의 값이 클수록 회귀모형의 유용성이 높다고 할 수 있다.[1]

피어슨 상관 계수의 결정계수[편집]

피어슨 상관 계수(Pearson Correlation Coefficient ,PCC) 의 결정계수는 이다.

따라서

따라서 피어슨 상관 계수가 사이의 값을 가지므로 은 0~1 사이의 값을 가지게된다.

참고 문헌[편집]

  1. 김석우, 《기초통계학》, 학지사, 2007, p.127

외부 링크[편집]

  • Weisstein, Eric Wolfgang. “Correlation coefficient”. 《Wolfram MathWorld》 (영어). Wolfram Research.
  • “Correlation coefficient”. 《Encyclopedia of Mathematics》 (영어). Springer-Verlag. 2001. ISBN 978-1-55608-010-4.

Toplist

최신 우편물

태그