반응형
분산이란?
확률론과 통계학에서 어떤 확률변수의 분산(分散, 영어: variance, 변량 )은 그 확률변수가 기댓값으로부터 얼마나 떨어진 곳에 분포하는지를 가늠하는 숫자이다. 기댓값은 확률변수의 위치를 나타내고 분산은 그것이 얼마나 넓게 퍼져 있는지를 나타낸다. (출처 : 위키백과)
위에 보다싶이 평균에서의 오차를 저장한 rc_sd 를 이용하여 sum((rc_sd)^2/length(rc_sd))으로 수식 계산한 결과와 R 함수에서 제공하는 분산 함수 var()의 결과 104.5831 / 107.0742 로 미세한 차이가 나는 것을 확인할 수 있습니다. 왜 이러한 분산의 계산에서 수식 계산과 var 함수 계산에서 오차가 나는 이유는?
바로, 분산을 구하기 위해 사용하는 식에서 분모를 n으로 사용하지만, R 함수가 구한 분산의 분모는 n이 아닌 n-1(표본의 개수 -1)이기 때문에 수식 계산과 var 함수 계산에서 오차가 납니다.
그렇기 때문에 동일한 결과 값을 갖기 해서는 수식의 계산에서 sum((rc_sd)^2/length(rc_sd)) 를 sum((rc_sd)^2/(length(rc_sd)-1)) 으로 수정해서 계산하며 위의 이미지와 같이 var() 함수를 이용한 분산 값과 동일한 값을 가지는 것을 볼 수 있다.
반응형
'IT' 카테고리의 다른 글
[C언어/유닉스] 알파벳을 소문자 ‘a’부터 순서대로 한 줄로 표시하는 함수 작성 (0) | 2020.12.10 |
---|---|
[C언어/유닉스] putchar 함수 설명 및 구현 (0) | 2020.12.10 |
그래프 그려주는 사이트, 수식 적으면 그래프로 표현해주는 사이트 (0) | 2020.07.15 |
[유니티] 특정 태그 오브젝트 찾아오기 / 스크립트로 컴포넌트 추가/제거 / 두 오브젝트 사이의 거리 구하기 / 오브젝트 색상 변경하기 (0) | 2020.05.10 |
[ 웹 프로그래밍 / jsp / eclipse ] session 장바구니 기능 구현 (0) | 2020.04.27 |
댓글