ABOUT ME

-

Today
-
Yesterday
-
Total
-
  • [통계학]스터디파이 통계학 입문 3주차
    공부 2019. 5. 25. 20:58

    통계적 추정을 하는 이유는 무엇인가? 

    어느 집단(모집단)의 특징을 알고 싶어서 조사를 진행하는 경우, 현실에서는 시간과 비용의 제약이 있기 때문에 그 집단의 모든 것을 조사하기란 매우 힘들다. 그래서 집단의 특징을 파악하기 위해 모집단 전체를 조사하는 것이 아니라, 표본(샘플)으로 일부만 뽑아서 조사한다.

    예로, 대선 선거를 보자. 여론조사에서는 5천만 국민을 조사하지 않는다. 5천만명 중의 500-1,000명 정도의 표본의 데이터를 뽑아서 대선후보의 지지율을 신뢰도 몇%로 추론 한다.

     

    점추정과 구간추정의 차이

    • 추정에는 크게 두 가지 추정이 있다. 모집단의 값의 지점을 예측하는 점 추정과 특정한 구간을 설정하는 구간 추정이 있다.
    • 점추정은 모수를 하나의 값으로 추정하는 방법이다. 추정 값이 실제 값이 근삿값은 될 수 있으나, 정확히 같은 값이 되기는 힘들다.
    • 이런 한계를 극복하고자 나온것이 구간 추정이다. 구간 추정은 모수를 최소값과 최댓값의 범위로 추정하는 방법이다. 신뢰구간이 대표적인 구간측정 중의 하나이다. 모수가 어느 범위안에 있는지 확률적으로 보여주는 방법이다.
    • 예를 들어, 우리나라 30세 남성 키의 평균을 알고 싶을때, 점추정은 175cm다 라고 추정을 하는 것이고, 구간 추정은 170cm보다 크고 180cm보다 작은 확률이 95%다 라고 추정 하는 것이다.

     

    독립변수와 종속변수

    • 독립변수(dependent variable) : 종속변수에 영향을 주는 변수로 독립변수를 변화시키면서 종속변수가 어떻게 변하는지를 분석해 독립변수와 종속변수의 관계를 밝히게 된다.
    • 종속변수(independent variable) : 연구나 분석의 대상이 되는 변수로 독립변수에 영향을 받아서 변하는 변수이다.
    • 예로, 광고비(X)가 늘어날수록 매출액(Y)이 늘어난다고 할 때, 독립변수는 광고비, 종속변수는 매출액이라고 할 수 있다.

     

    최소자승법의 원리

    회귀식을 추정할 때, 실제값과 추정값의 차이인 잔차를 제곱한 합, 즉 잔차제곱합이 최소가 되도록 회귀식을 추정하는 방법을 말한다. 여기에서 회귀식을 추정한다는 것은 결국 각 독립변수의 계수값을 정해준다는 것과 같다.

    단순히 잔차의 합이 최소가 되도록 하는 것이 아니라 잔차제곱합이 최소가 되도록 하는 것은 잔차가 커짐에 대한 패널티의 가중치를 다르게 한다는 의미이다. 즉, 잔차가 클 수록 제곱을 통해 값이 빠르게 늘어나게 해서 모델에 잔차가 커짐에 대한 패널티를 크게 부과하기 위함이다.

     

    각 독립변수의 계수와 유의성(P-value)의 의미

    회귀모형을 추정할 때 ‘각 독립변수의 계수가 각각 0이다’라는 것을 H0 귀무가설로 설정하고 추정 한다. 따라서 각 독립변수의 계수의 유의성을 검정한다는 것은 각 계수가 0이 아닌 다른 값을 가지는 것이 통계적으로 유의한지를 본다는 의미이다. 만약 유의하지 않다면 그 계수의 값은 0이 되어 해당 변수는 실질적으로 회귀 모형에서 제외되게 된다. 회귀분석을 통해 얻은 회귀 모형을 확정하기 전에, 이렇게 각 독립변수별로 계수의 유의성을 검정해보고 유의한 변수만 남겨야 한다.

     

    단순회귀분석과 다중회귀분석의 차이

    • 회귀분석 : 원인과 결과를 분석하는 방법
    • 단순회귀분석 : 종속변수에 영향을 미치는 독립변수가 한 개인 경우에 실시하는 회귀분석
    • ㄴ 광고비(독립변수)는 매출액(종속변수)에 영향을 얼마나 미치는가? 단, 매출액에 영향을 미치는 요소가 광고비만 있을 때만 해당함.
    • 다중회귀분석 : 종속변수에 영향을 미치는 독립변수가 여러 개인 경우에 실시하는 회귀분석.
    • ㄴ 스마트폰의 외관,편리함,유용성(독립변수)등은 스마트폰에 대한 만족감(종속변수)에 영향을 얼마나 미치는가?

    댓글

Designed by Tistory.