-
[SQL] 윈도 함수 Window Function공부 2020. 10. 16. 01:23
분석할 때 정말 자주 사용 되는 윈도 함수! 그 중 특히 자주 쓰이는 종류들을 (내가 까먹지 않기 위해) 정리해두려 한다. 출처는 대부분 이다. 윈도 함수란? 테이블 내부에 '윈도'라고 부르는 범위를 정의하고 해당 범위 내부에 포함된 값을 특정 레코드에서 자유롭게 사용하려고 도입한 것. 다만 윈도 내부에서 특정 값을 참조하려면 해당 값이 위치를 명확하게 지정해야 한다. *윈도 함수는 over() 구문과 함께 쓰인다. over() : over 구문에 매개 변수를 지정하지 않으면 전체행에 집약 함수 적용 over(partition by 컬럼 이름) : 해당 컬럼 값을 기반으로 그룹화 하고 집약 함수 적용 over(order by 컬럼 이름) : 윈도 내부에 있는 데이터 순서 정의 ORDER BY 구문으로 테..
-
[통계학]스터디파이 통계학 입문 3주차공부 2019. 5. 25. 20:58
통계적 추정을 하는 이유는 무엇인가? 어느 집단(모집단)의 특징을 알고 싶어서 조사를 진행하는 경우, 현실에서는 시간과 비용의 제약이 있기 때문에 그 집단의 모든 것을 조사하기란 매우 힘들다. 그래서 집단의 특징을 파악하기 위해 모집단 전체를 조사하는 것이 아니라, 표본(샘플)으로 일부만 뽑아서 조사한다. 예로, 대선 선거를 보자. 여론조사에서는 5천만 국민을 조사하지 않는다. 5천만명 중의 500-1,000명 정도의 표본의 데이터를 뽑아서 대선후보의 지지율을 신뢰도 몇%로 추론 한다. 점추정과 구간추정의 차이 추정에는 크게 두 가지 추정이 있다. 모집단의 값의 지점을 예측하는 점 추정과 특정한 구간을 설정하는 구간 추정이 있다. 점추정은 모수를 하나의 값으로 추정하는 방법이다. 추정 값이 실제 값이 근..
-
[통계학]스터디파이 통계학 입문 2주차공부 2019. 5. 19. 18:00
랜덤 프로세스(Random Process)란 어떤 결과가 발생할 수 있을지 알고는 있지만, 어떤 결과가 발생할지를 알 수 없는 프로세스를 말한다. 예를 들어 동전 던지기, 주사위 던지기, 셔플 음악재생 등이 있다. 동전 던지기의 경우, 결과는 앞면 혹은 뒷면이지만, 동전을 던졌을 때, 그 결과가 무엇인지 알 수 없다. 주사위도 마찬가지이다. 셔플 음악재생은 내 음악 라이브러리에 있는 음악 리스트가 재생되지만 어떤 곡이 재생될지 알 수 없다. 앞면과 뒷면이 나올 확률이 각각 1/2인 동전을 5번 던졌는데 앞면이 4번, 뒷면이 1번 나왔다. 동전을 한번 더 던졌을 때, 앞면이 나올 확률 1/2이다. 동전 던지기에서 일전에 발생한 사건은 이후에 발생한 사건이 발생할 확률에 영향을 주지 않는다. 배반사건(Dis..
-
[통계학]스터디파이 통계학 입문 1주차공부 2019. 5. 12. 23:47
통계학이란 무엇인가? 통계학은 복잡한 사회 현상을 객관적, 수치적으로 이해하고 설명하며 예측까지 가능하게 하는 학문이다. 통계학에 기반한 의사 결정과 커뮤니케이션은 객관적이며, 설득력을 갖는다. 모집단 (population)과 샘플 (sample)의 차이 모집단(population)은 연구나 실험의 대상이 되는 그룹 전체를 의미한다. 샘플(표본, sample)은 모집단에서 임의로 혹은 무작위로 추출해서 만든 부분 집합으로 전체를 대표할 수 있는 대표성이 필요하다. 모집단의 규모가 클 경우, 경제적, 공간적, 시간적 이유로 전수 조사는 거의 불가능하고, 비효율적이기 때문에 모집단을 대표하는 샘플로 연구나 실험을 한다. 정량 변수 (quantitative)와 정성 변수 (qualitative)의 차이와 특징..